본문 바로가기
반응형
반응형

ML | DL24

반응형
[clustering] tslearn의 TimeSeriesKmeans 사용방법 클러스터링은 Unsupervised Learning으로 데이터들의 군집을 예측하는 것이 목적이다. 일반적으로 kmeans는 각 데이터 사이의 distance를 구해서 군집마다 center에 가장 가까운 데이터 끼리의 패턴을 찾는다. 하지만 시계열로 되어있는 데이터를 클러스터링 해버리면 시간에 따른 정보가 사라지기 때문에 다른 방법이 필요하다. 그래서 이번에 소개할 TimeSeriesKmeans는 시간에 따른 군집화가 가능하기 때문에 위의 문제를 해결할 수 있는 알고리즘이며, tslearn 라이브러리로 쉽게 사용이 가능하다. 1. 설치 해당 명령어로 tslearn을 설치할 수 있다. !pip install tslearn 2. 데이터 생성 32row 1column의 array를 50개 생성한다. import.. 2022. 3. 19.
강남대학교(KNU) 에브리타임 데이터 분석 2020년에 강남대 데이터사이언스 전공에서 졸업작품으로 진행했던 프로젝트 '강남대 에브리타임 데이터 분석' 프로젝트를 정리할겸 블로그에도 써보기로 했다.. 지금도 잘하지는 않지만 프로젝트 코드를 다시보니 답이없긴 하다 ㅋㅋ 변명을 하자면 그 당시에 나는 다른 전공에서 편입을 한거라 초보중에 초보였다.. 그래도 에브리타임 분석을 진행하시려는 분들에게 참고가 됐으면 하는 바램이다. 나는 강남대 에브리타임에서 '자유게시판' 그리고 '새내기게시판'을 크롤링해서 간단한 데이터분석을 진행하였고, 게시글을 각각 주제에 맞춰서 labeling을 한 후에 multi classification으로 주제를 예측하는 것이였다. * 참고로 크롤링 오래하면 에브리타임 측에서 차단을 먹인다. 코드는 여기있으니 참고하시길 https.. 2022. 3. 18.
BlazePose: On-device Real-time Body Pose tracking 리뷰 pose estimation 프로젝트를 진행하다 mediapipe라는 프레임워크를 알게되었다. 나같은 경우에는 여러 사람을 multi tracking 하는게 아닌 한 사람만 감지하는 single tracking 이 필요했고 mediapipe blazepose는 나의 프로젝트에 딱 맞는 모델이였다. 또한 대중적인 모델인 posenet보다 더욱 뛰어난 성능을 보여 인상적인 모델이여서 논문을 찾아보게 되었다.. Abstract 구글에서 인간 포즈 추정의 lightweight convolutional neural network architecture blazepose를 제시하였다. 모바일 디바이스에 대한 실시간 inference를 위해 제작된 모델이며 한 사람에 대한 33개의 keypoint를 추정한다. 해당 .. 2022. 3. 18.
Pycaret AutoML으로 ensemble 하는법 Kaggle이나 Dacon 같은 AI대회에 참여하다 보면 Ensemble 기법을 사용하여 점수를 끌어올려야 하는 상황이 발생한다. 이번에 소개할 라이브러리는 Pycaret AutoML 이다. 해당 라이브러리는 거의 모든 머신러닝 알고리즘을 사용하여 간편하게 Ensemble을 할 수 있다. Pycaret을 사용하기 위해 아래 라이브러리를 설치한다. !pip install pycaret[full] 그 다음 pycaret을 import 해준다. 만약 회귀로 진행할 경우 pycaret.regression으로 변경한다. from pycaret.classification import * 이제 데이터셋을 세팅해야 하는데 DataFrame 타입으로 input값을 주어야 한다. 나는 간단하게 주요 파라미터만 입력하였다... 2022. 3. 17.
반응형