반응형

autoML 2

[딥러닝의 위협 시리즈 3편] 데이터 라벨링·자료 정리 – AI가 가장 빨리 대체하는 직군

🗂️"이 영상에 사람이 있으면 1, 없으면 0으로 체크하세요."이런 데이터 라벨링 아르바이트 해보신 분 계신가요?한 장 한 장 이미지 라벨을 붙이고, 스프레드시트에 정리하는 일.저도 첫 회사에서 이걸 수천 장 하면서,'이거 언젠가는 AI가 할 일 아닐까?' 생각했었죠.이제 그 생각이 현실이 되고 있습니다.AI는 라벨링, 데이터 정리, 분류 같은 단순 작업을 점점 더 잘해내고 있고,사람이 해야 할 일은 점점 줄어들고 있습니다. 😮 왜 이 직군이 가장 먼저 대체될까?단순 데이터 라벨링과 자료 정리 업무는반복적이고 규칙 기반창의성이 거의 필요 없음품질 확인만으로 결과 평가 가능이 세 가지 조건을 모두 만족합니다.즉, AI가 학습하기 딱 좋은 업무입니다.특히 컴퓨터 비전에서는 Active Learning과 ..

Pycaret AutoML으로 ensemble 하는법

Kaggle이나 Dacon 같은 AI대회에 참여하다 보면 Ensemble 기법을 사용하여 점수를 끌어올려야 하는 상황이 발생한다. 이번에 소개할 라이브러리는 Pycaret AutoML 이다. 해당 라이브러리는 거의 모든 머신러닝 알고리즘을 사용하여 간편하게 Ensemble을 할 수 있다. Pycaret을 사용하기 위해 아래 라이브러리를 설치한다. !pip install pycaret[full] 그 다음 pycaret을 import 해준다. 만약 회귀로 진행할 경우 pycaret.regression으로 변경한다. from pycaret.classification import * 이제 데이터셋을 세팅해야 하는데 DataFrame 타입으로 input값을 주어야 한다. 나는 간단하게 주요 파라미터만 입력하였다...

반응형