AI 공부를 시작할 때 가장 먼저 마주치는 말이 "지도학습"과 "비지도학습"입니다.
저도 처음엔 이게 무슨 말인지 몰라서 ‘라벨이 뭔데? 라벨지 붙이라는 거야?’ 하고 웃었던 기억이 납니다. 😅
하지만 이 두 개념만 제대로 이해하면, 이후에 만나는 딥러닝 모델들이 왜 그렇게 학습되는지 감이 잡히고, 실제 프로젝트에서도 어떤 방식을 써야 할지 빠르게 판단할 수 있습니다.
왜 학습 방식부터 알아야 할까?

AI 모델은 결국 데이터로 배우는 존재입니다.
하지만 세상 모든 데이터가 친절하게 "정답 라벨"을 붙여놓고 기다려주진 않죠.
제가 첫 회사에서 맡았던 프로젝트가 그랬습니다. CCTV 영상 수만 장이 있었지만 라벨이 붙은 건 5%도 안 되는 상황.
이때 어떤 학습 방식을 선택하느냐에 따라 프로젝트의 성패가 갈렸습니다.
라벨이 있는 데이터라면 지도학습, 라벨이 전혀 없다면 비지도학습, 일부만 있다면 준지도학습, 아예 라벨 없이 가짜 라벨을 만들어 학습한다면 자기지도학습을 쓰게 됩니다.
오늘은 그중에서도 가장 기본이 되는 지도학습과 비지도학습을 차근차근 정리해 보겠습니다.
지도학습 완벽 이해
지도학습(Supervised Learning)은 정답이 있는 데이터로 학습하는 방식입니다.
입력(X)과 정답(Y)이 쌍으로 제공되고, 모델은 이를 통해 규칙을 학습합니다.
💡 지도학습 실생활 예시
- 스팸메일 분류 : 메일 본문 → 스팸/정상
- 고양이 vs 강아지 이미지 분류 : 이미지 → 라벨
- 은행 대출 승인 예측 : 고객 정보 → 승인 여부
제가 실제로 처음 만든 AI 모델도 지도학습이었습니다.
수천 장의 CCTV 이미지에 '사람 있음/없음' 라벨을 붙이고 학습시켰는데,
정확도가 90%를 넘었을 때의 성취감은 정말 짜릿했습니다.
장점은 결과가 직관적이고 정확도가 높으며, 예측한 결과를 해석하기 쉽다는 것입니다.
하지만 단점은 라벨링 비용이 많이 들고, 라벨이 편향되면 모델도 같이 편향될 위험이 있습니다.
비지도학습 완벽 이해
비지도학습(Unsupervised Learning)은 정답 없이 데이터에서 스스로 패턴을 찾는 방식입니다.
마치 정답이 없는 시험 문제를 풀면서 규칙을 찾아내는 느낌입니다.
비지도학습 실생활 예시
- 고객 세그먼트 군집화 : 비슷한 고객끼리 그룹화
- 이상치 탐지 : 정상 패턴만 학습 후 비정상 감지
- 추천 시스템 초기 단계 : 취향이 비슷한 사람들끼리 묶기
실무에서 제가 비지도학습을 쓴 대표 사례는 지하철 PSD(스크린도어) 이상 탐지 프로젝트였습니다.
고장 라벨이 거의 없었기 때문에 정상 패턴만 학습시켜두고,
그와 다른 패턴이 나타나면 이상 발생으로 경고를 띄우는 방식이었죠.
장점은 라벨이 없어도 학습할 수 있고, 데이터 탐색 단계에서 매우 유용하다는 점입니다.
하지만 단점은 결과 해석이 어렵고, "정답"이 없기 때문에 모델 평가가 까다롭습니다.
준지도학습 – 라벨링 비용 절감의 히든카드
준지도학습(Semi-Supervised Learning)은 일부 라벨 데이터 + 다량의 비라벨 데이터를 함께 학습시키는 방식입니다.
제가 의류 작업지시서 OCR 모델을 개발할 때 이 방식을 활용했는데,
라벨이 있는 데이터는 20%뿐이었지만, 비라벨 데이터를 같이 활용해 정확도를 15% 향상시킬 수 있었습니다.
라벨링 비용은 줄이면서 성능은 높일 수 있는 좋은 전략입니다.
자기지도학습 – 스스로 문제 만들고 풀기
자기지도학습(Self-Supervised Learning)은 데이터에서 스스로 가짜 문제를 만들어 학습합니다.
예를 들어 BERT는 문장에서 단어를 가리고 맞히는 문제를 풀며 학습하고,
SimCLR은 같은 이미지인지 아닌지를 맞히는 문제로 학습합니다.
이 방식은 대규모 데이터 사전학습에 매우 강력하고, 최근 GPT 같은 대형 언어 모델도 이 접근법으로 학습됩니다.
네 가지 학습 방식 한눈에 비교
- 지도학습: 라벨 필요, 정확도 높음, 해석 쉬움, 라벨링 비용 큼
- 비지도학습: 라벨 불필요, 패턴 탐색 유리, 결과 해석 어려움
- 준지도학습: 일부 라벨만 필요, 데이터 효율 높음, 구현 난이도 있음
- 자기지도학습: 라벨 없이 학습, 대규모 데이터 활용, 설계 난이도 높음
스토리로 다시 정리
지도학습은 선생님이 문제 풀고 정답을 알려주는 수업입니다.
비지도학습은 혼자 독학하며 규칙을 찾는 공부입니다.
준지도학습은 선생님이 예제 몇 개만 보여주고 나머지는 혼자 공부하는 느낌이고,
자기지도학습은 스스로 문제 만들고 풀면서 성장하는 자기주도 학습입니다.
결론 – 이제 AI 공부가 쉬워진다
오늘은 지도학습 vs 비지도학습을 확실히 구분하고,
준지도학습·자기지도학습까지 간단히 맛보기로 다뤄봤습니다.
이 네 가지 학습 패러다임만 이해해도 AI 공부가 한결 쉬워지고,
실무에서 어떤 접근법을 써야 할지 훨씬 빨리 판단할 수 있습니다.
다음 편에서는 Few-Shot / Transfer Learning을 다뤄,
데이터가 부족해도 모델이 똑똑해지는 비법을 알려드리겠습니다.
여러분은 어떤 학습 방식을 가장 많이 써보셨나요?
공부하면서 헷갈렸던 점, 실무에서 겪은 사례를 댓글로 공유해 주세요.👇
다음 편은 아래에 있습니다!
https://machineindeep.tistory.com/114
[2편] Few-Shot · One-Shot · Transfer Learning – 데이터가 부족해도 똑똑하게 배우는 법
AI 모델은 데이터가 많을수록 잘 배웁니다.하지만 현실에서 “라벨 데이터”는 늘 부족하죠. 🥲저도 현업에서 가장 많이 들었던 말이 “데이터 라벨링 예산이 없다”, “데이터 수집은 다음 분
machineindeep.tistory.com