반응형

전체 글 132

[5편] 강화학습 & RLHF – 알파고부터 ChatGPT까지, 스스로 배우는 AI의 비밀

AI가 스스로 배우고 성장할 수 있다면 어떨까요?2016년 알파고가 이세돌 9단을 이겼을 때,저도 TV 앞에서 “와, 진짜 AI가 사람을 이길 수도 있구나…” 하고 놀랐던 기억이 있습니다. 😲오늘은 AI가 스스로 시도·실패·보상을 통해 학습하는 방법,즉 강화학습(Reinforcement Learning)과 RLHF(Human Feedback)을 깊이 살펴봅니다. 지도·비지도와 뭐가 다를까? 지도학습은 정답 라벨이 있고,비지도학습은 라벨 없이 패턴을 찾습니다.강화학습은 정답조차 없습니다. 대신 보상(Reward)이 있습니다.AI는 행동을 시도하고 → 결과를 얻고 → 보상을 계산해 → 다음 행동을 더 잘하도록 학습합니다.마치 반려견이 간식을 먹기 위해 훈련하는 것과 비슷합니다. 🐶Reinforcement..

[4편] Multi-Task · Multi-Label · Curriculum Learning – 하나의 모델로 더 똑똑하게 학습시키기

AI 모델 하나로 여러 문제를 풀 수 있다면 얼마나 효율적일까요?저도 처음엔 태스크마다 모델을 따로 만들었는데,프로젝트가 커질수록 모델 개수가 늘어나고 유지보수가 지옥이 되더라고요. 😅오늘은 그 문제를 해결해 줄 세 가지 전략, 멀티 태스크 러닝, 멀티 라벨 러닝, 커리큘럼 러닝을 정리합니다. 왜 이 세 가지가 중요할까?현업에서는 한 모델이 한 가지만 잘하는 것보다여러 태스크를 동시에 잘하는 모델,여러 라벨을 동시에 예측하는 모델,더 똑똑하게 학습 순서를 설계한 모델이 훨씬 강력합니다.저는 실제로 영상 분석 프로젝트에서,사람 인식 → 자세 추정 → 행동 분류 모델을 각각 따로 학습시키다멀티 태스크로 통합한 경험이 있습니다.결과적으로 모델 수는 줄고 정확도는 올라가고 유지보수가 쉬워졌죠.Multi-T..

[3편] Domain Adaptation · Generalization · Continual Learning – 환경이 바뀌어도 끄떡없는 AI

AI 모델은 한 번 학습하면 끝일까요?아쉽게도 현실은 그렇지 않습니다. 😅저도 처음 만든 CCTV 이상행동 탐지 모델이 맑은 날에는 잘 작동하다가,비 오는 날 갑자기 성능이 반토막 난 경험이 있습니다.오늘은 이런 문제를 해결하기 위해 꼭 알아야 할 Domain Adaptation, Domain Generalization, Continual Learning을 정리해 드립니다. 데이터 분포 변화, 왜 문제일까? 머신러닝 모델은 학습한 데이터 분포에 최적화되어 있습니다.그런데 실무에서는 시간이 지나면카메라 교체 (화질·밝기 달라짐)환경 변화 (계절·날씨 변화)새로운 패턴 등장 (신규 제품, 새로운 사람 행동)같은 이유로 데이터 분포가 바뀌게 됩니다.이걸 해결하지 않으면 모델은 점점 현실과 멀어지고, 예측 정..

[2편] Few-Shot · One-Shot · Transfer Learning – 데이터가 부족해도 똑똑하게 배우는 법

AI 모델은 데이터가 많을수록 잘 배웁니다.하지만 현실에서 “라벨 데이터”는 늘 부족하죠. 🥲저도 현업에서 가장 많이 들었던 말이 “데이터 라벨링 예산이 없다”, “데이터 수집은 다음 분기에나 가능하다”였습니다.그래서 오늘은 적은 데이터로도 모델을 똑똑하게 만드는 방법을 알려드리려 합니다.데이터 부족은 왜 문제일까? 딥러닝 모델은 수천, 수만 장의 라벨 데이터를 먹여야 제대로 학습됩니다.하지만 실무에서는라벨링 비용이 너무 비싸거나데이터가 극도로 희귀하거나빠른 프로토타입이 필요한 상황같은 이유로 충분한 데이터를 확보하기 어렵습니다.저도 한 번은 CCTV에서 휠체어만 인식하는 모델을 만들 때, 라벨링된 휠체어 데이터는 500장밖에 없었습니다.그럼에도 불구하고 모델을 돌려야 했죠.이런 상황에서 Few-Sh..

[1편] 지도학습 vs 비지도학습 – 헷갈린다면 이 글 하나로 끝!

AI 공부를 시작할 때 가장 먼저 마주치는 말이 "지도학습"과 "비지도학습"입니다.저도 처음엔 이게 무슨 말인지 몰라서 ‘라벨이 뭔데? 라벨지 붙이라는 거야?’ 하고 웃었던 기억이 납니다. 😅하지만 이 두 개념만 제대로 이해하면, 이후에 만나는 딥러닝 모델들이 왜 그렇게 학습되는지 감이 잡히고, 실제 프로젝트에서도 어떤 방식을 써야 할지 빠르게 판단할 수 있습니다. 왜 학습 방식부터 알아야 할까? AI 모델은 결국 데이터로 배우는 존재입니다.하지만 세상 모든 데이터가 친절하게 "정답 라벨"을 붙여놓고 기다려주진 않죠.제가 첫 회사에서 맡았던 프로젝트가 그랬습니다. CCTV 영상 수만 장이 있었지만 라벨이 붙은 건 5%도 안 되는 상황.이때 어떤 학습 방식을 선택하느냐에 따라 프로젝트의 성패가 갈렸습니다..

아반떼 CN7 2025 인스퍼레이션 구매 후기 & 6개월 탑승기 (초보자 관점)

📌 목차구매 배경 & 계약 과정할인 & 혜택 정리외관 디자인 첫인상실내 인테리어 & 편의 사양실제 주행 후기 (도심 + 고속도로)아쉬운 점 & 단점총평 & 추천 대상 1. 구매 배경 & 계약 과정저는 올해 2월 말, 드디어 제 첫 차를 구매했습니다.차종은 현대 아반떼 CN7 2025 인스퍼레이션, 색상은 화이트(Atlas White), 시트는 베이지 컬러입니다.사실 색상 선택할 때도 고민을 많이 했는데, 결과적으로 흰색 + 베이지 조합은 정말 잘한 선택이었어요.화이트 컬러는 깔끔하고 세련돼 보여서 관리만 잘하면 오래도록 질리지 않을 것 같고,베이지 시트는 실내 분위기를 한층 밝고 고급스럽게 만들어줘서 탈 때마다 기분이 좋아집니다.계약 과정은 겟차(GETCHA)라는 앱을 통해 진행했습니다. 앱에서 현대자..

아무거나/일상 2025.09.17

사진으로 보는 아이유 딥슬립 베개 언박싱

📑 아이유 딥슬립 베개 개봉기 목차구매 배경주문 & 배송개봉기총평 🛒 구매 배경저는 이번에 현대카드 M몰에서 할인을 받아 56,900원에 아이유 딥슬립 베개를 구매했습니다.사실 이걸 사게 된 이유는 아주 단순했어요. 집에 있는 베개가 너무 낮고 작아서,아침마다 목이 뻐근하고 허리까지 아픈 상태였거든요.몇 번 베개를 높여보려고 수건을 접어 올려봤지만 그때뿐이었고,숙면은커녕 뒤척이다가 깨는 날이 많았습니다.그래서 결국 “제대로 된 베개 하나 사자!” 싶어서 알아보다가아이유 딥슬립 베개 후기가 좋아서 선택하게 되었습니다.그리고 이제 드디어 도착! 본격적으로 개봉기를 시작해볼게요. 🚚 주문 & 배송주문은 월요일 밤 늦게 했습니다. 사실 밤에 누워서 베개 때문에 목이 불편하다고 투덜대다가, 바로 폰으로 결..

아무거나/일상 2025.09.17

딥러닝은 이런 Task도 한다! – 8편: 강화학습 & 에이전트, 스스로 배우는 AI의 시대

지금까지는 AI가 데이터를 학습해 “답”을 내놓는 데 집중했죠.하지만 세상은 단순히 문제와 정답으로만 이루어지지 않았습니다.로봇은 스스로 움직여야 하고, 게임 AI는 전략을 세워야 하고,고객 상담 봇은 상황에 맞게 행동을 선택해야 합니다.이럴 때 필요한 게 바로 강화학습(Reinforcement Learning)과에이전트(Agent)입니다.1. 강화학습 – 시행착오로 배우는 AI강화학습은 “AI가 시행착오를 겪으면서 스스로 배우는 방법”입니다.사람이 일일이 정답을 알려주는 대신,AI가 어떤 행동을 하면 보상을 주고, 나쁜 행동엔 패널티를 줍니다.마치 강아지를 훈련시키듯 “잘했어!” 하며 칭찬하고,틀리면 “아니야” 하는 식으로 학습시킵니다.🎮 대표 사례알파고(AlphaGo): 바둑에서 세계 챔피언을 이긴..

딥러닝은 이런 Task도 한다! – 7편: 생성 AI, 이제 AI가 창작자가 되다

한때 AI는 사람의 질문에 ‘대답하는’ 수준에서 머물렀습니다.하지만 이제는 전혀 존재하지 않던 새로운 것들을 만들어내는 존재가 되었죠.그림을 그리고, 영상을 만들고, 음악을 작곡하고, 3D 모델까지 생성하는 시대가 왔습니다.이번 편에서는 생성(Generative) AI가 열어준 새로운 세상과,실제로 사람들이 현업에서 어떻게 활용하고 있는지를 자세히 살펴보겠습니다.이미지 생성 – 디자이너가 한 명 더 생긴 느낌이미지 생성은 생성 AI의 대표 주자입니다.처음에는 GAN(Generative Adversarial Network)이 등장해그림 같지 않은 이미지를 억지로 만들어내던 시절이 있었죠.요즘은 Diffusion 모델 덕분에실사 같은 품질의 이미지를 원하는 스타일로 뽑아낼 수 있습니다.현업에서는 이게 진짜 ..

딥러닝은 이런 Task도 한다! – 6편: 3D · Geometry · Depth, AI가 공간을 이해할 때 생기는 마법

사람은 태어나자마자 3D 세상에서 살기 시작합니다.앞뒤 거리감, 물체의 크기, 움직임의 방향을 자연스럽게 인지하죠.그런데 AI 모델은 원래 2D 데이터(평면 이미지)만 보고 학습하던 시절이 있었습니다.이제는 AI가 깊이(depth)와 기하학(geometry)까지 학습하면서진짜 세상을 이해할 수 있게 되었습니다.이번 편에서는 이 3D/Geometry/Depth 관련 Task들을 하나씩 소개합니다.1. Depth Estimation – 평면 이미지에서 깊이 뽑아내기깊이 추정은 카메라 한 대로 찍은 평면 사진에서“이 물체는 가깝고, 저 물체는 멀다”를 계산하는 기술입니다.이걸 잘하면 단순 사진이 아니라 3D 장면 복원이 가능해집니다.📌 활용 예시스마트폰 인물 사진 → 배경 블러 (가까운 사람만 선명하게)AR..

반응형