사람은 태어나자마자 3D 세상에서 살기 시작합니다.
앞뒤 거리감, 물체의 크기, 움직임의 방향을 자연스럽게 인지하죠.
그런데 AI 모델은 원래 2D 데이터(평면 이미지)만 보고 학습하던 시절이 있었습니다.
이제는 AI가 깊이(depth)와 기하학(geometry)까지 학습하면서
진짜 세상을 이해할 수 있게 되었습니다.
이번 편에서는 이 3D/Geometry/Depth 관련 Task들을 하나씩 소개합니다.

1. Depth Estimation – 평면 이미지에서 깊이 뽑아내기
깊이 추정은 카메라 한 대로 찍은 평면 사진에서
“이 물체는 가깝고, 저 물체는 멀다”를 계산하는 기술입니다.
이걸 잘하면 단순 사진이 아니라 3D 장면 복원이 가능해집니다.
📌 활용 예시
- 스마트폰 인물 사진 → 배경 블러 (가까운 사람만 선명하게)
- AR 앱에서 가상 오브젝트를 실제 바닥에 놓기
- 자율주행차에서 보행자와 차량 거리 계산
예전에 Depth Estimation 모델을 실험하면서,
단순 사진을 넣었는데 앞에 있는 컵, 뒤에 있는 의자, 그 뒤 벽까지
깊이 지도가 층층이 만들어지는 걸 보고 신기했던 기억이 납니다.
2. 3D Pose Estimation – 사람 관절 좌표를 공간에서 예측하기
2D Pose Estimation은 평면 좌표만 알 수 있지만,
3D Pose Estimation은 실제 공간 좌표까지 계산합니다.
Azure Kinect 같은 깊이 카메라 여러 대를 써서
사람의 팔, 다리, 몸통이 어디 있는지
진짜 ‘공간상’ 위치로 뽑아내는 거죠.
🏋️ 활용 예시
- 재활 환자 운동 각도 측정
- 스포츠 선수 모션 분석
- AR/VR 모션 캡처
저는 예전에 재활 환자 프로젝트에서
3D Pose Estimation 모델을 개발했는데,
환자가 팔을 30도만 들어도 정확히 인식하고
“조금 더 들어올려야 합니다”라는 피드백을 줄 수 있었습니다.
사람의 움직임을 ‘숫자’로 보는 느낌이 정말 새로웠습니다.
3. 3D Reconstruction – 한 장면을 3D 모델로 복원하기
사진 여러 장이나 비디오를 입력으로 넣고
해당 장면의 3D 메쉬(mesh)나 포인트 클라우드(point cloud)를 생성합니다.
최근에는 NeRF(Neural Radiance Field) 같은 신기술 덕분에
아주 사실적인 3D 장면 재현이 가능해졌습니다.
💡 활용
- 부동산: 실제 집 내부를 3D 모델로 만들어 가상 투어
- 게임·메타버스: 현실 장소를 스캔해서 게임 맵으로 변환
- 문화재 보존: 유적지를 디지털 트윈으로 저장
4. SLAM (Simultaneous Localization and Mapping)
로봇이나 드론이 어디에 있는지 추적하면서
동시에 지도의 빈 부분을 채워가는 기술입니다.
AI가 주변을 스캔하면서 스스로 위치를 파악하고,
길을 잃지 않고 이동할 수 있도록 돕습니다.
🚗 활용
- 자율주행차의 실시간 위치 파악
- 로봇 청소기가 집 구조를 스스로 그려 청소 경로 최적화
- AR 글래스에서 공간 좌표 기준으로 오브젝트 배치
5. Point Cloud Processing & 3D Object Detection
라이다(LiDAR) 센서로 수집한 점 구름(point cloud) 데이터를 이용해
3D 공간에서 물체를 탐지하고 분류합니다.
단순히 "사람 있음"이 아니라
“사람이 여기 있고, 자동차는 저기 있고, 트럭은 뒤쪽에 있다”
라는 식으로 좌표까지 예측합니다.
📌 활용
- 자율주행: 주변 차량, 보행자, 장애물 인식
- 물류: 창고에서 상자 위치 파악
- 건설: 공사 현장 스캔, 자재 배치 모니터링
오늘의 정리
3D·Geometry·Depth Task는 AI에게 공간 감각을 부여합니다.
이제 AI는 평면 사진만 보는 게 아니라
“여기서 저기까지 얼마나 떨어졌는지”,
“사람 팔이 얼마나 올라갔는지”,
“로봇이 어디에 있는지”까지 계산할 수 있게 되었죠.
결국 이 기술들이 모여서 자율주행, 로봇팔, AR/VR,
디지털 트윈 같은 산업 혁신으로 이어지고 있습니다.
다음 편 예고
다음 7편에서는 생성(Generative) Task를 다룹니다.
이미지를 그리는 Diffusion 모델,
텍스트로 그림 그리기, 동영상 생성, 3D 모델 생성까지
창의력을 가진 AI의 세계를 보여드릴 예정입니다.
https://machineindeep.tistory.com/109
딥러닝은 이런 Task도 한다! – 7편: 생성 AI, 이제 AI가 창작자가 되다
한때 AI는 사람의 질문에 ‘대답하는’ 수준에서 머물렀습니다.하지만 이제는 전혀 존재하지 않던 새로운 것들을 만들어내는 존재가 되었죠.그림을 그리고, 영상을 만들고, 음악을 작곡하고, 3D
machineindeep.tistory.com
'ML | DL > 딥러닝은 무슨 일을 할 수 있을까?' 카테고리의 다른 글
| 딥러닝은 이런 Task도 한다! – 8편: 강화학습 & 에이전트, 스스로 배우는 AI의 시대 (2) | 2025.09.17 |
|---|---|
| 딥러닝은 이런 Task도 한다! – 7편: 생성 AI, 이제 AI가 창작자가 되다 (2) | 2025.09.17 |
| 딥러닝은 이런 Task도 한다! – 5편: 오디오 & 멀티모달, 이제 AI는 듣고 보고 말한다 (1) | 2025.09.17 |
| 딥러닝은 이런 Task도 한다! – 4편: 산업 & 이상 탐지 (1) | 2025.09.17 |
| 딥러닝은 이런 Task도 한다! – 3편: 사람 중심 Task (4) | 2025.09.17 |