
지난 편에서 모델 성능 지표를 꼼꼼히 살펴봤습니다.
모델이 충분히 똑똑해졌다면 이제 고객이 쓰도록 해야겠죠?
하지만 여기서부터 또 다른 전쟁이 시작됩니다.
“배포(Deployment)”와 “운영(Serving)” 단계입니다.
모델 배포(Deployment) = 신제품 출시
모델 배포는 말 그대로 모델을 실제 환경에 올리는 과정입니다.
엔지니어들이 “배포 완료했습니다”라고 말할 때는
- 모델 파일을 서버에 올리고,
- API나 서비스가 이 모델을 호출할 수 있게 연결하고,
- 테스트를 거쳐 실제 유저 트래픽이 들어오도록 오픈한 상태를 말합니다.
비유하자면,
새로운 메뉴를 개발한 셰프가
- 전국 매장 주방에 레시피 공유하고
- 직원 교육하고
- 매장 메뉴판에 올리는 과정이 전부 끝난 상태라고 보면 됩니다.
모델 서빙(Serving) = 실시간 일하기
배포된 모델이 실제 요청을 받아서 결과를 내는 과정을 **서빙(Serving)**이라고 부릅니다.
여기서 중요한 건 속도와 안정성입니다.
- 속도: 고객이 챗봇에 질문했는데 5초 기다려야 답 나오면 UX 폭망
- 안정성: 서버가 다운되면 고객은 아예 답변을 못 받음 → 장애 보고서 작성
그래서 엔지니어들은 모델을 서빙하기 위해
- GPU/CPU 자원 최적화
- 배치 처리 vs 실시간 처리 전략 선택
- 로드 밸런싱
같은 작업을 합니다.
MLOps = AI 모델 운영 시스템
MLOps는 "Machine Learning" + "DevOps"의 합성어입니다.
즉, 모델을 배포·모니터링·재학습까지 전 과정을 자동화·관리하는 체계입니다.
주요 역할
- 모델 성능 실시간 모니터링 (정확도·응답 시간)
- 데이터 드리프트 감지 (패턴이 바뀌었는지 체크)
- 재학습 파이프라인 자동 실행
- 모델 버전 관리 (V1 → V2 → 롤백 등)
실무에서 자주 나오는 말:
“이번 주 데이터로 재학습 파이프라인 돌려야 해요”
→ 모델 성능이 최근에 떨어졌으니 자동으로 새로운 버전 만들겠다는 뜻.
배포/운영 단계에서 자주 생기는 문제
1️⃣ 성능 저하 (Model Drift)
모델은 점점 세상을 잊어갑니다.
새로운 고객 패턴, 새로운 상품, 새로운 스팸 형태가 등장하면 예전보다 예측력이 떨어집니다.
→ 정기적으로 재학습 필요.
2️⃣ 리소스 부족
트래픽이 몰리면 서버가 버벅입니다.
→ GPU 증설 or 모델 경량화 필요 (TensorRT, ONNX, Quantization)
3️⃣ 배포 버그
모델은 잘 만들어졌는데 API 연결 잘못해서 엉뚱한 결과 내는 경우도 있습니다.
→ 스테이징 환경에서 충분히 테스트해야 함.
4️⃣ 버전 관리 실패
"이거 지금 쓰는 모델이 v2인지 v3인지 모르겠어요" 사태 발생
→ MLOps 시스템에서 버전 태깅과 롤백 지원 필수
협업 시 실무 체크리스트
✅ 배포 전에 스테이징 환경에서 테스트 진행했는지
✅ 배포 후 실시간 모니터링 알림 설정되어 있는지
✅ 모델 버전 관리와 롤백 전략 준비되어 있는지
✅ 모델 응답 시간(SLA) 준수 가능한지
✅ 재학습 주기와 책임자 지정되어 있는지
협업 회의에서 바로 쓸 수 있는 질문
- "이번 배포 모델은 어떤 데이터로 학습됐나요?"
- "문제 생기면 이전 버전으로 롤백할 수 있나요?"
- "서빙 응답 속도는 몇 초인가요?"
- "운영 중 성능 저하 감지하면 자동 알림 오나요?"
이런 질문을 던지면 단순히 “배포 끝났습니다”에서 끝나지 않고,
실제 운영 안정성까지 챙길 수 있습니다.
오늘의 정리
- 배포 = 모델을 실제 서비스에 올리는 과정
- 서빙 = 배포된 모델이 실시간으로 요청 처리
- MLOps = 모델 성능 모니터링 + 자동 재학습 + 버전 관리 체계
- 운영 단계에서 성능이 떨어질 수 있으니 모니터링 & 재학습 필수
다음 편 예고
다음 편에서는 AI 프로젝트 협업 시 자주 나오는 최신 트렌드 키워드를 정리합니다.
파인튜닝(Fine-tuning), 프롬프트 엔지니어링(Prompt Engineering), LLMOps 같은
회의에서 난데없이 튀어나오는 용어들을 깔끔하게 정리해 드릴 거예요.
https://machineindeep.tistory.com/95
[AI 협업 용어정리 5편] 최신 AI 트렌드 키워드 – 이 말만 알면 회의에서 안 밀린다
AI 엔지니어랑 회의하다 보면 갑자기 알 수 없는 용어들이 튀어나옵니다."이번엔 파인튜닝으로 갈까요?""프롬프트 엔지니어링으로 해결 가능할 것 같은데요.""LLMOps 자동화 붙여야 할 것 같습니다
machineindeep.tistory.com
'ML | DL > 딥러닝은 무슨 일을 할 수 있을까?' 카테고리의 다른 글
| [AI 협업 용어정리 6편] AI 프로젝트 ROI – 돈 되는 AI, 안 되는 AI 구별법 (2) | 2025.09.16 |
|---|---|
| [AI 협업 용어정리 5편] 최신 AI 트렌드 키워드 – 이 말만 알면 회의에서 안 밀린다 (1) | 2025.09.16 |
| [AI 협업 용어정리 3편] 성능 지표 – 정확도 95%인데 왜 다들 불만이지? (1) | 2025.09.16 |
| [AI 협업 용어정리 2편] 데이터셋·전처리·라벨링 – AI 프로젝트가 데이터에 목숨 거는 이유 (2) | 2025.09.16 |
| [AI 협업 용어정리 1편] 모델(Model)과 학습(Training), 추론(Inference) – 이 말이 대체 뭔 뜻이야? (1) | 2025.09.16 |