ML | DL/딥러닝은 무슨 일을 할 수 있을까?

딥러닝은 이런 Task도 한다! – 7편: 생성 AI, 이제 AI가 창작자가 되다

Leeys 2025. 9. 17. 18:55
반응형

한때 AI는 사람의 질문에 ‘대답하는’ 수준에서 머물렀습니다.
하지만 이제는 전혀 존재하지 않던 새로운 것들을 만들어내는 존재가 되었죠.
그림을 그리고, 영상을 만들고, 음악을 작곡하고, 3D 모델까지 생성하는 시대가 왔습니다.
이번 편에서는 생성(Generative) AI가 열어준 새로운 세상과,
실제로 사람들이 현업에서 어떻게 활용하고 있는지를 자세히 살펴보겠습니다.


이미지 생성 – 디자이너가 한 명 더 생긴 느낌

이미지 생성은 생성 AI의 대표 주자입니다.
처음에는 GAN(Generative Adversarial Network)이 등장해
그림 같지 않은 이미지를 억지로 만들어내던 시절이 있었죠.
요즘은 Diffusion 모델 덕분에
실사 같은 품질의 이미지를 원하는 스타일로 뽑아낼 수 있습니다.

현업에서는 이게 진짜 큰 게임체인저였습니다.
예전엔 마케팅 배너 하나 만들 때 디자이너, 기획자, 마케터가 모여
여러 시안을 만들고 골라야 했습니다.
지금은 “이런 콘셉트로, 이런 색감으로, 배경은 이런 느낌으로” 라고 프롬프트를 적으면
몇 분 만에 10가지 후보 이미지가 나옵니다.
사람들은 그중에서 마음에 드는 걸 고르거나 조금만 손을 보면 끝이죠.

물론 여전히 사람이 디테일을 다듬어야 하고,
AI가 가끔은 이상한 손가락, 기묘한 얼굴을 그릴 때도 있지만
“아이디어를 시각화하는 단계”가 엄청 빨라졌습니다.


비디오 생성 – 상상했던 장면을 움직이게 만들다

비디오 생성은 아직 초기 단계지만 정말 빠르게 발전하고 있습니다.
짧은 클립은 이미 꽤 자연스럽게 만들 수 있고,
“강아지가 해변에서 뛰어다니는 영상”처럼
단순한 텍스트 프롬프트로 애니메이션까지 생성할 수 있습니다.

광고 업계에서는 이런 기술로 테스트 영상을 만들거나
스토리보드를 애니메이션으로 변환해서 고객에게 보여주는 데 씁니다.
예전 같으면 촬영팀 꾸리고 편집까지 해야 했을 장면을
AI가 1시간 만에 만들어 버리니
회의에서 “우리가 만들고 싶은 느낌이 이런 거다” 하고 보여주기가 쉬워졌습니다.

물론 한계도 있습니다.
아직은 긴 영상을 만들면 인물 형태가 흔들리거나
시간이 지날수록 배경이 일관성이 깨지는 문제가 있습니다.
하지만 이 속도로 발전한다면
머지않아 상업 영화에서도 AI로 만든 장면이 당연하게 들어갈 것 같습니다.


텍스트 생성 – 글쓰기의 빈 종이를 없애다

텍스트 생성은 이미 많은 사람들이 체감하고 있는 AI의 능력입니다.
이메일 초안 작성, 보고서 뼈대 만들기, 블로그 글 아이디어 브레인스토밍…
저도 글을 쓸 때 제일 먼저 하는 게
“이 주제로 목차 10개만 뽑아줘”라고 AI에게 묻는 일입니다.
그럼 바로 전체 구조가 나오고, 저는 그 위에 살을 붙이는 식으로 글을 씁니다.

특히 긴 글을 써야 하는 경우,
AI가 초안을 써주면 ‘수정자’ 입장에서 글을 다듬는 게 훨씬 쉽습니다.
완전히 백지에서 시작하는 고통이 사라졌습니다.


오디오 & 음악 생성 – 나만의 사운드트랙

AI는 이제 음악도 만듭니다.
원하는 분위기를 설명하면
“잔잔한 피아노 음악”, “신나는 일렉트로닉 비트” 같은 곡을 만들어 줍니다.
그리고 심지어 특정 가수의 목소리를 합성해서 노래를 부르게 할 수도 있죠.

게임이나 영상 제작자에게는 엄청난 장점입니다.
저작권 걱정 없는 배경음악을 즉석에서 만들 수 있으니까요.
하지만 동시에 윤리 문제도 생깁니다.
특정 가수 목소리를 무단으로 학습한 모델을 이용해
“가짜 신곡”을 만들어 유통하는 사례도 생기고 있죠.
그래서 앞으로는 법과 윤리 기준이 같이 발전해야 할 영역입니다.


3D 모델 생성 – 현실과 가상의 경계 허물기

텍스트로 “이런 모양의 의자 만들어 줘”라고 하면
AI가 바로 3D 모델을 만들어 주는 시대입니다.
이제는 게임 스튜디오나 건축 회사에서
AI를 사용해 초안을 만들고
사람이 디테일만 보완하는 방식이 점점 일반화되고 있습니다.

심지어 NeRF나 Gaussian Splatting 같은 기술은
카메라로 찍은 사진 여러 장만 있어도
실제 공간을 디지털 트윈으로 재현할 수 있게 합니다.
문화재 복원, 부동산 가상 투어, VR 콘텐츠 제작 같은 분야에서 활발히 쓰이고 있습니다.


오늘의 정리

생성 AI는 단순한 답변 도구를 넘어서
사람의 창작 파트너가 되었습니다.
아이디어를 시각화하고, 글을 쓰고, 음악과 영상을 만들고,
3D 공간까지 재현해 냅니다.

물론 한계도 있고, 윤리 문제도 있고,
“AI가 만든 걸 그냥 쓰는 게 맞을까?” 하는 고민도 필요합니다.
하지만 분명한 건,
이제 창작을 시작하는 데 드는 시간과 비용이 획기적으로 줄어들었다는 점입니다.
아이디어가 떠오르면 그 자리에서 바로 시각화하고,
빠르게 프로토타입을 만들어 볼 수 있다는 건
모든 창작자에게 엄청난 기회입니다.


다음 편 예고

다음 8편에서는 강화학습 & 에이전트 (Reinforcement Learning & Agents)로 넘어갑니다.
AI가 스스로 계획을 세우고, 여러 도구를 호출하고,
목표 달성을 위해 행동을 반복 학습하는
‘자율형 AI’의 세계를 다뤄보겠습니다.

 

 

https://machineindeep.tistory.com/110

 

딥러닝은 이런 Task도 한다! – 8편: 강화학습 & 에이전트, 스스로 배우는 AI의 시대

지금까지는 AI가 데이터를 학습해 “답”을 내놓는 데 집중했죠.하지만 세상은 단순히 문제와 정답으로만 이루어지지 않았습니다.로봇은 스스로 움직여야 하고, 게임 AI는 전략을 세워야 하고,

machineindeep.tistory.com

 

반응형