2. 소라란?
Video generation models as world simulators
① CHAT GPT, 이미지 생성 도구 DALL-E 와 같은 기반의 AI
② 기존의 3~4초가량의 아웃풋을 1분으로 대폭 증가
③ 모델 로직을 바꾸지 않고 하드웨어사이즈를 10에서 1000으로 증가
④ 일관성, 계체의 연속성이 크게 증가
⑤ 계체간의 상화작용에 대한 표현이 가능
⑥ 물리 법칙을 이해하고 있다고 보는 의견이 존재
OPEN AI에서 공개한 인공지능 비디오 생성모델
https://openai.com/sora
3. 소라 이전의 동영상 생성 AI
TEXT TO VIDEO – 필터, 컨버터
2023년 2월에 선보인 runway Gen-2
뚜렷한 한계를 보였으나 그것을 뛰어넘는 혁식적인 영상제작 방법을 제시하고 성능향상을 기대하게 함
4. 동영상 생성 AI의 진화
META : EMU
TEXT TO VIDEO – 이미지 생성부터 영상까지
Google : Lumiere runway : Gen-2
https://lumiere-video.github.io/ https://emu-video.metademolab.com/ https://research.runwayml.com/gen2
따라잡기 어려운 속도로 발전하고 있으며 각자 가진 장단점들이 존재하나 그 차이는 대동소이(大同小異)하며
3~4초 분량의 짧은 아웃풋을 만들어 낸다.
5. 동영상 생성 AI의 진화 예시
“Will Smith eating spaghetti” to “Will Smith Gets Eaten by Spaghetti”
https://www.youtube.com/watch?v=XQr4Xklqzw8 https://www.youtube.com/watch?v=5or0VxHXODA https://www.youtube.com/watch?v=EDtvaWDhDRQ
기술적인 발전을 넘어 생태계를 바꿀 수 있는 생산성을 체감 할 수 있다.
6. 일관성, 연속성 향상
하드웨어 증량으로 프레임 to 프레임, 토큰 to 토큰의 한계를 극복
https://www.youtube.com/watch?v=HbfDjAMFi6w&t=13s
AnimateDiff ControlNet Animation v1.0 [ComfyUI]으로 보는 성능향상
7. 상호작용 능력 향상
Z측, 즉 3D 공간을 인지하고 계체간의 물리적 관계를 해석하는 능력 향상
프롬프트로 입력하지 않은 내용들을 스스로 표현되는 것을 확인 할 수 있다.
8. 한계
완성형이라고 하기엔 디테일이 부족한 시뮬레이션의 단계
SORA AI는 실패한 결과물을 가감없이 공개하고 시뮬레이터라는 이름으로 쓰임을 규정
9. 생산성
한계가 분명하지만 뛰어난 생산성으로 문제를 해결할 수 있으며 지속적으로 진화한다.
QHD(2560 X 1440) 해상도 대비 작업물의 사이즈 16x16 비교
11. 의견
디자이너 입장으로 바라본 생성형 AI가 시장에 끼칠 영향
70%
비전문가
: 전문가
30%
① 전문가 100%의 시장에 대폭적인 인력증가가 있을 것으로 예상
② 디자인을 잘하고 퀄리티 경험많은 사람은 여전히 우위
③ 기획력, 비즈니스적인 마인드, 주도적인 태도, 스토리텔링 및 상상력
트렌드를 보는 능력 향상이 필요
12. 결론
AI는 거스를 수 없는 시대의 흐름이며 하나의 도구임을 명심해야 한다!
평소에 갖고 있던 기존 능력을 향상시키고, AI의 도래에 대비하며 현재 업무에 최선을
다하고 미리 AI에 대한 경험을 쌓는 것이 중요하다!