DreamBooth는 주어진 텍스트 프롬프트로부터 고품질이고 다양한 이미지를 합성하는 데 탁월한 대규모 텍스트-이미지 모델의 한계를 극복합니다. 기존 모델들은 주어진 참조 세트에서 주체의 모습을 모방하고 다른 맥락에서 그들의 새로운 렌더링을 생성하는 능력이 부족했습니다.
개인화된 이미지 생성
DreamBooth는 주체의 몇 장의 이미지만 입력으로 받아, 사전 훈련된 텍스트-이미지 모델을 미세 조정합니다. 이를 통해 모델은 특정 주체에 고유 식별자를 결합하여 학습합니다. 이 고유 식별자를 사용하여, 모델의 출력 도메인에 내장된 주체를 다양한 장면에서의 새로운 사실적 이미지로 합성할 수 있습니다.
기술의 적용
이 기술은 주체 재배치, 텍스트 가이드 뷰 합성, 렌더링 등 여러 이전에 해결하기 어려웠던 작업에 적용되었습니다. 모델은 주체의 핵심 특징을 보존하면서, 참조 이미지에 나타나지 않는 다양한 장면, 포즈, 시점 및 조명 조건에서 주체를 합성하는 데 성공했습니다.
오늘 논문 리뷰를 위해 이미지처리 김준철님이 자세한 리뷰를 도와주셨습니다 많은 관심 미리 감사드립니다!
https://youtu.be/jq85UXiJEXk