CEDEC 2020で登壇したセッション「エンド・トゥ・エンドAI描画に至る道 - 高度構造化入力のためのニューラルネットワーク構成やインフラの検討」の講演資料です。
【セッションの内容】
近年、ニューラルネットワークによって写真のようにリアルな画像を作ることができるようになってきました。
しかし、形状や位置、光環境、見た目などのパラメータを自由に指定して一貫性のある結果をAIで生成することは未だ困難です。
そのような制限を乗り越えるには各パラメータに特化したAIのインフラが必要になります。
本発表では、AIによって直接描画することを目指し、人間の顔面を対象として取り上げます。望ましい出力を得るために適切なパラメータを解析、教師データ生成のためのインフラや神経回路網の構成を比較し、実装します。
特に、光源環境、造形の特徴等を含む構造化入力引数の顔面3Dデータフォーマットを生成するGPGPUアルゴリズムを開発、応用、評価しています。