Submit Search
Upload
Mask Guided Portrait Editing with conditional GANs
•
Download as PPTX, PDF
•
0 likes
•
442 views
H
ha618
Follow
2019年7月6日に開催された,名古屋CV・PRML勉強会で発表したスライド.
Read less
Read more
Education
Report
Share
Report
Share
1 of 32
Download now
Recommended
20170819 CV勉強会 CVPR 2017
20170819 CV勉強会 CVPR 2017
issaymk2
ゼロから深層学習を学ぶ方法 - CMS大阪夏祭り2017
ゼロから深層学習を学ぶ方法 - CMS大阪夏祭り2017
Tomo Masuda
【DL輪読会】AuthenticAuthentic Volumetric Avatars from a Phone Scan
【DL輪読会】AuthenticAuthentic Volumetric Avatars from a Phone Scan
Deep Learning JP
CVPR2017勉強会 Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields
CVPR2017勉強会 Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields
Koichi Takahashi
【CVPR 2020 メタサーベイ】Vision Applications and Systems
【CVPR 2020 メタサーベイ】Vision Applications and Systems
cvpaper. challenge
JAWSDAYS 2018 LUNCH SESSION
JAWSDAYS 2018 LUNCH SESSION
陽平 山口
深層学習の新しい応用と、 それを支える計算機の進化 - Preferred Networks CEO 西川徹 (SEMICON Japan 2022 Ke...
深層学習の新しい応用と、 それを支える計算機の進化 - Preferred Networks CEO 西川徹 (SEMICON Japan 2022 Ke...
Preferred Networks
20120623 cv勉強会 shirasy
20120623 cv勉強会 shirasy
Yoichi Shirasawa
Recommended
20170819 CV勉強会 CVPR 2017
20170819 CV勉強会 CVPR 2017
issaymk2
ゼロから深層学習を学ぶ方法 - CMS大阪夏祭り2017
ゼロから深層学習を学ぶ方法 - CMS大阪夏祭り2017
Tomo Masuda
【DL輪読会】AuthenticAuthentic Volumetric Avatars from a Phone Scan
【DL輪読会】AuthenticAuthentic Volumetric Avatars from a Phone Scan
Deep Learning JP
CVPR2017勉強会 Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields
CVPR2017勉強会 Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields
Koichi Takahashi
【CVPR 2020 メタサーベイ】Vision Applications and Systems
【CVPR 2020 メタサーベイ】Vision Applications and Systems
cvpaper. challenge
JAWSDAYS 2018 LUNCH SESSION
JAWSDAYS 2018 LUNCH SESSION
陽平 山口
深層学習の新しい応用と、 それを支える計算機の進化 - Preferred Networks CEO 西川徹 (SEMICON Japan 2022 Ke...
深層学習の新しい応用と、 それを支える計算機の進化 - Preferred Networks CEO 西川徹 (SEMICON Japan 2022 Ke...
Preferred Networks
20120623 cv勉強会 shirasy
20120623 cv勉強会 shirasy
Yoichi Shirasawa
【CVPR 2020 メタサーベイ】Neural Generative Models
【CVPR 2020 メタサーベイ】Neural Generative Models
cvpaper. challenge
Basic explanation of Generative adversarial networks on MNIST
Basic explanation of Generative adversarial networks on MNIST
Naoki Watanabe
[RIT]MLmodeling service
[RIT]MLmodeling service
RIT
第5回若手交流会資料
第5回若手交流会資料
日本顔学会若手交流会
[DL輪読会]Dream to Control: Learning Behaviors by Latent Imagination
[DL輪読会]Dream to Control: Learning Behaviors by Latent Imagination
Deep Learning JP
ICCV2019 report
ICCV2019 report
Tatsuya Shirakawa
LINE Developer Community: Microsoft AI を楽しく使おう
LINE Developer Community: Microsoft AI を楽しく使おう
Ayako Omori
顔認識アルゴリズム:Constrained local model を調べてみた
顔認識アルゴリズム:Constrained local model を調べてみた
Jotaro Shigeyama
情報検索のためのユーザモデル
情報検索のためのユーザモデル
kt.mako
CVPR2016 reading - 特徴量学習とクロスモーダル転移について
CVPR2016 reading - 特徴量学習とクロスモーダル転移について
Akisato Kimura
機械学習応用のためのソフトウェアエンジニアリングパターン
機械学習応用のためのソフトウェアエンジニアリングパターン
HironoriTAKEUCHI1
実社会・実環境におけるロボットの機械学習 ver. 2
実社会・実環境におけるロボットの機械学習 ver. 2
Kuniyuki Takahashi
「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
Takumi Ohkuma
【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
Deep Learning JP
バージョンアップした「ReNomIMG」の紹介
バージョンアップした「ReNomIMG」の紹介
ReNom User Group
機械学習 - MNIST の次のステップ
機械学習 - MNIST の次のステップ
Daiyu Hatakeyama
[DL輪読会]DeepSignals: Predicting Intent of Drivers Through Visual Signals
[DL輪読会]DeepSignals: Predicting Intent of Drivers Through Visual Signals
Deep Learning JP
いまさらアジャイル巡業 In Tokyo アジャイルモデリング
いまさらアジャイル巡業 In Tokyo アジャイルモデリング
Yuki Tagami
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
cvpaper. challenge
ディープラーニングでラーメン二郎(全店舗)を識別してみた
ディープラーニングでラーメン二郎(全店舗)を識別してみた
knjcode
リアル戦国探究in米沢 事前講座1スライド(スタッフ共有用)『川中島の謎』についてのスライド
リアル戦国探究in米沢 事前講座1スライド(スタッフ共有用)『川中島の謎』についてのスライド
Ken Fukui
リアル戦国探究in米沢 当日講座1(スタッフ共有用)『兵は詐をもって立つ』についてのスライド
リアル戦国探究in米沢 当日講座1(スタッフ共有用)『兵は詐をもって立つ』についてのスライド
Ken Fukui
More Related Content
Similar to Mask Guided Portrait Editing with conditional GANs
【CVPR 2020 メタサーベイ】Neural Generative Models
【CVPR 2020 メタサーベイ】Neural Generative Models
cvpaper. challenge
Basic explanation of Generative adversarial networks on MNIST
Basic explanation of Generative adversarial networks on MNIST
Naoki Watanabe
[RIT]MLmodeling service
[RIT]MLmodeling service
RIT
第5回若手交流会資料
第5回若手交流会資料
日本顔学会若手交流会
[DL輪読会]Dream to Control: Learning Behaviors by Latent Imagination
[DL輪読会]Dream to Control: Learning Behaviors by Latent Imagination
Deep Learning JP
ICCV2019 report
ICCV2019 report
Tatsuya Shirakawa
LINE Developer Community: Microsoft AI を楽しく使おう
LINE Developer Community: Microsoft AI を楽しく使おう
Ayako Omori
顔認識アルゴリズム:Constrained local model を調べてみた
顔認識アルゴリズム:Constrained local model を調べてみた
Jotaro Shigeyama
情報検索のためのユーザモデル
情報検索のためのユーザモデル
kt.mako
CVPR2016 reading - 特徴量学習とクロスモーダル転移について
CVPR2016 reading - 特徴量学習とクロスモーダル転移について
Akisato Kimura
機械学習応用のためのソフトウェアエンジニアリングパターン
機械学習応用のためのソフトウェアエンジニアリングパターン
HironoriTAKEUCHI1
実社会・実環境におけるロボットの機械学習 ver. 2
実社会・実環境におけるロボットの機械学習 ver. 2
Kuniyuki Takahashi
「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
Takumi Ohkuma
【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
Deep Learning JP
バージョンアップした「ReNomIMG」の紹介
バージョンアップした「ReNomIMG」の紹介
ReNom User Group
機械学習 - MNIST の次のステップ
機械学習 - MNIST の次のステップ
Daiyu Hatakeyama
[DL輪読会]DeepSignals: Predicting Intent of Drivers Through Visual Signals
[DL輪読会]DeepSignals: Predicting Intent of Drivers Through Visual Signals
Deep Learning JP
いまさらアジャイル巡業 In Tokyo アジャイルモデリング
いまさらアジャイル巡業 In Tokyo アジャイルモデリング
Yuki Tagami
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
cvpaper. challenge
ディープラーニングでラーメン二郎(全店舗)を識別してみた
ディープラーニングでラーメン二郎(全店舗)を識別してみた
knjcode
Similar to Mask Guided Portrait Editing with conditional GANs
(20)
【CVPR 2020 メタサーベイ】Neural Generative Models
【CVPR 2020 メタサーベイ】Neural Generative Models
Basic explanation of Generative adversarial networks on MNIST
Basic explanation of Generative adversarial networks on MNIST
[RIT]MLmodeling service
[RIT]MLmodeling service
第5回若手交流会資料
第5回若手交流会資料
[DL輪読会]Dream to Control: Learning Behaviors by Latent Imagination
[DL輪読会]Dream to Control: Learning Behaviors by Latent Imagination
ICCV2019 report
ICCV2019 report
LINE Developer Community: Microsoft AI を楽しく使おう
LINE Developer Community: Microsoft AI を楽しく使おう
顔認識アルゴリズム:Constrained local model を調べてみた
顔認識アルゴリズム:Constrained local model を調べてみた
情報検索のためのユーザモデル
情報検索のためのユーザモデル
CVPR2016 reading - 特徴量学習とクロスモーダル転移について
CVPR2016 reading - 特徴量学習とクロスモーダル転移について
機械学習応用のためのソフトウェアエンジニアリングパターン
機械学習応用のためのソフトウェアエンジニアリングパターン
実社会・実環境におけるロボットの機械学習 ver. 2
実社会・実環境におけるロボットの機械学習 ver. 2
「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
バージョンアップした「ReNomIMG」の紹介
バージョンアップした「ReNomIMG」の紹介
機械学習 - MNIST の次のステップ
機械学習 - MNIST の次のステップ
[DL輪読会]DeepSignals: Predicting Intent of Drivers Through Visual Signals
[DL輪読会]DeepSignals: Predicting Intent of Drivers Through Visual Signals
いまさらアジャイル巡業 In Tokyo アジャイルモデリング
いまさらアジャイル巡業 In Tokyo アジャイルモデリング
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
ディープラーニングでラーメン二郎(全店舗)を識別してみた
ディープラーニングでラーメン二郎(全店舗)を識別してみた
Recently uploaded
リアル戦国探究in米沢 事前講座1スライド(スタッフ共有用)『川中島の謎』についてのスライド
リアル戦国探究in米沢 事前講座1スライド(スタッフ共有用)『川中島の謎』についてのスライド
Ken Fukui
リアル戦国探究in米沢 当日講座1(スタッフ共有用)『兵は詐をもって立つ』についてのスライド
リアル戦国探究in米沢 当日講座1(スタッフ共有用)『兵は詐をもって立つ』についてのスライド
Ken Fukui
リアル戦国探究in米沢 当日講座2スライド(スタッフ共有用)『人を致すも人に致されず』についてのスライド
リアル戦国探究in米沢 当日講座2スライド(スタッフ共有用)『人を致すも人に致されず』についてのスライド
Ken Fukui
TEAMIN Service overview for customer_20240422.pdf
TEAMIN Service overview for customer_20240422.pdf
yukisuga3
リアル戦国探究in米沢 事前講座2スライド(スタッフ共有用)『両雄の強さの秘密』についてのスライド
リアル戦国探究in米沢 事前講座2スライド(スタッフ共有用)『両雄の強さの秘密』についてのスライド
Ken Fukui
【ゲーム理論入門】ChatGPTが作成した ゲーム理論の問題を解く #3 Slide
【ゲーム理論入門】ChatGPTが作成した ゲーム理論の問題を解く #3 Slide
ssusere0a682
ゲーム理論 BASIC 演習105 -n人囚人のジレンマモデル- #ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習105 -n人囚人のジレンマモデル- #ゲーム理論 #gametheory #数学
ssusere0a682
リアル戦国探究in米沢 当日講座3スライド(スタッフ共有用)『糧は三度はさいせず』についてのスライド
リアル戦国探究in米沢 当日講座3スライド(スタッフ共有用)『糧は三度はさいせず』についてのスライド
Ken Fukui
Recently uploaded
(8)
リアル戦国探究in米沢 事前講座1スライド(スタッフ共有用)『川中島の謎』についてのスライド
リアル戦国探究in米沢 事前講座1スライド(スタッフ共有用)『川中島の謎』についてのスライド
リアル戦国探究in米沢 当日講座1(スタッフ共有用)『兵は詐をもって立つ』についてのスライド
リアル戦国探究in米沢 当日講座1(スタッフ共有用)『兵は詐をもって立つ』についてのスライド
リアル戦国探究in米沢 当日講座2スライド(スタッフ共有用)『人を致すも人に致されず』についてのスライド
リアル戦国探究in米沢 当日講座2スライド(スタッフ共有用)『人を致すも人に致されず』についてのスライド
TEAMIN Service overview for customer_20240422.pdf
TEAMIN Service overview for customer_20240422.pdf
リアル戦国探究in米沢 事前講座2スライド(スタッフ共有用)『両雄の強さの秘密』についてのスライド
リアル戦国探究in米沢 事前講座2スライド(スタッフ共有用)『両雄の強さの秘密』についてのスライド
【ゲーム理論入門】ChatGPTが作成した ゲーム理論の問題を解く #3 Slide
【ゲーム理論入門】ChatGPTが作成した ゲーム理論の問題を解く #3 Slide
ゲーム理論 BASIC 演習105 -n人囚人のジレンマモデル- #ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習105 -n人囚人のジレンマモデル- #ゲーム理論 #gametheory #数学
リアル戦国探究in米沢 当日講座3スライド(スタッフ共有用)『糧は三度はさいせず』についてのスライド
リアル戦国探究in米沢 当日講座3スライド(スタッフ共有用)『糧は三度はさいせず』についてのスライド
Mask Guided Portrait Editing with conditional GANs
1.
名古屋CV・PRML勉強会 Mask-Guided Portrait Editing
with Conditional GANs Hiroki Adachi
2.
自己紹介 研究分野 (Research fields) コンピュータビジョン (生成モデル,距離推定) 足立浩規
(Hiroki Adachi) 修士2年 名前 (Name) Machine Perception and Robotics Group 所属 (Affiliation)
3.
•Snapchatやfacetuneなどのアプリ - 顔の交換や化粧など様々な加工が可能 Face editingの応用先 3
4.
•conditionalGANsベースで顔画像の編集が可能 - 条件:顔に対するセグメンテーションマスク画像 •顔のパーツの扱い方にフォーカスして生成 - 上手なセグメンテーションマスクの利用 どのような論文? 4
5.
•Generative Adversarial Networks[Goodfellow+,
NIPS’14]の略 - GeneratorとDiscriminatorを競い合わせた学習 • Generator:本物っぽい画像を生成 • Discriminator:生成画像か実画像かを正確に判別 GANsとは 5 Generator (偽札職人) Discriminator (警察官) ノイズベクトル 生成画像 実画像 or GANsの目的関数
6.
•Generative Adversarial Networks[Goodfellow+,
NIPS’14]の略 - GeneratorとDiscriminatorを競い合わせた学習 • Generator:本物っぽい画像を生成 • Discriminator:生成画像か実画像かを正確に判別 GANsとは 6 Generator (偽札職人) Discriminator (警察官) ノイズベクトル 生成画像 実画像 or GANsの目的関数 最小化
7.
•Generative Adversarial Networks[Goodfellow+,
NIPS’14]の略 - GeneratorとDiscriminatorを競い合わせた学習 • Generator:本物っぽい画像を生成 • Discriminator:生成画像か実画像かを正確に判別 GANsとは 7 Generator (偽札職人) Discriminator (警察官) ノイズベクトル 生成画像 実画像 or GANsの目的関数 最大化
8.
•ネットワークへの入力は4種類 - ソース画像andマスク - ターゲット画像andマスク •3段構造のネットワーク構成 -
Local Embedding Sub-Network • 顔の成分(口や目)の特徴を抽出 - Mask-Guided Generative Sub-Network • ターゲットマスクから顔を生成 - Background Fusing Sub-Network • ターゲット画像の背景にペースト ネットワークのOverview 9
9.
•ネットワークへの入力は4種類 - ソース画像andマスク - ターゲット画像andマスク •3段構造のネットワーク構成 -
Local Embedding Sub-Network • 顔の成分(口や目)の特徴を抽出 - Mask-Guided Generative Sub-Network • ターゲットマスクから顔を生成 - Background Fusing Sub-Network • ターゲット画像の背景にペースト ネットワークのOverview 10
10.
•Helen datasetで学習したFCNによりソースマスクを取得 Local Embedding
Sub-Network 11 ①
11.
•Helen datasetで学習したFCNによりソースマスクを取得 •顔を5つの領域に分割 - 右目,左目,口,肌と鼻,髪 Local
Embedding Sub-Network 12 ②
12.
•Helen datasetで学習したFCNによりソースマスクを取得 •顔を5つの領域に分割 - 右目,左目,口,肌と鼻,髪 •分割した領域をAutoencoderへ入力 -
Encoderの出力へInstance-wise average poolingを追加 Local Embedding Sub-Network 13 右目,左目... 各要素に関する再構成誤差
13.
•ネットワークへの入力は4種類 - ソース画像andマスク - ターゲット画像andマスク •3段構造のネットワーク構成 -
Local Embedding Sub-Network • 顔の成分(口や目)の特徴を抽出 - Mask-Guided Generative Sub-Network • ターゲットマスクから顔を生成 - Background Fusing Sub-Network • ターゲット画像の背景にペースト ネットワークのOverview 14
14.
•ターゲットマスクをEncoderへ入力 Mask-Guided Generative Sub-Network 15 ①
15.
•ターゲットマスクをEncoderへ入力 •local embedding sub-netのEncoderの出力を結合 •結合したテンソルをGmへ入力 Mask-Guided
Generative Sub-Network 16 : 各要素の中心位置 : 全要素が0のテンソル 口を結合するときの例 中心位置を利用してコピー Concat
16.
•ネットワークへの入力は4種類 - ソース画像andマスク - ターゲット画像andマスク •3段構造のネットワーク構成 -
Local Embedding Sub-Network • 顔の成分(口や目)の特徴を抽出 - Mask-Guided Generative Sub-Network • ターゲットマスクから顔を生成 - Background Fusing Sub-Network • ターゲット画像の背景にペースト ネットワークのOverview 17
17.
•単純に生成するとartifactの原因 - 背景画像に含まれる首と,Source画像の肌の色と異なる - 髪に関する領域分割が完璧にできているとは限らない 背景の合成における問題点 18 Sourceの顔 肌の色が異なる 背景画像
18.
•マスク画像を使用してtarget画像の背景を取得 Background Fusing Sub-Network 19
19.
•マスク画像を使用してtarget画像の背景を取得 •背景の特徴を抽出したテンソルを取得 Background Fusing Sub-Network 20
20.
•マスク画像を使用してtarget画像の背景を取得 •背景の特徴を抽出したテンソルを取得 •顔の特徴マップ(Source画像)を結合 Background Fusing Sub-Network 21 Concat
21.
•マスク画像を使用してtarget画像の背景を取得 •背景の特徴を抽出したテンソルを取得 •顔の特徴マップ(Source画像)を結合 •生成ネットワークへ結果を取得 Background Fusing Sub-Network 22 Concat
22.
•マスク画像を使用してtarget画像の背景を取得 •背景の特徴を抽出したテンソルを取得 •顔の特徴マップ(Source画像)を結合 •生成ネットワークへ結果を取得 誤差関数 23 Concat :ソース画像 :マスク画像(ソース) :ターゲット画像 :マスク画像(ターゲット) Global Reconstruction :Discriminatorの中間層の特徴 Adversarial Loss ターゲットと生成したサンプルのマスクを一貫させるための誤差
23.
•データセット(合計22,000) - Helen Dataset •
2,330枚の顔画像(学習用:2,000,評価用:330) - VGGFace2から20,000枚 • マスク画像のバリエーションを増やすために使用 •各インスタンスの入力サイズ - 目(左右):48x32 - 口:144x80 - 肌:256x256 - 髪:256x256 実験概要 24
24.
•ローカルな特徴抽出により詳細な情報のキープが可能 - 目の大きさ,肌の色,髪の色 Ablation study 25 setting1)
global autoencoderのみ使用 setting2) local autoencoderも使用 setting3) 手法すべてを使用
25.
•ローカルな特徴抽出により詳細な情報のキープが可能 - 目の大きさ,肌の色,髪の色 •手法すべてを使用することで,輪郭のガタつきが削減可能 •手法の全部入りが最も高いFIDのスコア - 他の設定と比較して,2ポイント以上良い Ablation
study 26 setting1) global autoencoderのみ使用 setting2) local autoencoderも使用 setting3) 手法すべてを使用 設定ごとのFIDのスコア
26.
•従来手法は2つとも,多様性にかける生成結果 - global autoencoderを使用していることが原因 •提案手法はリアリスティックで綺麗 従来手法との比較 27 従来手法との比較 提案手法で合成した画像の例
27.
•実験1: ターゲットマスクに変更を加える •実験2: 他の画像を使用してターゲット画像の顔の要素を置き換える Face
editing & Face swap+ 28
28.
•実験1: ターゲットマスクに変更を加える •実験2: 他の画像を使用してターゲット画像の顔の要素を置き換える Face
editingの結果 29 マスク画像に変更を加えて生成した例 生成画像の一部を他の画像の要素で置き換えた例
29.
•実験1: ターゲットマスクに変更を加える •実験2: 他の画像を使用してターゲット画像の顔の要素を置き換える Face
editingの結果 30 マスク画像に変更を加えて生成した例 生成画像の一部を他の画像の要素で置き換えた例
30.
Face swap+の結果 31 顔の角度がかなり異なる メガネの有無 入力画像 入力画像
31.
Face swap+の結果 32 それでも綺麗に合成が可能!! 入力画像 入力画像
32.
33
Download now