SlideShare a Scribd company logo
1 of 24
Perceptual Losses for Real-Time Style
Transfer and Super-Resolution
Justin Johnson, Alexandre Alahi, Fei-Fei Li
Stanford University
ECCV’16 論文読み会
2016/11/7
森 直幸@㈱ergovision†
2016年11月13日
1
† www.ergovision.co.jp
やりたいこと:画像の変換(image transformation)
2016年11月13日 2
①画風の転移(Style transfer)の高速化
②超解像(Super Resolution)の高精度化
→15sec →0.015sec
要点の整理
• Perceptual Losses for Real-Time Style Transfer and Super-Resolution
2016年11月13日 3
目的 CNNによる画像変換(画風の転移・超解像)の高度化
技術的課題
①推論時に都度最適化が必要なため遅い
②大局的な最適化がないため、精度が低い
解決アイディア
①ネットワーク構造の改良により推論時の最適化計算を廃止し、
処理を高速化
②PerPixelのみの最適化に加え、conceptualなレベルの最適
化を加えることによって、超解像精度を向上
評価
①MSCOCOデータセットを用い、処理時間を定量評価
②SetX,BSD100データセットを用い、見た目評価
2016年11月13日 4
画風の転移
従来手法
• A Neural Algorithm of Artistic Style, Gatys et al.2015
– CNNで画像を生成
– 画風の損失関数、画像の損失関数
– アルゴリズム:
1. 白色ノイズ画像を入力
2. 損失を計算
3. 白色ノイズ画像の各画素値をパラメタとして、SGDにより更新
– 出力画像1個を生成するごとにforward/backwardを数百回実行
– 非常に時間がかかる
2016年11月13日 5※Broyden, Fletcher, Goldfarb, Shanno
提案手法
2016年11月13日 6
Image Transformation Network
“画像変換ネットワーク”
↓
Residual network
LossFunctionNetwork
“損失関数ネットワーク”
↓
VGG-16, pretrained
入力画像 出力画像
→ネットワークの内部構造についての説明はのちほど。
conv_3x3
conv_3x3
conv_3x3
conv_3x3
conv_3x3
conv_3x3
conv_3x3
conv_3x3
conv_3x3
conv_3x3
Loss
学習時のフロー 1/4
2016年11月13日 7
教師画像
入力画像
conv_3x3
conv_3x3
conv_3x3
conv_3x3
conv_3x3
conv_3x3
conv_3x3
conv_3x3
conv_3x3
conv_3x3
※赤枠内の画像はイメージであり、実際の処理とは異なります。このイメージは です。
学習時のフロー 2/4
2016年11月13日 8
教師画像
入力画像
conv_3x3
conv_3x3
conv_3x3
conv_3x3
conv_3x3
conv_3x3
conv_3x3
conv_3x3
conv_3x3
conv_3x3
画風損失関数:
学習時のフロー 3/4
2016年11月13日 9
教師画像
入力画像
conv_3x3
conv_3x3
conv_3x3
conv_3x3
conv_3x3
conv_3x3
conv_3x3
conv_3x3
conv_3x3
conv_3x3
画像損失関数:
学習時のフロー 4/4
2016年11月13日 10
教師画像
画像損失関数:
教師画像
画風損失関数:
入力画像
ネットワーク内部構造
• Residual network … Deep Residual Learning for Image
Recognition, Microsoft Research Asia
• VGG-16 … Very Deep Convolutional Networks for Large-Scale
Image Recognition, 2014, oxford univ.
ImageNet datasetでpretrained(14M画像、22kクラス)
2016年11月13日 11
Residual network VGG-16
画風損失関数の詳細
• 画風損失関数
2016年11月13日 12
フロベルニウスノルム
値同士の積の和
p
q
第pチャネル
:
… …
評価
• 学習
– Microsoft COCO dataset
• Microsoft COCO:
Common Objects in
Context,
ECCV 2014
• 80k training images
– 40k iteration, Adam,
LearningRate:10^-3
– 4hours with Titan X GPU x1
2016年11月13日 13
定性評価1/2
2016年11月13日 14
入力画像 x 教師画像 ys 従来手法 提案手法
従来手法と同様、画風を転移できている
定性評価2/2
 人物はdetailが残っている
 背景は変形が多発して視認できない
2016年11月13日 15
 猫の顔ははっきりと視認できる
 猫の体は適当なテクスチャで埋
められているように見える
• 損失関数ネットワークの訓練データセットに「人」「猫」のクラス
• 学習対象クラスの物体とそうでない物体に対して選択的に処理が行われる
のではないか
定量評価
• 1枚の画像を変換するのに要する時間
• [先行手法]学習時のepochと目的関数の推移
2016年11月13日 16
先行手法
2016年11月13日 17
超解像
画風の転移との差分のみ説明します
ネットワーク構造・学習時のフロー 4/4
2016年11月13日 18
教師画像
画像損失関数:
入力画像
従来手法
• Image super-resolution using deep convolutional networks,
Dong et al.2015
• SRCNNという手法
– CNNで超解像
– 33x33ピクセルのパッチ内で画素の差異を最小化
– ILSVRC2013データセットで学習
– Epoch 10^9以上
2016年11月13日 19※Broyden, Fletcher, Goldfarb, Shanno
評価(超解像)
• 学習
– MS-COCO の画像10k枚
– ガウスぼかし(σ=1.0)の後にbicubicでダウンサンプリング
– Epoch 200k, Adam, Learning Rate:10^-3
• 比較データ
– Set5, Set14, BSD100
• 比較方法
– 見た目評価
– PSNR, SSIMによる定量評価(無意味だとの主張)
2016年11月13日 20
見た目評価 1/2
2016年11月13日 21
Ground truth 従来手法(SRCNN) 提案手法
• 繊細な箇所の復元に成功
• 変な模様が発生
The feature reconstruction loss gives rise to a slight cross-hatch pattern visible under magnication,
見た目評価 2/2
2016年11月13日 22
Ground truth 従来手法(SRCNN) 提案手法
定量評価(無意味だとの主張)
• 各数値はPSNR/SSIMと読んでください
• [This Image]行はテスト画像の評価値
• [SetX mean], [BSD100 mean]は各データセットの平均評価値
• 画質の良し悪しと相関していない
• 相関のなさを主張している論文が5本引用されている
• “The traditional metrics”はダメなので、見た目評価のみで良否を
判断する、と主張
2016年11月13日 23
まとめ
• 画風の転移、超解像を実現する手法の提案
– 推論時の最適化計算を廃止し、処理を高速化
– PerPixelのみの最適化に加え、conceptualなレベルの最適化を
加えることによって、超解像精度を向上
2016年11月13日 24

More Related Content

Featured

How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthThinkNow
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfmarketingartwork
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024Neil Kimberley
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)contently
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024Albert Qian
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsKurio // The Social Media Age(ncy)
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Search Engine Journal
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summarySpeakerHub
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next Tessa Mero
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentLily Ray
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best PracticesVit Horky
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project managementMindGenius
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...RachelPearson36
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Applitools
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at WorkGetSmarter
 

Featured (20)

How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
 
Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work
 
ChatGPT webinar slides
ChatGPT webinar slidesChatGPT webinar slides
ChatGPT webinar slides
 

20161113.関西cvprml勉強会/ECCV16論文読み会・森