SlideShare a Scribd company logo
Submit Search
Upload
Login
Signup
[MIRU2017 招待講演] 白黒写真の自動色付け (SIGGRAPH 2016)
Report
Satoshi Iizuka
Follow
Junior Researcher (Assistant Professor) at Waseda University
Aug. 9, 2017
•
0 likes
•
2,061 views
1
of
19
[MIRU2017 招待講演] 白黒写真の自動色付け (SIGGRAPH 2016)
Aug. 9, 2017
•
0 likes
•
2,061 views
Download Now
Download to read offline
Report
Technology
MIRU2017招待講演の発表資料です。
Satoshi Iizuka
Follow
Junior Researcher (Assistant Professor) at Waseda University
Recommended
[IBIS2017 講演] ディープラーニングによる画像変換
Satoshi Iizuka
4.7K views
•
45 slides
[DL輪読会]Colorful Image Colorization
Deep Learning JP
1.3K views
•
21 slides
Colorful image colorization
Hiroki Yamamoto
4.9K views
•
37 slides
[SIGGRAPH 2017] Globally and Locally Consistent Image Completion
Satoshi Iizuka
2.6K views
•
23 slides
[SIGGRAPH 2016] Automatic Image Colorization
Satoshi Iizuka
2.1K views
•
31 slides
Introduction to Data Science
Christy Abraham Joy
46.1K views
•
51 slides
More Related Content
Recently uploaded
インフラチームとCCoEの関係.pptx
ssuser5c7ee4
20 views
•
18 slides
GraphQLはどんな時に使うか
Yutaka Tachibana
14 views
•
37 slides
IGDA Japan SIG Audio #20-1 室内・野外でのマイク収録と整音.pdf
IGDA Japan SIG-Audio
115 views
•
31 slides
テスト自動化.pdf
ssuserf8ea02
29 views
•
26 slides
遠隔お酌IoTLT2309.pptx
Yoshiaki Ito
145 views
•
12 slides
2023情報処理学会関西支部大会-G12.pdf
KoseiShimoda1
7 views
•
11 slides
Recently uploaded
(14)
インフラチームとCCoEの関係.pptx
ssuser5c7ee4
•
20 views
GraphQLはどんな時に使うか
Yutaka Tachibana
•
14 views
IGDA Japan SIG Audio #20-1 室内・野外でのマイク収録と整音.pdf
IGDA Japan SIG-Audio
•
115 views
テスト自動化.pdf
ssuserf8ea02
•
29 views
遠隔お酌IoTLT2309.pptx
Yoshiaki Ito
•
145 views
2023情報処理学会関西支部大会-G12.pdf
KoseiShimoda1
•
7 views
画像生成AIの問題点
iPride Co., Ltd.
•
10 views
MLOps Course Slides_JP(配布用).pdf
Yuya Yamamoto
•
118 views
CatBoost on GPU のひみつ
Takuji Tahara
•
548 views
20230921_IoTLT_vol103_kitazaki_v1.pdf
Ayachika Kitazaki
•
164 views
磁石内臓イヤリングによる磁力変化を利用したジェスチャ識別
sugiuralab
•
7 views
拡散する画像生成.pdf
NTTDOCOMO-ServiceInnovation
•
44 views
ヒアラブルデバイスにおける音漏れ信号を用いた空中ジェスチャ認識
sugiuralab
•
5 views
CCoE実践者コミュニティ#1_CCoEが進めるセキュリティカイゼンの旅.pptx
Tomoaki Tada
•
57 views
Featured
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
RachelPearson36
8.9K views
•
21 slides
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Applitools
53.7K views
•
138 slides
12 Ways to Increase Your Influence at Work
GetSmarter
400.5K views
•
64 slides
ChatGPT webinar slides
Alireza Esmikhani
27.9K views
•
36 slides
More than Just Lines on a Map: Best Practices for U.S Bike Routes
Project for Public Spaces & National Center for Biking and Walking
6.2K views
•
51 slides
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
DevGAMM Conference
3.1K views
•
12 slides
Featured
(20)
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
RachelPearson36
•
8.9K views
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Applitools
•
53.7K views
12 Ways to Increase Your Influence at Work
GetSmarter
•
400.5K views
ChatGPT webinar slides
Alireza Esmikhani
•
27.9K views
More than Just Lines on a Map: Best Practices for U.S Bike Routes
Project for Public Spaces & National Center for Biking and Walking
•
6.2K views
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
DevGAMM Conference
•
3.1K views
Barbie - Brand Strategy Presentation
Erica Santiago
•
23.8K views
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
Saba Software
•
25K views
Introduction to C Programming Language
Simplilearn
•
8.1K views
The Pixar Way: 37 Quotes on Developing and Maintaining a Creative Company (fr...
Palo Alto Software
•
88K views
9 Tips for a Work-free Vacation
Weekdone.com
•
7K views
I Rock Therefore I Am. 20 Legendary Quotes from Prince
Empowered Presentations
•
142.6K views
How to Map Your Future
SlideShop.com
•
274.8K views
Beyond Pride: Making Digital Marketing & SEO Authentically LGBTQ+ Inclusive -...
AccuraCast
•
3.3K views
Read with Pride | LGBTQ+ Reads
Kayla Martin-Gant
•
1K views
Exploring ChatGPT for Effective Teaching and Learning.pptx
Stan Skrabut, Ed.D.
•
56.2K views
How to train your robot (with Deep Reinforcement Learning)
Lucas García, PhD
•
42.2K views
4 Strategies to Renew Your Career Passion
Daniel Goleman
•
121.8K views
The Student's Guide to LinkedIn
LinkedIn
•
86.9K views
Different Roles in Machine Learning Career
Intellipaat
•
12.3K views
[MIRU2017 招待講演] 白黒写真の自動色付け (SIGGRAPH 2016)
1.
Satoshi Iizuka* Edgar
Simo-Serra* Hiroshi Ishikawa Waseda University (*equal contribution) 画像の認識・理解シンポジウム(MIRU2017)
2.
2 白黒写真
3.
3 研究目的:自動色付け
4.
昔の映画も… 4
5.
スクリブルベース [Levin+
’04; An+ ’09; Xu+ ’13; Endo+ ’16] ユーザが画像上で色を指定 手間がかかる 参照画像ベース [Chia+ ’11; Gupta+ ’12] 他のカラー画像の色を転写 類似画像が必要 学習ベース [Cheng+ ’15] 手動設計の特徴量+小さなニューラルネットワーク 精度が低い 関連研究 入力 参照 出力 5
6.
大域情報と局所情報から色付けを行うネットワークモデル 大域特徴と局所特徴を合わせる統合レイヤ
シーンラベルを利用した学習 高精度の色付けを実現 提案手法 6 提案手法による色付け
7.
提案モデル 20.60% Formal Garden 16.13%
Arch 13.50% Abbey 7.07% Botanical Garden 6.53% Golf Course 彩度マップ 推定ラベル 低レベル特徴抽出 ネットワーク 大域特徴抽出ネットワーク 中レベル特徴抽出 ネットワーク 色付け ネットワーク 分類 ネットワーク 輝度マップ (入力画像) 統合レイヤ 7
8.
中レベル特徴マップと大域特徴ベクトルを統合 どんなサイズの特徴マップにも大域特徴を統合可能 統合レイヤ 8 統合レイヤ 中レベル特徴抽出 ネットワーク 大域特徴抽出ネットワーク =
𝜎 𝐛 + 𝑊 𝐲 𝑢,𝑣 fusion 𝐲global 𝐲 𝑢,𝑣 mid 統合レイヤ
9.
MIT Places
Scene Dataset [Zhou+ ’14] 約230万枚、205種類のシーン 解像度は224 × 224を使用 学習データ Abbey Airport terminal Aquarium Baseball field Dining room Forest road Gas station Gift shop ⋯ ⋯ 9
10.
10 色とシーン分類の同時学習 モデル パラメータを 更新 色の誤差 入力画像 正解画像出力画像 推定 1.1% Airport 25.5% Basement 0.5%
Music store 8.1% Restaurant 正解ラベル … 出力ラベル 分類誤差 0% Airport 100% Basement 0% Music store 0% Restaurant …
12.
白黒写真の色付け 12
13.
大域特徴の影響 大域特徴あり入力画像 大域特徴なし 13
14.
10人の被験者、それぞれに1500枚の画像を提示 約90%の結果画像を自然な色と回答 ユーザテスト 14 自然
不自然
15.
比較 入力画像 [Cheng+ ’15]
提案手法大域特徴なし 15
16.
カラフルな物体は出力されにくい 正確な色を復元するわけではない 制約 入力
正解画像 提案手法 入力 正解画像 提案手法 16
17.
大域特徴と局所特徴による白黒画像の自動色付け 統合レイヤ
色とシーン分類の同時学習 まとめ 17 Doffer Boys, 1909年Mount Moran, 1941年 Scott‘s Run, 1937年 Youngsters, 1912年
18.
“Globally and
Locally Consistent Image Completion” [Iizuka+ SIGGRAPH ’17] ニューラルネットワークによる画像補完 補完ネットワーク、大域・局所識別ネットワークによる学習 18 おまけ:今年のSIGGRAPH論文 入力画像 補完結果
19.
質問や感想などありましたらお願いします Email:
iizuka@aoni.waseda.jp ホームページ: http://hi.cs.waseda.ac.jp/~iizuka/ Twitter: https://twitter.com/stsiizk 自動着色プロジェクトページ: http://hi.cs.waseda.ac.jp/~iizuka/projects/colorization/ 画像補完プロジェクトページ: http://hi.cs.waseda.ac.jp/~iizuka/projects/completion/ 19 ご清聴ありがとうございました