Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
アルバム作成支援のための集合写真における閉眼状態の開眼手法に関する研究
1. Interaction Design Lab, Osaka Institute of Technology
アルバム作成支援のための集合写真に
おける閉眼状態の開眼手法に関する
研究
〇†金 朝暉 †大井 翔 †佐野 睦夫
†大阪工業大学情報科学部
1
2. Interaction Design Lab, Osaka Institute of Technology
背景
• 近年の人工知能の発達に伴い、さまざまな業界で人工知能を
利用して作業効率を向上させている
• アルバム制作業界の負担が大きい
• アルバム制作において、人工知能に使用することで、
効率向上できる部分があると考えられる
2
仕事
多い
3. Interaction Design Lab, Osaka Institute of Technology
効率向上できる部分
• 卒業アルバムの制作では、似たような写真が何枚もある中で、
デザイナーが最適な写真を選ぶことが求められる場合がある
• デザイナーによって選択した写真をアレンジする(Photoshopなど)
こともある
3
https://www.daicolo.co.jp/for-school/solution/phase2/(参照日:2021/12/06).
4. Interaction Design Lab, Osaka Institute of Technology
Photoshopでのやり方
4
https://mappyedit.com/closed-eyes-open/(参照日:2021/12/06)
1. 目をつぶってる人の目が開いた写真を取り込む
2. 目が開いてる写真を目をつぶってる写真の上に置く
3. マスクを使って目だけを塗っていく
4. 目の位置を微調整
5. Interaction Design Lab, Osaka Institute of Technology
目的
• 写真の選択時間や手動調整の時間を短縮する
• 作業者の仕事の負担の軽減
• 他の項目なども効率向上できると考えられる
5
https://www.daicolo.co.jp/for-school/solution/phase2/(参照日:2021/12/06).
6. Interaction Design Lab, Osaka Institute of Technology
卒業アルバムの必要な構成
「肖像(生徒の個人、集合写真)」
「生活(学生生活の様子)」
「環境(学校と地域)」
「シナリオ(全体のストーリー)」
6
https://www.daicolo.co.jp/for-school/solution/phase3/(参照日:2021/12/06).
7. Interaction Design Lab, Osaka Institute of Technology
提案手法
7
• 集合写真が何十枚も撮ったのに1枚も全員目を開けている写真
がないということがある[1]
• 人工知能により、全員集合写真の閉眼状態を自動で探し出して、
ほかの閉眼状態が存在する集合写真から「目」を自動的に画像
修正する機能
[1]https://mappyedit.com/closed-eyes-open/ (参照日:2021/12/06)
8. Interaction Design Lab, Osaka Institute of Technology
関連研究(目の状態に関する関連研究)
• Terezaらは、カメラで撮影されたビデオの中から、目の瞬きを
リアルタイムで検出するアルゴリズムを提案している[2]
• その結果、ランドマークにより、目の開き具合を確実に推定できる
ことを示した
• スカラー量「eye as-pect ratio(EAR)」 を抽出することができた
8
[2]Tereza Soukupova and Jan ,Cech “ Real-Time Eye Blink Detection using Facial Landmarks”,21st
Computer Vision Winter Workshop,Rimske Toplice, Slovenia, February 3–5, 2016
9. Interaction Design Lab, Osaka Institute of Technology
提案手法の処理の流れ
9
集合写真1
集合写真2
閉眼状態
②目の状態識別 同じ人物の開眼写真
④顔の特徴点で位置合わせる ③同じ人物の顔認証
⑤マスク画像の処理
完成
①顔の特徴点検出
10. Interaction Design Lab, Osaka Institute of Technology
①顔の特徴点検出
• 今回は、Dlib[3]で学習済みモデルを使って、顔の特徴点
の検出をした
• 特徴点の数が68個になる
10
[3]Kazemi, V,Sullivan, J,“One Millisecond Face Alignment with an Ensemble of Regression Trees”, The IEEE
Conference on Computer Vision and Pattern Recognition(CVPR), 2014, pp. 1867-1874(2014)
11. Interaction Design Lab, Osaka Institute of Technology
②目の状態識別について
• 顔のランドマーク検出し、目の周りのランドマークを使う
• 関連研究によるとEARの閾値は0.2(+-0.05)なので、
今回は0.2にした[2]
• また、 imutilsというライブラリを使うと、簡単にDlibで検出した
ランドマークが使える
11
[2]Tereza Soukupova and Jan ,Cech “ Real-Time Eye Blink Detection using Facial Landmarks”,21st Computer
Vision Winter Workshop,Rimske Toplice, Slovenia, February 3–5, 2016
17. Interaction Design Lab, Osaka Institute of Technology
実験手法
• 本研究では、提案手法の比較をした
• 予備写真の顔に対して、正解写真の顔とユークリッド距離の
最小値の顔で入れ替えるやり方(以下はメソッド A と呼ぶ)
• 予備写真の顔に対して、閉眼写真の顔とユークリッド距離の
最小値の顔で入れ替えるやり方(以下はメソッド B と呼ぶ)
• 実験結果の考察では、アンケートを実施した
17
メソッド
A
メソッド
B
自由記述