SlideShare a Scribd company logo
論文読み会
2018 / 10 / 20
システム本部 AIシステム部
AI研究開発第一グループ
葛岡宏祐
■ 渋谷のベンチャー
⁃ 建設 がコンセプトの のアプリを開発
⁃ 芝浦工業大学と共同で図面解析を研究開発
■ に転職
⁃ システム部で主に 関係の技術を開発
■
⁃
⁃
■
⁃ ドライブ
⁃ 海外ドラマ
自己紹介
Facebook: Kousuke Kuzuoka
email: kosuke.kuzuoka@dena.com
論文紹介
■
■ Acquisition of Localization Confidence for Accurate Object Detection
20181020 eccv2018
■ を として推論
■ 新規手法 を提案
■ で を記録
既存検出アルゴリズムのおさらい
■
■
■
■
■
■
既存検出アルゴリズムのおさらい
 
■ で 抽出し で
と の を行う
■ 精度は良いが推論に時間がかかる
 
■ 一回の で と
の推論を行う
■ 事前に を密に定義する
■ 精度が比較的低いが推論時間が早い
既存検出アルゴリズムのおさらい
■
■
■
■
■
■
■
ここ
モチベーション
■ の密な のほとんどが で少数が
であることから学習時の損失が偏ってしまう
■ と重なる が推論に必要なため十分な を定義しなくて
はいけないが の数に比例して学習速度が遅くなる
■ を用いて推論するには多くの ( の大きさ、数、
など)を定義しなくてはいけない
モチベーション
■ の密な のほとんどが で少数が
であることから学習時の損失が偏ってしまう
■ と重なる が推論に必要なため十分な を定義しなくて
はいけないが の数に比例して学習速度が遅くなる
■ を用いて推論するには多くの ( の大きさ、数、
など)を定義しなくてはいけない
SOLVED
角をkey pointとして推論したらいいやん
アルゴリズム
■ 左上と右下の角を推論する を出力させる
■ を推論して の座標を微妙に調整する
■ で角の推論結果をグルーピングして対応づける
アルゴリズム
■ 左上と右下の角を推論する を出力させる
■ を推論して の座標を微妙に調整する
■ で角の推論結果をグルーピングして対応づける
画像に含まれる全
ての物体の右下の
角だけを予測
画像に含まれる全
ての物体の左上の
角だけを予測
アルゴリズム
■ 左上の角を推論する特徴マップを二つ用意しそれぞれに推論されている角
より下と右の値に対してiterativeに最大値を取りassignする
■ 各方向に対してpoolingを行なった後element-wiseに加算を行う
CornerPooling
アルゴリズム
αとβはbalancing
parameterで本論文中
でα=2 β=4に設定
角の推論の損失
Focal lossのvariantと論文中に書いてある
アルゴリズム
■ 左上と右下の角を推論する を出力させる
■ を推論して の座標を微妙に調整する
■ で角の推論結果をグルーピングして対応づける
検出された角座標の
微調整を行う
アルゴリズム
角のOffsetの損失
全てのカテゴリーに
対してのOffset
全てのカテゴリー共通のoffsetだが左上と右下両方
が必要となる
アルゴリズム
■ 左上と右下の角を推論する を出力させる
■ を推論して の座標を微妙に調整する
■ で角の推論結果をグルーピングして対応づける
全ての角に対して
embedding vectorを推
論して角を対応づける
アルゴリズム
■ 各角に対してembedding vectorを推論して対応付けを行う
■ 同じ物体に対して左上と右下の角がclusterの中心に近づくように損失をか
ける
結論・まとめ
■ 既存手法と比較すると高精度だが比較的スピードは遅い(244ms)
■ Two stage detectorと比較すると少し精度で劣る
■ Anchorベースの既存手法が多い中少し変わった手法は興味深い
■ コードは公開済み
https://github.com/umich-vl/CornerNet
Acquisition of Localization Confidence for Accurate Object Detection
Acquisition of Localization Confidence for Accurate Object Detection
■ 検出結果に を として反映させる
■ を提案し を元に推論結果を抑制していく
■ ではなくて で座標を最適化していく
モチベーション
■ 物体検出に使われる の多くは であり
については推論されていない
■ 既存手法で使われている は を元に推論結果を抑制して
いるが正しく されている まで抑制している可能性がある
■ での には単調性がないが に
することによって改善出来る
モチベーション
既存手法のほとんどが を に反映させているが と
の は の方が相関性が高い
モチベーション
が のランクに使われるため上図では緑の推論結果(高い 値)
が抑制されてしまい赤(低い 値)が結果として残ってしまう。
モチベーション
では を増やしても の改善がみられない(上図上)一方
にすることよって改善がみられる(上図下)
■ 対応する と推論結果の の を推論するブランチを追加
■ 推論された で のランキングを行う を使
用
■ では丸め込みが発生するため多少の誤差が生じるが
は誤差が生じない
■ の出力の特徴マップに対して を行う
Localization score
を元に抑制を行う
Classification
scoreのアップ
デート
■ 閾値が高い場合での精度向上が見られるが低い場合ではそれほど精度向
上は見られない
Early stop
criteria
Gradient ascent
■ と同じで閾値が高い場合に精度向上が確認できるが低い場
合ではそれほど向上が見られない
■ が低い場合 の推論精度が比較的低いことが に影響
していると は述べている
精度・速度比較
■ 推論速度は他のモデルと比べると少し遅いが全体を通した の改善は比較
的大きい
まとめ
■ 実装は大変そうだがアイデアは直感的で非常にシンプル
■ のほとんどに提案手法に取り入れることが出来る
■ アルゴリズム上追加アノテーションなどは不要
■ で の実装が公開されている
参考文献
́

More Related Content

Similar to 20181020 eccv2018

コンピュータビジョンの今を映す-CVPR 2017 速報より- (夏のトップカンファレンス論文読み会)
コンピュータビジョンの今を映す-CVPR 2017 速報より- (夏のトップカンファレンス論文読み会)コンピュータビジョンの今を映す-CVPR 2017 速報より- (夏のトップカンファレンス論文読み会)
コンピュータビジョンの今を映す-CVPR 2017 速報より- (夏のトップカンファレンス論文読み会)
cvpaper. challenge
 
Access internal study-session
Access internal study-sessionAccess internal study-session
Access internal study-session
ShimpeiIwamaru
 
進撃の受託開発
進撃の受託開発進撃の受託開発
進撃の受託開発
Koichi ITO
 
JAWSDAYS 2018 LUNCH SESSION
JAWSDAYS 2018 LUNCH SESSIONJAWSDAYS 2018 LUNCH SESSION
JAWSDAYS 2018 LUNCH SESSION
陽平 山口
 
Custom Vision
Custom VisionCustom Vision
Custom Vision
Tomokazu Kizawa
 
Askul internal study-session
Askul internal study-sessionAskul internal study-session
Askul internal study-session
ShimpeiIwamaru
 
XP祭り関西2011 森崎 修司「プラクティスが有効にはたらく前提は明らかになっていますか?」
XP祭り関西2011 森崎 修司「プラクティスが有効にはたらく前提は明らかになっていますか?」XP祭り関西2011 森崎 修司「プラクティスが有効にはたらく前提は明らかになっていますか?」
XP祭り関西2011 森崎 修司「プラクティスが有効にはたらく前提は明らかになっていますか?」
Shuji Morisaki
 
Einsteinvision - object detection を試してみよう
Einsteinvision - object detection を試してみようEinsteinvision - object detection を試してみよう
Einsteinvision - object detection を試してみよう
Salesforce Developers Japan
 
受託開発とRubyGems
受託開発とRubyGems受託開発とRubyGems
受託開発とRubyGems
Koichi ITO
 
Convolutional Neural NetworkとRankNetを用いた画像の順序予測
Convolutional Neural NetworkとRankNetを用いた画像の順序予測Convolutional Neural NetworkとRankNetを用いた画像の順序予測
Convolutional Neural NetworkとRankNetを用いた画像の順序予測
Shogo Suzuki
 
リスク可視化の基本的方法
リスク可視化の基本的方法リスク可視化の基本的方法
リスク可視化の基本的方法
Takayuki Itoh
 
Googleにおける機械学習の活用とクラウドサービス
Googleにおける機械学習の活用とクラウドサービスGoogleにおける機械学習の活用とクラウドサービス
Googleにおける機械学習の活用とクラウドサービス
Google Cloud Platform - Japan
 
Masakazu Sano Tokyowebmining 37 20140621
Masakazu Sano Tokyowebmining 37 20140621Masakazu Sano Tokyowebmining 37 20140621
Masakazu Sano Tokyowebmining 37 20140621
Masakazu Sano
 
論文 Solo Advent Calendar
論文 Solo Advent Calendar論文 Solo Advent Calendar
論文 Solo Advent Calendar
諒介 荒木
 
WWN 20180526
WWN 20180526WWN 20180526
WWN 20180526
陽平 山口
 
可視化法学(Found it project#9)
可視化法学(Found it project#9)可視化法学(Found it project#9)
可視化法学(Found it project#9)
(shibao)芝尾 (kouichiro)幸一郎
 
CMSI計算科学技術特論C (2015) ソフトウェア工学の視点から(前編)
CMSI計算科学技術特論C (2015) ソフトウェア工学の視点から(前編)CMSI計算科学技術特論C (2015) ソフトウェア工学の視点から(前編)
CMSI計算科学技術特論C (2015) ソフトウェア工学の視点から(前編)
Computational Materials Science Initiative
 
最適化の視点から見た人工知能とSENSY社でのリサーチャー育成の取り組み
最適化の視点から見た人工知能とSENSY社でのリサーチャー育成の取り組み最適化の視点から見た人工知能とSENSY社でのリサーチャー育成の取り組み
最適化の視点から見た人工知能とSENSY社でのリサーチャー育成の取り組み
Takashi Okamoto
 
neural architecture search with reinforcement learning
neural architecture search with reinforcement learningneural architecture search with reinforcement learning
neural architecture search with reinforcement learning
Yamato OKAMOTO
 

Similar to 20181020 eccv2018 (20)

コンピュータビジョンの今を映す-CVPR 2017 速報より- (夏のトップカンファレンス論文読み会)
コンピュータビジョンの今を映す-CVPR 2017 速報より- (夏のトップカンファレンス論文読み会)コンピュータビジョンの今を映す-CVPR 2017 速報より- (夏のトップカンファレンス論文読み会)
コンピュータビジョンの今を映す-CVPR 2017 速報より- (夏のトップカンファレンス論文読み会)
 
Access internal study-session
Access internal study-sessionAccess internal study-session
Access internal study-session
 
進撃の受託開発
進撃の受託開発進撃の受託開発
進撃の受託開発
 
JAWSDAYS 2018 LUNCH SESSION
JAWSDAYS 2018 LUNCH SESSIONJAWSDAYS 2018 LUNCH SESSION
JAWSDAYS 2018 LUNCH SESSION
 
Custom Vision
Custom VisionCustom Vision
Custom Vision
 
SOINN PBR
SOINN PBRSOINN PBR
SOINN PBR
 
Askul internal study-session
Askul internal study-sessionAskul internal study-session
Askul internal study-session
 
XP祭り関西2011 森崎 修司「プラクティスが有効にはたらく前提は明らかになっていますか?」
XP祭り関西2011 森崎 修司「プラクティスが有効にはたらく前提は明らかになっていますか?」XP祭り関西2011 森崎 修司「プラクティスが有効にはたらく前提は明らかになっていますか?」
XP祭り関西2011 森崎 修司「プラクティスが有効にはたらく前提は明らかになっていますか?」
 
Einsteinvision - object detection を試してみよう
Einsteinvision - object detection を試してみようEinsteinvision - object detection を試してみよう
Einsteinvision - object detection を試してみよう
 
受託開発とRubyGems
受託開発とRubyGems受託開発とRubyGems
受託開発とRubyGems
 
Convolutional Neural NetworkとRankNetを用いた画像の順序予測
Convolutional Neural NetworkとRankNetを用いた画像の順序予測Convolutional Neural NetworkとRankNetを用いた画像の順序予測
Convolutional Neural NetworkとRankNetを用いた画像の順序予測
 
リスク可視化の基本的方法
リスク可視化の基本的方法リスク可視化の基本的方法
リスク可視化の基本的方法
 
Googleにおける機械学習の活用とクラウドサービス
Googleにおける機械学習の活用とクラウドサービスGoogleにおける機械学習の活用とクラウドサービス
Googleにおける機械学習の活用とクラウドサービス
 
Masakazu Sano Tokyowebmining 37 20140621
Masakazu Sano Tokyowebmining 37 20140621Masakazu Sano Tokyowebmining 37 20140621
Masakazu Sano Tokyowebmining 37 20140621
 
論文 Solo Advent Calendar
論文 Solo Advent Calendar論文 Solo Advent Calendar
論文 Solo Advent Calendar
 
WWN 20180526
WWN 20180526WWN 20180526
WWN 20180526
 
可視化法学(Found it project#9)
可視化法学(Found it project#9)可視化法学(Found it project#9)
可視化法学(Found it project#9)
 
CMSI計算科学技術特論C (2015) ソフトウェア工学の視点から(前編)
CMSI計算科学技術特論C (2015) ソフトウェア工学の視点から(前編)CMSI計算科学技術特論C (2015) ソフトウェア工学の視点から(前編)
CMSI計算科学技術特論C (2015) ソフトウェア工学の視点から(前編)
 
最適化の視点から見た人工知能とSENSY社でのリサーチャー育成の取り組み
最適化の視点から見た人工知能とSENSY社でのリサーチャー育成の取り組み最適化の視点から見た人工知能とSENSY社でのリサーチャー育成の取り組み
最適化の視点から見た人工知能とSENSY社でのリサーチャー育成の取り組み
 
neural architecture search with reinforcement learning
neural architecture search with reinforcement learningneural architecture search with reinforcement learning
neural architecture search with reinforcement learning
 

20181020 eccv2018