SlideShare a Scribd company logo
1 of 31
Download to read offline
Convolutional Pose Machines
@conta_
緒方 貴紀 (twitter: @conta_)
CTO@ABEJA, Inc.
Computer Visionとか、Machine Learningを使った
プロダクト開発をやっています。
Self Introduction
Pose Estimation?
Related Work
Pictorial structures Hierarchical models
Sequential prediction Convolutional architectures
[A. Toshev and C. Szegedy, CVPR’2013]
[Tian et al., ICCV’2011][Mykhaylo et al., CVPR’2009]
[Ramakrishna et al., 2014]
Related Work
Pictorial structures Hierarchical models
Sequential prediction Convolutional architectures
[A. Toshev and C. Szegedy, CVPR’2013]
[Tian et al., ICCV’2011][Mykhaylo et al., CVPR’2009]
[Ramakrishna et al., 2014]
Pose Machines?
Confidence Maps
[Ramakrishna et al., 2014]
Pose Machines
[Ramakrishna et al., 2014]
パッチから特徴量を抽出し、各Parts or NotのClassifier
を用いて、Confidence Mapsを作りたい
Pose Machines
[Ramakrishna et al., 2014]
局所的な特徴を用いた推定はWeak
Partsによっては、局所的特徴だど推定できない。。。
Part Contextは非常に有効な特徴
Pose Machines
[Ramakrishna et al., 2014]
前段階での推定結果を用いて、各Partsの関係性を
事前情報無しにを活用出来ないか?
Pose Machines
Stage I Confidence
Head Neck L-Shoulder L-Elbow L-Wrist
g2g1 g3
Context
Features
Context
Features
Stage I
Confidence Maps
Stage II
Confidence Maps
Stage III
Confidence Maps
Image
Features
[Ramakrishna et al., 2014]
Pose Machines
Stage II Confidence
g2g1 g3
Context
Features
Context
Features
Stage I
Confidence Maps
Stage II
Confidence Maps
Stage III
Confidence Maps
Image
Features
Head Neck L-Shoulder L-Elbow L-Wrist
[Ramakrishna et al., 2014]
Pose Machines
Stage III Confidence
Head Neck L-Shoulder L-Elbow L-Wrist
g2g1 g3
Context
Features
Context
Features
Stage I
Confidence Maps
Stage II
Confidence Maps
Stage III
Confidence Maps
Image
Features
Head Neck L-Shoulder L-Elbow L-Wrist
[Ramakrishna et al., 2014]
Pose Machines
Stage III Confidence
Head Neck L-Shoulder L-Elbow L-Wrist
g2g1 g3
Context
Features
Context
Features
Stage I
Confidence Maps
Stage II
Confidence Maps
Stage III
Confidence Maps
Image
Features
Head Neck L-Shoulder L-Elbow L-Wrist
[Ramakrishna et al., 2014]
Pose Machines (Previous Work)
Pose Machines (Previous Work)
HoG Random Forests
Convolutional Pose Machines (CPM)
Deep Deep
Architecture of CPM
階層的なCNNによるPose Machinesの実現
Stage1
Stage1: Localな特徴量の学習
368x368のInputに対して160x160の範囲をカバー
各Parts + BackgroundのConfidence Maps (P+1)
*MPII Human Pose Datasetだと P=14
Outputs
Stage 2
Stage2: Localな特徴量 + Part Contextによる学習
Stage T
Stage2と同じ構成のネットワークを積み上げていく
*本研究ではStage6まで積み上げる
各StageのConfidence Mapsと教師データとのEuclidean Distance Loss
教師データ: 各PartsのGround truth locationからGaussian Peakを計算したもの
Loss Function
Stage2以降、全段階のConfidence Mapのおかげで
良い推定ができている
Spatial context from belief maps
3つのDatasetsで実験
- MPII Human Pose Dataset
- Leeds Sports Pose (LSP) Datase
- FLIC Dataset
Experiments
Results
Results
Stageは積み上げるとイイんやで
Results
Pose Machinesを上回る精度
Stageを重ねるごとに精度は向上
Results
State-of-the-art Performance (ドヤァ
実装してみた
1. (色々頑張って実験した結果)いい感じの連続構成
CNNによって、暗黙的な空間モデルの学習ができた
2. Graphical Modelによる推論無しに、階層構造の
Predictionができた
Conclusion
We are hiring!
→ https://www.wantedly.com/
companies/abeja
博士持ち大歓迎!

More Related Content

More from Takanori Ogata

More from Takanori Ogata (11)

190410 ML@LOFT
190410 ML@LOFT190410 ML@LOFT
190410 ML@LOFT
 
180204 Attention-aware Deep Reinforcement Learning for Video Face Recognition
180204 Attention-aware Deep Reinforcement Learning for Video Face Recognition180204 Attention-aware Deep Reinforcement Learning for Video Face Recognition
180204 Attention-aware Deep Reinforcement Learning for Video Face Recognition
 
Unsupervised learning of object landmarks by factorized spatial embeddings
Unsupervised learning of object landmarks by factorized spatial embeddingsUnsupervised learning of object landmarks by factorized spatial embeddings
Unsupervised learning of object landmarks by factorized spatial embeddings
 
Annotating object instances with a polygon rnn
Annotating object instances with a polygon rnnAnnotating object instances with a polygon rnn
Annotating object instances with a polygon rnn
 
Training object class detectors with click supervision
Training object class detectors with click supervisionTraining object class detectors with click supervision
Training object class detectors with click supervision
 
SSD: Single Shot MultiBox Detector (ECCV2016)
SSD: Single Shot MultiBox Detector (ECCV2016)SSD: Single Shot MultiBox Detector (ECCV2016)
SSD: Single Shot MultiBox Detector (ECCV2016)
 
160924 Deep Learning Tuningathon
160924 Deep Learning Tuningathon160924 Deep Learning Tuningathon
160924 Deep Learning Tuningathon
 
Deep Learningライブラリ 色々つかってみた感想まとめ
Deep Learningライブラリ 色々つかってみた感想まとめDeep Learningライブラリ 色々つかってみた感想まとめ
Deep Learningライブラリ 色々つかってみた感想まとめ
 
Cv20160205
Cv20160205Cv20160205
Cv20160205
 
10分でわかる主成分分析(PCA)
10分でわかる主成分分析(PCA)10分でわかる主成分分析(PCA)
10分でわかる主成分分析(PCA)
 
DeepAKB
DeepAKBDeepAKB
DeepAKB
 

Recently uploaded

Recently uploaded (7)

NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 

Convolutional Pose Machines