SlideShare a Scribd company logo
Oct 10th, 2019
Tatsuya Shirakawa
Retail Face Analysis
Inside-Out
Tatsuya Shirakawa
2
ABEJA, Inc. (Researcher)
- Deep Learning (CV, Graph, NLP, )
- Machine Learning
Github https://github.com/TatsuyaShirakawa
NTT Data Mathematical Systems Inc.
- Mathematical Optimization
- Machine Learning / Deep Learning
Math.
Tech blog http://tech-blog.abeja.asia/
- 異空間への埋め込み!Poincare Embeddingsが拓く表現学習の新展開
- 機は熟した!グラフ構造に対するDeep Learning、Graph Convolutionのご紹介
- 双曲空間でのMachine Learningの最近の進展
- より良い機械学習のためのアノテーションの機械学習
Now
LabsのResearcherの仕事
1. イケててヤバい新規事業の創出
2. 新しい技術や領域にたいするチャレンジ
3. 深い理解にもとづくコアモデル・アルゴリズムの開発
4. 社内外相談役
…
3
今回は、ABEJA Insight for Retailの
顔認識・デモグラ推定技術
についてResearcherの⽴場からお話します。
4
Face Analysis
5
Face Analysis
6
主な提供機能
1.顔からの年齢性別推定(デモグラ)
2.顔からの⼈物推定(リピーター)
Face AnalysisのInput/Outputイメージ
7
z
Input Video
[0] Male, 25 years old, New
[1] Male, 30 years old, Repeater
[2] Male, 24 years old, Repeater
?
Face Analysis Flow
8※ subtle modification for ease of explanation
Camera
Dashboard
Analysis Core
Cloud System
Face Journey
9
Input Video
Detection
& Tracking
Tracks
Scoring
& Filtering
Filtered Tracks
=
x x
x
x
x
x x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
Embedding
0 10 20 30 40 50 60 70
♂
♂
♂
♂
♂
♂
♂
Gender & Age
Prediction
[0] Male, 25 years old, New
[1] Male, 30 years old, Repeater
[2] Male, 24 years old, Repeater
Result
Aggregate
XX
XX X
XXXXXX
X X X XX
X
※ subtle modification for ease of explanation
Detection & Tracking
10
Input Video
Detection
& Tracking
Tracks
Scoring
& Filtering
Filtered Tracks
=
XX
XX X
XXXXXX
X X X XX
X x x
x
x
x
x x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
Embedding
0 10 20 30 40 50 60 70
♂
♂
♂
♂
♂
♂
♂
Gender & Age
Prediction
[0] Male, 25 years old, New
[1] Male, 30 years old, Repeater
[2] Male, 24 years old, Repeater
Result
Integrate
⼊⼒動画から顔を検出し、連続フレーム間の同⼀⼈物の顔を
連結する(トラッキング)
難しさ
• 顔をなるべく⾼速にもれなく検出する
• 顔ではないものを検出しない
• ⾮⽣体由来の顔(ポスター、サイネージ)に反応しない
• トラッキング時、かならず同⼀⼈物同⼠を結びつける
• トラックをむやみにぶつ切りにしない
11※ 本番はMovieでした。
12
Track = 同⼀⼈物の連続した顔の系列
いろんな品質の顔画像が混ざっている…
Face Journey
13
Input Video
Detection
& Tracking
Tracks
Scoring
& Filtering
Filtered Tracks
=
x x
x
x
x
x x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
Embedding
0 10 20 30 40 50 60 70
♂
♂
♂
♂
♂
♂
♂
Gender & Age
Prediction
[0] Male, 25 years old, New
[1] Male, 30 years old, Repeater
[2] Male, 24 years old, Repeater
Result
Aggregate
XX
XX X
XXXXXX
X X X XX
X
※ subtle modification for ease of explanation
Scoring & Filtering
14
z
Input Video
Detection
& Tracking
Tracks
Scoring
& Filtering
Filtered Tracks
=
x x
x
x
x
x x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
Embedding
0 10 20 30 40 50 60 70
♂
♂
♂
♂
♂
♂
♂
Gender & Age
Prediction
[0] Male, 25 years old, New
[1] Male, 30 years old, Repeater
[2] Male, 24 years old, Repeater
Result
Integrate
顔画像の品質を計算し、認識に不向きな顔画像
を除外する。
XX
XX X
XXXXXX
X X X XX
X
研究の蓄積がすくなく、アプリケーションに応じて
独⾃に⽅法を考案する必要がある。。。
そもそもよい顔ってなに?
• 正⾯向き?
• オクルージョンしてない?
• ノイズが乗っていない?
• 変顔してない?
…
考案⼿法 Error Regression Networks (ERNs) ※ 未発表
顔認識モデルの認識誤差を予測するモデル
「そのモデルを適⽤したときに、どれくらい誤差が出てしまうか?」
「良い顔」にたいする複雑で多様なルールが不要で、かつ、
追加のアノテーションなしで半⾃動的にスコアリングを学習することが可能
15
ERNsの中⾝
顔認識の場合は下記の2点間の距離を回帰するモデル。
(1) 与えられた顔画像のEmbedding(後述)
(2) 顔画像が表す⼈物の全顔画像のEmbeddingから求めた中⼼ベクター
16
観察
Large distortion ⇔ Noisy
• 経験的には⼩さいモデルで⼗分
• 追加の教師データ不要(顔認識データセットがあればよい)
• 顔認識にとって最適化された品質推定が可能
ERNs on VGGFace2
17
Q. Cao+, “VGGFace2: A dataset for recognising face across pose and age”, 2018
18
ERNによるスコアリング(lower is better)
19
品質の低い顔(e.g. > 0.95)を除外する
Face Journey
20
Input Video
Detection
& Tracking
Tracks
Scoring
& Filtering
Filtered Tracks
=
x x
x
x
x
x x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
Embedding
0 10 20 30 40 50 60 70
♂
♂
♂
♂
♂
♂
♂
Gender & Age
Prediction
[0] Male, 25 years old, New
[1] Male, 30 years old, Repeater
[2] Male, 24 years old, Repeater
Result
Aggregate
XX
XX X
XXXXXX
X X X XX
X
※ subtle modification for ease of explanation
Embedding
21
z
Input Video
Detection
& Tracking
Tracks
Scoring
& Filtering
Filtered Tracks
=
x x
x
x
x
x x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
Embedding
0 10 20 30 40 50 60 70
♂
♂
♂
♂
♂
♂
♂
Gender & Age
Prediction
[0] Male, 25 years old, New
[1] Male, 30 years old, Repeater
[2] Male, 24 years old, Repeater
Result
Integrate
顔画像から特徴ベクター(e.g. 128次元、512次元)を抽出する。
XX
XX X
XXXXXX
X X X XX
X
難しさ
• 異なる⼈物からの⼤量の顔画像が必要
• ⼀般に、⼤きなモデルのほうが精度が出やすく、取り回しが悪い
• 精度のよいデータセットを作るのが困難
あとで顔認識については深堀りするので、
いったん全体図を説明します。
22
Face Journey
23
Input Video
Detection
& Tracking
Tracks
Scoring
& Filtering
Filtered Tracks
=
x x
x
x
x
x x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
Embedding
0 10 20 30 40 50 60 70
♂
♂
♂
♂
♂
♂
♂
Gender & Age
Prediction
[0] Male, 25 years old, New
[1] Male, 30 years old, Repeater
[2] Male, 24 years old, Repeater
Result
Aggregate
XX
XX X
XXXXXX
X X X XX
X
※ subtle modification for ease of explanation
Gender Age Prediction
24
z
Input Video
Detection
& Tracking
Tracks
Scoring
& Filtering
Filtered Tracks
=
x x
x
x
x
x x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
Embedding
0 10 20 30 40 50 60 70
♂
♂
♂
♂
♂
♂
♂
Gender & Age
Prediction
[0] Male, 25 years old, New
[1] Male, 30 years old, Repeater
[2] Male, 24 years old, Repeater
Result
Integrate
顔画像から年齢性別を推定するXX
XX X
XXXXXX
X X X XX
X
難しさ
• 実的年齢か⾒た⽬年齢か
• ⾒た⽬年齢アノテーションは困難
• 実的年齢付きデータの取得は困難
• 顔だけから推定する難しさ
• 研究として最近流⾏ってない…
実年齢 vs ⾒た⽬年齢
20台半ばを中⼼に、実年齢 - ⾒た⽬の正負の⼊れ替わりが起きる?
(アノテーションの認知バイアス)
25
APPA-REALを解析 (http://chalearnlap.cvc.uab.es/dataset/26/description/)
年齢性別推定については
他にも楽しい話題はありますが、
時間の関係で割愛します。。。
26
https://www.slideshare.net/daynap1204/ss-148900621
興味がある⽅はこちら
Face Journey
27
Input Video
Detection
& Tracking
Tracks
Scoring
& Filtering
Filtered Tracks
=
x x
x
x
x
x x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
Embedding
0 10 20 30 40 50 60 70
♂
♂
♂
♂
♂
♂
♂
Gender & Age
Prediction
[0] Male, 25 years old, New
[1] Male, 30 years old, Repeater
[2] Male, 24 years old, Repeater
Result
Aggregate
XX
XX X
XXXXXX
X X X XX
X
※ subtle modification for ease of explanation
Aggregating Multiple Predictions
28
z
Input Video
Detection
& Tracking
Tracks
Scoring
& Filtering
Filtered Tracks
=
XX
XX X
XXXXXX
X X X XX
X x x
x
x
x
x x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
Embedding
0 10 20 30 40 50 60 70
♂
♂
♂
♂
♂
♂
♂
Gender & Age
Prediction
[0] Male, 25 years old, New
[1] Male, 30 years old, Repeater
[2] Male, 24 years old, Repeater
Result
Aggregate
顔Embedding、年齢性別推定結果のマージ
ヒューリスティックになりがち。
可能なら論理的に整合性のとれた⽅法でマージしたい。
(後述のvMF分布の存在を想定するなど)
Embeddingのあれこれ
29
Embedding(再掲)
30
z
Input Video
Detection
& Tracking
Tracks
Scoring
& Filtering
Filtered Tracks
=
x x
x
x
x
x x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
Embedding
0 10 20 30 40 50 60 70
♂
♂
♂
♂
♂
♂
♂
Gender & Age
Prediction
[0] Male, 25 years old, New
[1] Male, 30 years old, Repeater
[2] Male, 24 years old, Repeater
Result
Integrate
顔画像から特徴ベクター(e.g. 128次元、512次元)を抽出する。
XX
XX X
XXXXXX
X X X XX
X
難しさ
• 異なる⼈物からの⼤量の顔画像が必要
• ⼀般に、⼤きなモデルのほうが精度が出やすく、取り回しが悪い
• 精度のよいデータセットを作るのが困難
ArcFace
J. Deng+, “ArcFace: Additive Angular Margin Loss for Deep Face Recognition”, 2018
顔画像の球⾯へ埋め込んだ後、⾮ターゲットクラスと間のマージンを加味しつつ
⼈物識別学習を⾏うことで⾼精度のEmbeddingを得ることができる。
31
ArcFace
通常のCross Entropy Loss
ArcFaceはTarget Class以外のClassとの間にマージンを考慮する
32
ArcFace
33
https://paperswithcode.com/sota/face-verification-on-labeled-faces-in-the
[再現実験] ArcFace — だいたい論⽂通り
34
※ ResNet101は1回の学習にDGX-1で32GのGPU8並列で1⽇超かかる…
AdaCos = ArcFaceのハイパラ⾃動チューニング😝
X. Zhang+, “AdaCos: Adaptively Scaling Cosine Logits for Effectively Learning Deep Face Representations”, 2019
Fixed AdaCos マージンm = 0, スケールs = √2 log (クラス数 - 1)
Dynamic AdaCos m, sを学習中のstatsを⽤いて動的設定
35
[再現実験] AdaCosダメだった。。。
36
何度も試したが、全然再現できない。。。
ハイパーパラメータもないので、ガチャ要
素は(そんなに)ないはず。。。
EfficientNet 😝
M. Tan+, “EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks”, 2019
37
ResNetなどの数分の1のパラメータ数で
ResNetを凌ぐ精度を達成!!
EfficientNetの考え⽅
1. (a) ⼊⼒画像の解像度、 (b) 各層のチャンネル/次元数、(c) 層数
の最適なバランスを、⼩さいネットワークで探索する
2. ⾒つかった(a-c)の最適なバランスを保ったまま(a-c)をスケールアップしていく
38
[再現実験] EfficientNet — 全然精度が出ない…😥
Benchmarking Facial Recognition Models (https://abeja.docbase.io/posts/797939)
39
オリジナルの画像サイズ(224x224)から
速度的な理由でサイズを減らして実験。
論⽂が出た翌⽇くらいから3週間くらい
パラメータなどをいじくったりネットワーク
を微調整したりして試したが、全く精度が
でない。
※ ⼊⼒画像サイズを224x224にすると
そこそこ精度は出る。
画像サイズに最適化されてるんじゃないか疑惑
40
※ 縦横2倍 = 計算量4倍なので、画像サイズを⼤きくするのは、結構タブー
閑話休題 Rethinking — 球⾯Embeddings
球⾯へのEmbeddingをするのは、⼀体何をしているのか?
この定式化は何を意味しているのか?
41
→ 各⼈物の中⼼点が球⾯に分布し、その点を中⼼にした
von Mises Fisher分布で顔画像のEmbeddingsが発⽣している確率モデル!
Rethinking — 球⾯Embeddings
von-Mises Fisher分布
点の発⽣確率は空間の中⼼点μとの内積から定まる、とする分布。
正規分布の球⾯版(μ = 中⼼/平均、s = 集中度/分散の逆数)
42
x x
x
x
x
x x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
μ
p(x|y; , µ, s) = C(sy) exp syµT
y f (x)<latexit sha1_base64="VswAyNHzYd5iLP4iwvjdBdBAVMQ=">AAADiHicdZFdb9MwFIadhY9Rvjq45OaIaVIrocoZlBahSdN2w+WQ1m5SXSLHdVpvsRPZDjRE4b/wi7jm3+B0LbSssxTpnOec18c5b5QlwliMf3s7/r37Dx7uPmo8fvL02fPm3ouhSXPN+IClSaovI2p4IhQfWGETfplpTmWU8Ivo+rSuX3zl2ohUndsi42NJp0rEglHrUNj8lbWIpHYWxeW8AuJaLRQfYcVINhPVm3+pzNcyU7XhCE5bJizaQPg8A5Lw2Nb5hiIsvpxDHG7cCWtjnViL6cy2Gweu3YmPgMSaspKYXIZlEQpHigrmoahKMqyfeLsCi0IVNvdxJwhwD3cBd3C//x5jF7zFQfewC0EHL84+Wp6zcM/7SSYpyyVXliXUmFGAMzsurwzVVrCEVw2SG55Rdk2nfORCRSU343Kx+woOHJlAnGr3KQsLuq4oqTSmkJHrrH/Y/F+r4bbaKLdxf1wKleWWK3YzKM4TsCnURsJEaM5sUriAMi3cW4HNqFubdXY3iOLfWColVZOSUD2VdO52V09Js5JoCY79qCFJhBTWVLcVQm1ROLhd4e5y+Dvf1Pyld4iE2iZa0ZXImbpyDu4OhoedwHn/+d3+8cnS3l30Cr1GLRSgHjpGn9AZGiDmdb2RN/G43/Cx3/M/3LTueEvNS7Rx/JM/Kgwr/w==</latexit><latexit sha1_base64="VswAyNHzYd5iLP4iwvjdBdBAVMQ=">AAADiHicdZFdb9MwFIadhY9Rvjq45OaIaVIrocoZlBahSdN2w+WQ1m5SXSLHdVpvsRPZDjRE4b/wi7jm3+B0LbSssxTpnOec18c5b5QlwliMf3s7/r37Dx7uPmo8fvL02fPm3ouhSXPN+IClSaovI2p4IhQfWGETfplpTmWU8Ivo+rSuX3zl2ohUndsi42NJp0rEglHrUNj8lbWIpHYWxeW8AuJaLRQfYcVINhPVm3+pzNcyU7XhCE5bJizaQPg8A5Lw2Nb5hiIsvpxDHG7cCWtjnViL6cy2Gweu3YmPgMSaspKYXIZlEQpHigrmoahKMqyfeLsCi0IVNvdxJwhwD3cBd3C//x5jF7zFQfewC0EHL84+Wp6zcM/7SSYpyyVXliXUmFGAMzsurwzVVrCEVw2SG55Rdk2nfORCRSU343Kx+woOHJlAnGr3KQsLuq4oqTSmkJHrrH/Y/F+r4bbaKLdxf1wKleWWK3YzKM4TsCnURsJEaM5sUriAMi3cW4HNqFubdXY3iOLfWColVZOSUD2VdO52V09Js5JoCY79qCFJhBTWVLcVQm1ROLhd4e5y+Dvf1Pyld4iE2iZa0ZXImbpyDu4OhoedwHn/+d3+8cnS3l30Cr1GLRSgHjpGn9AZGiDmdb2RN/G43/Cx3/M/3LTueEvNS7Rx/JM/Kgwr/w==</latexit><latexit sha1_base64="VswAyNHzYd5iLP4iwvjdBdBAVMQ=">AAADiHicdZFdb9MwFIadhY9Rvjq45OaIaVIrocoZlBahSdN2w+WQ1m5SXSLHdVpvsRPZDjRE4b/wi7jm3+B0LbSssxTpnOec18c5b5QlwliMf3s7/r37Dx7uPmo8fvL02fPm3ouhSXPN+IClSaovI2p4IhQfWGETfplpTmWU8Ivo+rSuX3zl2ohUndsi42NJp0rEglHrUNj8lbWIpHYWxeW8AuJaLRQfYcVINhPVm3+pzNcyU7XhCE5bJizaQPg8A5Lw2Nb5hiIsvpxDHG7cCWtjnViL6cy2Gweu3YmPgMSaspKYXIZlEQpHigrmoahKMqyfeLsCi0IVNvdxJwhwD3cBd3C//x5jF7zFQfewC0EHL84+Wp6zcM/7SSYpyyVXliXUmFGAMzsurwzVVrCEVw2SG55Rdk2nfORCRSU343Kx+woOHJlAnGr3KQsLuq4oqTSmkJHrrH/Y/F+r4bbaKLdxf1wKleWWK3YzKM4TsCnURsJEaM5sUriAMi3cW4HNqFubdXY3iOLfWColVZOSUD2VdO52V09Js5JoCY79qCFJhBTWVLcVQm1ROLhd4e5y+Dvf1Pyld4iE2iZa0ZXImbpyDu4OhoedwHn/+d3+8cnS3l30Cr1GLRSgHjpGn9AZGiDmdb2RN/G43/Cx3/M/3LTueEvNS7Rx/JM/Kgwr/w==</latexit><latexit sha1_base64="VswAyNHzYd5iLP4iwvjdBdBAVMQ=">AAADiHicdZFdb9MwFIadhY9Rvjq45OaIaVIrocoZlBahSdN2w+WQ1m5SXSLHdVpvsRPZDjRE4b/wi7jm3+B0LbSssxTpnOec18c5b5QlwliMf3s7/r37Dx7uPmo8fvL02fPm3ouhSXPN+IClSaovI2p4IhQfWGETfplpTmWU8Ivo+rSuX3zl2ohUndsi42NJp0rEglHrUNj8lbWIpHYWxeW8AuJaLRQfYcVINhPVm3+pzNcyU7XhCE5bJizaQPg8A5Lw2Nb5hiIsvpxDHG7cCWtjnViL6cy2Gweu3YmPgMSaspKYXIZlEQpHigrmoahKMqyfeLsCi0IVNvdxJwhwD3cBd3C//x5jF7zFQfewC0EHL84+Wp6zcM/7SSYpyyVXliXUmFGAMzsurwzVVrCEVw2SG55Rdk2nfORCRSU343Kx+woOHJlAnGr3KQsLuq4oqTSmkJHrrH/Y/F+r4bbaKLdxf1wKleWWK3YzKM4TsCnURsJEaM5sUriAMi3cW4HNqFubdXY3iOLfWColVZOSUD2VdO52V09Js5JoCY79qCFJhBTWVLcVQm1ROLhd4e5y+Dvf1Pyld4iE2iZa0ZXImbpyDu4OhoedwHn/+d3+8cnS3l30Cr1GLRSgHjpGn9AZGiDmdb2RN/G43/Cx3/M/3LTueEvNS7Rx/JM/Kgwr/w==</latexit>
Rethinking — 球⾯Embeddings
von-Mises Fisher分布
点の発⽣確率は空間の中⼼点μとの内積から定まる、とする分布。
正規分布の球⾯版(μ = 中⼼/平均、s = 集中度/分散の逆数)
μ, sの推定量は容易に求めることができる。
例) μの推定量は平均の球⾯射影。
43
μ
p(x|y; , µ, s) = C(sy) exp syµT
y f (x)<latexit sha1_base64="VswAyNHzYd5iLP4iwvjdBdBAVMQ=">AAADiHicdZFdb9MwFIadhY9Rvjq45OaIaVIrocoZlBahSdN2w+WQ1m5SXSLHdVpvsRPZDjRE4b/wi7jm3+B0LbSssxTpnOec18c5b5QlwliMf3s7/r37Dx7uPmo8fvL02fPm3ouhSXPN+IClSaovI2p4IhQfWGETfplpTmWU8Ivo+rSuX3zl2ohUndsi42NJp0rEglHrUNj8lbWIpHYWxeW8AuJaLRQfYcVINhPVm3+pzNcyU7XhCE5bJizaQPg8A5Lw2Nb5hiIsvpxDHG7cCWtjnViL6cy2Gweu3YmPgMSaspKYXIZlEQpHigrmoahKMqyfeLsCi0IVNvdxJwhwD3cBd3C//x5jF7zFQfewC0EHL84+Wp6zcM/7SSYpyyVXliXUmFGAMzsurwzVVrCEVw2SG55Rdk2nfORCRSU343Kx+woOHJlAnGr3KQsLuq4oqTSmkJHrrH/Y/F+r4bbaKLdxf1wKleWWK3YzKM4TsCnURsJEaM5sUriAMi3cW4HNqFubdXY3iOLfWColVZOSUD2VdO52V09Js5JoCY79qCFJhBTWVLcVQm1ROLhd4e5y+Dvf1Pyld4iE2iZa0ZXImbpyDu4OhoedwHn/+d3+8cnS3l30Cr1GLRSgHjpGn9AZGiDmdb2RN/G43/Cx3/M/3LTueEvNS7Rx/JM/Kgwr/w==</latexit><latexit sha1_base64="VswAyNHzYd5iLP4iwvjdBdBAVMQ=">AAADiHicdZFdb9MwFIadhY9Rvjq45OaIaVIrocoZlBahSdN2w+WQ1m5SXSLHdVpvsRPZDjRE4b/wi7jm3+B0LbSssxTpnOec18c5b5QlwliMf3s7/r37Dx7uPmo8fvL02fPm3ouhSXPN+IClSaovI2p4IhQfWGETfplpTmWU8Ivo+rSuX3zl2ohUndsi42NJp0rEglHrUNj8lbWIpHYWxeW8AuJaLRQfYcVINhPVm3+pzNcyU7XhCE5bJizaQPg8A5Lw2Nb5hiIsvpxDHG7cCWtjnViL6cy2Gweu3YmPgMSaspKYXIZlEQpHigrmoahKMqyfeLsCi0IVNvdxJwhwD3cBd3C//x5jF7zFQfewC0EHL84+Wp6zcM/7SSYpyyVXliXUmFGAMzsurwzVVrCEVw2SG55Rdk2nfORCRSU343Kx+woOHJlAnGr3KQsLuq4oqTSmkJHrrH/Y/F+r4bbaKLdxf1wKleWWK3YzKM4TsCnURsJEaM5sUriAMi3cW4HNqFubdXY3iOLfWColVZOSUD2VdO52V09Js5JoCY79qCFJhBTWVLcVQm1ROLhd4e5y+Dvf1Pyld4iE2iZa0ZXImbpyDu4OhoedwHn/+d3+8cnS3l30Cr1GLRSgHjpGn9AZGiDmdb2RN/G43/Cx3/M/3LTueEvNS7Rx/JM/Kgwr/w==</latexit><latexit sha1_base64="VswAyNHzYd5iLP4iwvjdBdBAVMQ=">AAADiHicdZFdb9MwFIadhY9Rvjq45OaIaVIrocoZlBahSdN2w+WQ1m5SXSLHdVpvsRPZDjRE4b/wi7jm3+B0LbSssxTpnOec18c5b5QlwliMf3s7/r37Dx7uPmo8fvL02fPm3ouhSXPN+IClSaovI2p4IhQfWGETfplpTmWU8Ivo+rSuX3zl2ohUndsi42NJp0rEglHrUNj8lbWIpHYWxeW8AuJaLRQfYcVINhPVm3+pzNcyU7XhCE5bJizaQPg8A5Lw2Nb5hiIsvpxDHG7cCWtjnViL6cy2Gweu3YmPgMSaspKYXIZlEQpHigrmoahKMqyfeLsCi0IVNvdxJwhwD3cBd3C//x5jF7zFQfewC0EHL84+Wp6zcM/7SSYpyyVXliXUmFGAMzsurwzVVrCEVw2SG55Rdk2nfORCRSU343Kx+woOHJlAnGr3KQsLuq4oqTSmkJHrrH/Y/F+r4bbaKLdxf1wKleWWK3YzKM4TsCnURsJEaM5sUriAMi3cW4HNqFubdXY3iOLfWColVZOSUD2VdO52V09Js5JoCY79qCFJhBTWVLcVQm1ROLhd4e5y+Dvf1Pyld4iE2iZa0ZXImbpyDu4OhoedwHn/+d3+8cnS3l30Cr1GLRSgHjpGn9AZGiDmdb2RN/G43/Cx3/M/3LTueEvNS7Rx/JM/Kgwr/w==</latexit><latexit sha1_base64="VswAyNHzYd5iLP4iwvjdBdBAVMQ=">AAADiHicdZFdb9MwFIadhY9Rvjq45OaIaVIrocoZlBahSdN2w+WQ1m5SXSLHdVpvsRPZDjRE4b/wi7jm3+B0LbSssxTpnOec18c5b5QlwliMf3s7/r37Dx7uPmo8fvL02fPm3ouhSXPN+IClSaovI2p4IhQfWGETfplpTmWU8Ivo+rSuX3zl2ohUndsi42NJp0rEglHrUNj8lbWIpHYWxeW8AuJaLRQfYcVINhPVm3+pzNcyU7XhCE5bJizaQPg8A5Lw2Nb5hiIsvpxDHG7cCWtjnViL6cy2Gweu3YmPgMSaspKYXIZlEQpHigrmoahKMqyfeLsCi0IVNvdxJwhwD3cBd3C//x5jF7zFQfewC0EHL84+Wp6zcM/7SSYpyyVXliXUmFGAMzsurwzVVrCEVw2SG55Rdk2nfORCRSU343Kx+woOHJlAnGr3KQsLuq4oqTSmkJHrrH/Y/F+r4bbaKLdxf1wKleWWK3YzKM4TsCnURsJEaM5sUriAMi3cW4HNqFubdXY3iOLfWColVZOSUD2VdO52V09Js5JoCY79qCFJhBTWVLcVQm1ROLhd4e5y+Dvf1Pyld4iE2iZa0ZXImbpyDu4OhoedwHn/+d3+8cnS3l30Cr1GLRSgHjpGn9AZGiDmdb2RN/G43/Cx3/M/3LTueEvNS7Rx/JM/Kgwr/w==</latexit>
µy =
P
yi=y xi
k
P
yi=y xik
<latexit sha1_base64="DY7ikL8+aI74xx0WsEcjQryAVOs=">AAADo3icfZJtb9MwEMedhYdRnjp4yRuLqlIrocoZlFVCSBN7g8SbgtpuUl0ix3VaM9uJbGc0RAG+Ch+Lr8CnwOla1kLHSZHu/ne/u5MvUSq4sQj99Pb8Gzdv3d6/U7t77/6Dh/WDRyOTZJqyIU1Eos8iYpjgig0tt4KdpZoRGQl2Gp2fVPnTC6YNT9TA5imbSDJTPOaUWCeF9V/NtIUlsfMoLhYlxK7WwvwVXGs4nfPy2VUos43IlG34Gp60TJi3IWaLFGLBYlvFW0SYfxzAONzqCTfGOljz2dy2a9uUa45jTWiBTSbDIg+5U/ISXpEhLws8qnb+TwlcVpRhvYE6QYCOUBeiDur1XiLknOco6B52YdBBS2uAlfXDA+8HniY0k0xZKogx4wCldlJ8MkRbTgUrazgzLCX0nMzY2LmKSGYmxfIsJWw6ZQrjRLtPWbhUN4mCSGNyGbnKalvzd64Sd+XGmY17k4KrNLNM0ctBcSagTWB1YzjlmlErcucQqrnbFdI5cQ9p3Z9Qw4p9pomURE0LTPRMkoV7xGpKkhZYS+i0r5WIBZfcmvJfgqsdhBN3E66Xk7+wbeaPeg3E1S5ora4hd9T15eD1zuiwE7jbv3/ROH6zOu8+eAKeghYIwBE4Bm9BHwwB9frehffN++43/Xf+B39wWbrnrZjHYMv8yW9Ovzhf</latexit><latexit sha1_base64="DY7ikL8+aI74xx0WsEcjQryAVOs=">AAADo3icfZJtb9MwEMedhYdRnjp4yRuLqlIrocoZlFVCSBN7g8SbgtpuUl0ix3VaM9uJbGc0RAG+Ch+Lr8CnwOla1kLHSZHu/ne/u5MvUSq4sQj99Pb8Gzdv3d6/U7t77/6Dh/WDRyOTZJqyIU1Eos8iYpjgig0tt4KdpZoRGQl2Gp2fVPnTC6YNT9TA5imbSDJTPOaUWCeF9V/NtIUlsfMoLhYlxK7WwvwVXGs4nfPy2VUos43IlG34Gp60TJi3IWaLFGLBYlvFW0SYfxzAONzqCTfGOljz2dy2a9uUa45jTWiBTSbDIg+5U/ISXpEhLws8qnb+TwlcVpRhvYE6QYCOUBeiDur1XiLknOco6B52YdBBS2uAlfXDA+8HniY0k0xZKogx4wCldlJ8MkRbTgUrazgzLCX0nMzY2LmKSGYmxfIsJWw6ZQrjRLtPWbhUN4mCSGNyGbnKalvzd64Sd+XGmY17k4KrNLNM0ctBcSagTWB1YzjlmlErcucQqrnbFdI5cQ9p3Z9Qw4p9pomURE0LTPRMkoV7xGpKkhZYS+i0r5WIBZfcmvJfgqsdhBN3E66Xk7+wbeaPeg3E1S5ora4hd9T15eD1zuiwE7jbv3/ROH6zOu8+eAKeghYIwBE4Bm9BHwwB9frehffN++43/Xf+B39wWbrnrZjHYMv8yW9Ovzhf</latexit><latexit sha1_base64="DY7ikL8+aI74xx0WsEcjQryAVOs=">AAADo3icfZJtb9MwEMedhYdRnjp4yRuLqlIrocoZlFVCSBN7g8SbgtpuUl0ix3VaM9uJbGc0RAG+Ch+Lr8CnwOla1kLHSZHu/ne/u5MvUSq4sQj99Pb8Gzdv3d6/U7t77/6Dh/WDRyOTZJqyIU1Eos8iYpjgig0tt4KdpZoRGQl2Gp2fVPnTC6YNT9TA5imbSDJTPOaUWCeF9V/NtIUlsfMoLhYlxK7WwvwVXGs4nfPy2VUos43IlG34Gp60TJi3IWaLFGLBYlvFW0SYfxzAONzqCTfGOljz2dy2a9uUa45jTWiBTSbDIg+5U/ISXpEhLws8qnb+TwlcVpRhvYE6QYCOUBeiDur1XiLknOco6B52YdBBS2uAlfXDA+8HniY0k0xZKogx4wCldlJ8MkRbTgUrazgzLCX0nMzY2LmKSGYmxfIsJWw6ZQrjRLtPWbhUN4mCSGNyGbnKalvzd64Sd+XGmY17k4KrNLNM0ctBcSagTWB1YzjlmlErcucQqrnbFdI5cQ9p3Z9Qw4p9pomURE0LTPRMkoV7xGpKkhZYS+i0r5WIBZfcmvJfgqsdhBN3E66Xk7+wbeaPeg3E1S5ora4hd9T15eD1zuiwE7jbv3/ROH6zOu8+eAKeghYIwBE4Bm9BHwwB9frehffN++43/Xf+B39wWbrnrZjHYMv8yW9Ovzhf</latexit><latexit sha1_base64="DY7ikL8+aI74xx0WsEcjQryAVOs=">AAADo3icfZJtb9MwEMedhYdRnjp4yRuLqlIrocoZlFVCSBN7g8SbgtpuUl0ix3VaM9uJbGc0RAG+Ch+Lr8CnwOla1kLHSZHu/ne/u5MvUSq4sQj99Pb8Gzdv3d6/U7t77/6Dh/WDRyOTZJqyIU1Eos8iYpjgig0tt4KdpZoRGQl2Gp2fVPnTC6YNT9TA5imbSDJTPOaUWCeF9V/NtIUlsfMoLhYlxK7WwvwVXGs4nfPy2VUos43IlG34Gp60TJi3IWaLFGLBYlvFW0SYfxzAONzqCTfGOljz2dy2a9uUa45jTWiBTSbDIg+5U/ISXpEhLws8qnb+TwlcVpRhvYE6QYCOUBeiDur1XiLknOco6B52YdBBS2uAlfXDA+8HniY0k0xZKogx4wCldlJ8MkRbTgUrazgzLCX0nMzY2LmKSGYmxfIsJWw6ZQrjRLtPWbhUN4mCSGNyGbnKalvzd64Sd+XGmY17k4KrNLNM0ctBcSagTWB1YzjlmlErcucQqrnbFdI5cQ9p3Z9Qw4p9pomURE0LTPRMkoV7xGpKkhZYS+i0r5WIBZfcmvJfgqsdhBN3E66Xk7+wbeaPeg3E1S5ora4hd9T15eD1zuiwE7jbv3/ROH6zOu8+eAKeghYIwBE4Bm9BHwwB9frehffN++43/Xf+B39wWbrnrZjHYMv8yW9Ovzhf</latexit>
Rethinking — 球⾯Embeddingsの理解
下式を最適化することは、
下記の確率モデルの最尤推定に等しい。
(1) 各Identityごとの顔画像は集中度パラメータsが共通なvMF分布に従い、
(2) 各Identityは等確率に選択される。
※ ArcFaceは確率モデル化できてないが、ノリはだいたい同じ?
44
共通でいいの?
実際は⾮⼀様では?
vMFベースの確率モデルを最適化してみた
先のvMFベースの確率モデルを最適化してみた。
集中度パラメータsもデータから⾃動学習。
45
※ 思いついて導出してから気づいたけど、既存研究もありました
M. A. Hansnat+, “von Mises-Fisher Mixture Model-based Deep learning: Application to Face Verification”, arXiv:1706.04264
vMFベースの確率モデルを最適化してみた
ダメでした…!
(実験結果を探したけど⾒つからず…🙇)
過学習した。まだデータセットが全然サイズが⾜りず、データをもっとたくさん
集めない限り、何らかの制約(AdaCosやArcFaceのs=⼀定)や
正則化(ArcFaceのマージン)を⼊れないとうまく⾏かないということ…?
46
こんな感じで楽しく遊んで(研究して)います。
アイデアを試せるサービスがあるってイイヨ!
47
Copyright © ABEJA, Inc. All rights reserved.
We are hiring!
48
https://www.wantedly.com/companies/abeja
49
Annotation Driven AI

More Related Content

What's hot

Cosine Based Softmax による Metric Learning が上手くいく理由
Cosine Based Softmax による Metric Learning が上手くいく理由Cosine Based Softmax による Metric Learning が上手くいく理由
Cosine Based Softmax による Metric Learning が上手くいく理由tancoro
 
最適輸送の解き方
最適輸送の解き方最適輸送の解き方
最適輸送の解き方joisino
 
【メタサーベイ】Video Transformer
 【メタサーベイ】Video Transformer 【メタサーベイ】Video Transformer
【メタサーベイ】Video Transformercvpaper. challenge
 
【DL輪読会】Scale Efficiently: Insights from Pre-training and Fine-tuning Transfor...
【DL輪読会】Scale Efficiently: Insights from Pre-training and Fine-tuning Transfor...【DL輪読会】Scale Efficiently: Insights from Pre-training and Fine-tuning Transfor...
【DL輪読会】Scale Efficiently: Insights from Pre-training and Fine-tuning Transfor...Deep Learning JP
 
【DL輪読会】How Much Can CLIP Benefit Vision-and-Language Tasks?
【DL輪読会】How Much Can CLIP Benefit Vision-and-Language Tasks? 【DL輪読会】How Much Can CLIP Benefit Vision-and-Language Tasks?
【DL輪読会】How Much Can CLIP Benefit Vision-and-Language Tasks? Deep Learning JP
 
【DL輪読会】Perceiver io a general architecture for structured inputs &amp; outputs
【DL輪読会】Perceiver io  a general architecture for structured inputs &amp; outputs 【DL輪読会】Perceiver io  a general architecture for structured inputs &amp; outputs
【DL輪読会】Perceiver io a general architecture for structured inputs &amp; outputs Deep Learning JP
 
【DL輪読会】"Masked Siamese Networks for Label-Efficient Learning"
【DL輪読会】"Masked Siamese Networks for Label-Efficient Learning"【DL輪読会】"Masked Siamese Networks for Label-Efficient Learning"
【DL輪読会】"Masked Siamese Networks for Label-Efficient Learning"Deep Learning JP
 
[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets
[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets
[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic DatasetsDeep Learning JP
 
【DL輪読会】StyleGAN-T: Unlocking the Power of GANs for Fast Large-Scale Text-to-I...
【DL輪読会】StyleGAN-T: Unlocking the Power of GANs for Fast Large-Scale Text-to-I...【DL輪読会】StyleGAN-T: Unlocking the Power of GANs for Fast Large-Scale Text-to-I...
【DL輪読会】StyleGAN-T: Unlocking the Power of GANs for Fast Large-Scale Text-to-I...Deep Learning JP
 
[DL輪読会]GLIDE: Guided Language to Image Diffusion for Generation and Editing
[DL輪読会]GLIDE: Guided Language to Image Diffusion  for Generation and Editing[DL輪読会]GLIDE: Guided Language to Image Diffusion  for Generation and Editing
[DL輪読会]GLIDE: Guided Language to Image Diffusion for Generation and EditingDeep Learning JP
 
[DL輪読会]Vision Transformer with Deformable Attention (Deformable Attention Tra...
[DL輪読会]Vision Transformer with Deformable Attention (Deformable Attention Tra...[DL輪読会]Vision Transformer with Deformable Attention (Deformable Attention Tra...
[DL輪読会]Vision Transformer with Deformable Attention (Deformable Attention Tra...Deep Learning JP
 
backbone としての timm 入門
backbone としての timm 入門backbone としての timm 入門
backbone としての timm 入門Takuji Tahara
 
[DL輪読会]A Higher-Dimensional Representation for Topologically Varying Neural R...
[DL輪読会]A Higher-Dimensional Representation for Topologically Varying Neural R...[DL輪読会]A Higher-Dimensional Representation for Topologically Varying Neural R...
[DL輪読会]A Higher-Dimensional Representation for Topologically Varying Neural R...Deep Learning JP
 
【DL輪読会】Hierarchical Text-Conditional Image Generation with CLIP Latents
【DL輪読会】Hierarchical Text-Conditional Image Generation with CLIP Latents【DL輪読会】Hierarchical Text-Conditional Image Generation with CLIP Latents
【DL輪読会】Hierarchical Text-Conditional Image Generation with CLIP LatentsDeep Learning JP
 
Automatic Mixed Precision の紹介
Automatic Mixed Precision の紹介Automatic Mixed Precision の紹介
Automatic Mixed Precision の紹介Kuninobu SaSaki
 
[DL輪読会]ICLR2020の分布外検知速報
[DL輪読会]ICLR2020の分布外検知速報[DL輪読会]ICLR2020の分布外検知速報
[DL輪読会]ICLR2020の分布外検知速報Deep Learning JP
 
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料Yusuke Uchida
 
指数時間アルゴリズム入門
指数時間アルゴリズム入門指数時間アルゴリズム入門
指数時間アルゴリズム入門Yoichi Iwata
 
ネットストーカー御用達OSINTツールBlackBirdを触ってみた.pptx
ネットストーカー御用達OSINTツールBlackBirdを触ってみた.pptxネットストーカー御用達OSINTツールBlackBirdを触ってみた.pptx
ネットストーカー御用達OSINTツールBlackBirdを触ってみた.pptxShota Shinogi
 
【LT資料】 Neural Network 素人なんだけど何とかご機嫌取りをしたい
【LT資料】 Neural Network 素人なんだけど何とかご機嫌取りをしたい【LT資料】 Neural Network 素人なんだけど何とかご機嫌取りをしたい
【LT資料】 Neural Network 素人なんだけど何とかご機嫌取りをしたいTakuji Tahara
 

What's hot (20)

Cosine Based Softmax による Metric Learning が上手くいく理由
Cosine Based Softmax による Metric Learning が上手くいく理由Cosine Based Softmax による Metric Learning が上手くいく理由
Cosine Based Softmax による Metric Learning が上手くいく理由
 
最適輸送の解き方
最適輸送の解き方最適輸送の解き方
最適輸送の解き方
 
【メタサーベイ】Video Transformer
 【メタサーベイ】Video Transformer 【メタサーベイ】Video Transformer
【メタサーベイ】Video Transformer
 
【DL輪読会】Scale Efficiently: Insights from Pre-training and Fine-tuning Transfor...
【DL輪読会】Scale Efficiently: Insights from Pre-training and Fine-tuning Transfor...【DL輪読会】Scale Efficiently: Insights from Pre-training and Fine-tuning Transfor...
【DL輪読会】Scale Efficiently: Insights from Pre-training and Fine-tuning Transfor...
 
【DL輪読会】How Much Can CLIP Benefit Vision-and-Language Tasks?
【DL輪読会】How Much Can CLIP Benefit Vision-and-Language Tasks? 【DL輪読会】How Much Can CLIP Benefit Vision-and-Language Tasks?
【DL輪読会】How Much Can CLIP Benefit Vision-and-Language Tasks?
 
【DL輪読会】Perceiver io a general architecture for structured inputs &amp; outputs
【DL輪読会】Perceiver io  a general architecture for structured inputs &amp; outputs 【DL輪読会】Perceiver io  a general architecture for structured inputs &amp; outputs
【DL輪読会】Perceiver io a general architecture for structured inputs &amp; outputs
 
【DL輪読会】"Masked Siamese Networks for Label-Efficient Learning"
【DL輪読会】"Masked Siamese Networks for Label-Efficient Learning"【DL輪読会】"Masked Siamese Networks for Label-Efficient Learning"
【DL輪読会】"Masked Siamese Networks for Label-Efficient Learning"
 
[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets
[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets
[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets
 
【DL輪読会】StyleGAN-T: Unlocking the Power of GANs for Fast Large-Scale Text-to-I...
【DL輪読会】StyleGAN-T: Unlocking the Power of GANs for Fast Large-Scale Text-to-I...【DL輪読会】StyleGAN-T: Unlocking the Power of GANs for Fast Large-Scale Text-to-I...
【DL輪読会】StyleGAN-T: Unlocking the Power of GANs for Fast Large-Scale Text-to-I...
 
[DL輪読会]GLIDE: Guided Language to Image Diffusion for Generation and Editing
[DL輪読会]GLIDE: Guided Language to Image Diffusion  for Generation and Editing[DL輪読会]GLIDE: Guided Language to Image Diffusion  for Generation and Editing
[DL輪読会]GLIDE: Guided Language to Image Diffusion for Generation and Editing
 
[DL輪読会]Vision Transformer with Deformable Attention (Deformable Attention Tra...
[DL輪読会]Vision Transformer with Deformable Attention (Deformable Attention Tra...[DL輪読会]Vision Transformer with Deformable Attention (Deformable Attention Tra...
[DL輪読会]Vision Transformer with Deformable Attention (Deformable Attention Tra...
 
backbone としての timm 入門
backbone としての timm 入門backbone としての timm 入門
backbone としての timm 入門
 
[DL輪読会]A Higher-Dimensional Representation for Topologically Varying Neural R...
[DL輪読会]A Higher-Dimensional Representation for Topologically Varying Neural R...[DL輪読会]A Higher-Dimensional Representation for Topologically Varying Neural R...
[DL輪読会]A Higher-Dimensional Representation for Topologically Varying Neural R...
 
【DL輪読会】Hierarchical Text-Conditional Image Generation with CLIP Latents
【DL輪読会】Hierarchical Text-Conditional Image Generation with CLIP Latents【DL輪読会】Hierarchical Text-Conditional Image Generation with CLIP Latents
【DL輪読会】Hierarchical Text-Conditional Image Generation with CLIP Latents
 
Automatic Mixed Precision の紹介
Automatic Mixed Precision の紹介Automatic Mixed Precision の紹介
Automatic Mixed Precision の紹介
 
[DL輪読会]ICLR2020の分布外検知速報
[DL輪読会]ICLR2020の分布外検知速報[DL輪読会]ICLR2020の分布外検知速報
[DL輪読会]ICLR2020の分布外検知速報
 
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
 
指数時間アルゴリズム入門
指数時間アルゴリズム入門指数時間アルゴリズム入門
指数時間アルゴリズム入門
 
ネットストーカー御用達OSINTツールBlackBirdを触ってみた.pptx
ネットストーカー御用達OSINTツールBlackBirdを触ってみた.pptxネットストーカー御用達OSINTツールBlackBirdを触ってみた.pptx
ネットストーカー御用達OSINTツールBlackBirdを触ってみた.pptx
 
【LT資料】 Neural Network 素人なんだけど何とかご機嫌取りをしたい
【LT資料】 Neural Network 素人なんだけど何とかご機嫌取りをしたい【LT資料】 Neural Network 素人なんだけど何とかご機嫌取りをしたい
【LT資料】 Neural Network 素人なんだけど何とかご機嫌取りをしたい
 

Similar to Retail Face Analysis Inside-Out

SSII2022 [TS3] コンテンツ制作を支援する機械学習技術​〜 イラストレーションやデザインの基礎から最新鋭の技術まで 〜​
SSII2022 [TS3] コンテンツ制作を支援する機械学習技術​〜 イラストレーションやデザインの基礎から最新鋭の技術まで 〜​SSII2022 [TS3] コンテンツ制作を支援する機械学習技術​〜 イラストレーションやデザインの基礎から最新鋭の技術まで 〜​
SSII2022 [TS3] コンテンツ制作を支援する機械学習技術​〜 イラストレーションやデザインの基礎から最新鋭の技術まで 〜​SSII
 
2020/07/04 BSP-Net (CVPR2020)
2020/07/04 BSP-Net (CVPR2020)2020/07/04 BSP-Net (CVPR2020)
2020/07/04 BSP-Net (CVPR2020)Takuya Minagawa
 
ソフトウエアジャパン2017 IT Forum AITC(2)
ソフトウエアジャパン2017 IT Forum AITC(2)ソフトウエアジャパン2017 IT Forum AITC(2)
ソフトウエアジャパン2017 IT Forum AITC(2)aitc_jp
 
Pythonとdeep learningで手書き文字認識
Pythonとdeep learningで手書き文字認識Pythonとdeep learningで手書き文字認識
Pythonとdeep learningで手書き文字認識Ken Morishita
 
アイデアワークショップ for SmartTech Award 2013
アイデアワークショップ for SmartTech Award 2013アイデアワークショップ for SmartTech Award 2013
アイデアワークショップ for SmartTech Award 2013Rikie Ishii
 
SSII2020TS: 機械学習モデルの判断根拠の説明​ 〜 Explainable AI 研究の近年の展開 〜​
SSII2020TS: 機械学習モデルの判断根拠の説明​ 〜 Explainable AI 研究の近年の展開 〜​SSII2020TS: 機械学習モデルの判断根拠の説明​ 〜 Explainable AI 研究の近年の展開 〜​
SSII2020TS: 機械学習モデルの判断根拠の説明​ 〜 Explainable AI 研究の近年の展開 〜​SSII
 
トヨタ紡織東北殿_アイデア発想力向上セミナー2014_印刷カットアウト版
トヨタ紡織東北殿_アイデア発想力向上セミナー2014_印刷カットアウト版トヨタ紡織東北殿_アイデア発想力向上セミナー2014_印刷カットアウト版
トヨタ紡織東北殿_アイデア発想力向上セミナー2014_印刷カットアウト版Rikie Ishii
 
Deep Learningと画像認識   ~歴史・理論・実践~
Deep Learningと画像認識 ~歴史・理論・実践~Deep Learningと画像認識 ~歴史・理論・実践~
Deep Learningと画像認識   ~歴史・理論・実践~nlab_utokyo
 
チュートリアルのススメ -チュートリアルのためのチュートリアル-
チュートリアルのススメ -チュートリアルのためのチュートリアル-チュートリアルのススメ -チュートリアルのためのチュートリアル-
チュートリアルのススメ -チュートリアルのためのチュートリアル-Hironobu Fujiyoshi
 

Similar to Retail Face Analysis Inside-Out (12)

ヒトの機械学習
ヒトの機械学習ヒトの機械学習
ヒトの機械学習
 
NGK2022S
NGK2022SNGK2022S
NGK2022S
 
SSII2022 [TS3] コンテンツ制作を支援する機械学習技術​〜 イラストレーションやデザインの基礎から最新鋭の技術まで 〜​
SSII2022 [TS3] コンテンツ制作を支援する機械学習技術​〜 イラストレーションやデザインの基礎から最新鋭の技術まで 〜​SSII2022 [TS3] コンテンツ制作を支援する機械学習技術​〜 イラストレーションやデザインの基礎から最新鋭の技術まで 〜​
SSII2022 [TS3] コンテンツ制作を支援する機械学習技術​〜 イラストレーションやデザインの基礎から最新鋭の技術まで 〜​
 
2020/07/04 BSP-Net (CVPR2020)
2020/07/04 BSP-Net (CVPR2020)2020/07/04 BSP-Net (CVPR2020)
2020/07/04 BSP-Net (CVPR2020)
 
ソフトウエアジャパン2017 IT Forum AITC(2)
ソフトウエアジャパン2017 IT Forum AITC(2)ソフトウエアジャパン2017 IT Forum AITC(2)
ソフトウエアジャパン2017 IT Forum AITC(2)
 
Pythonとdeep learningで手書き文字認識
Pythonとdeep learningで手書き文字認識Pythonとdeep learningで手書き文字認識
Pythonとdeep learningで手書き文字認識
 
20200704 bsp net
20200704 bsp net20200704 bsp net
20200704 bsp net
 
アイデアワークショップ for SmartTech Award 2013
アイデアワークショップ for SmartTech Award 2013アイデアワークショップ for SmartTech Award 2013
アイデアワークショップ for SmartTech Award 2013
 
SSII2020TS: 機械学習モデルの判断根拠の説明​ 〜 Explainable AI 研究の近年の展開 〜​
SSII2020TS: 機械学習モデルの判断根拠の説明​ 〜 Explainable AI 研究の近年の展開 〜​SSII2020TS: 機械学習モデルの判断根拠の説明​ 〜 Explainable AI 研究の近年の展開 〜​
SSII2020TS: 機械学習モデルの判断根拠の説明​ 〜 Explainable AI 研究の近年の展開 〜​
 
トヨタ紡織東北殿_アイデア発想力向上セミナー2014_印刷カットアウト版
トヨタ紡織東北殿_アイデア発想力向上セミナー2014_印刷カットアウト版トヨタ紡織東北殿_アイデア発想力向上セミナー2014_印刷カットアウト版
トヨタ紡織東北殿_アイデア発想力向上セミナー2014_印刷カットアウト版
 
Deep Learningと画像認識   ~歴史・理論・実践~
Deep Learningと画像認識 ~歴史・理論・実践~Deep Learningと画像認識 ~歴史・理論・実践~
Deep Learningと画像認識   ~歴史・理論・実践~
 
チュートリアルのススメ -チュートリアルのためのチュートリアル-
チュートリアルのススメ -チュートリアルのためのチュートリアル-チュートリアルのススメ -チュートリアルのためのチュートリアル-
チュートリアルのススメ -チュートリアルのためのチュートリアル-
 

More from Tatsuya Shirakawa

NeurIPS2021読み会 Fairness in Ranking under Uncertainty
NeurIPS2021読み会 Fairness in Ranking under UncertaintyNeurIPS2021読み会 Fairness in Ranking under Uncertainty
NeurIPS2021読み会 Fairness in Ranking under UncertaintyTatsuya Shirakawa
 
2021 10-07 kdd2021読み会 uc phrase
2021 10-07 kdd2021読み会 uc phrase2021 10-07 kdd2021読み会 uc phrase
2021 10-07 kdd2021読み会 uc phraseTatsuya Shirakawa
 
医療ビッグデータの今後を見通すために知っておきたい機械学習の基礎〜最前線 agains COVID-19
医療ビッグデータの今後を見通すために知っておきたい機械学習の基礎〜最前線 agains COVID-19医療ビッグデータの今後を見通すために知っておきたい機械学習の基礎〜最前線 agains COVID-19
医療ビッグデータの今後を見通すために知っておきたい機械学習の基礎〜最前線 agains COVID-19Tatsuya Shirakawa
 
データに内在する構造をみるための埋め込み手法
データに内在する構造をみるための埋め込み手法データに内在する構造をみるための埋め込み手法
データに内在する構造をみるための埋め込み手法Tatsuya Shirakawa
 
Seeing Unseens with Machine Learning -- 
見えていないものを見出す機械学習
Seeing Unseens with Machine Learning -- 
見えていないものを見出す機械学習Seeing Unseens with Machine Learning -- 
見えていないものを見出す機械学習
Seeing Unseens with Machine Learning -- 
見えていないものを見出す機械学習Tatsuya Shirakawa
 
Taskonomy: Disentangling Task Transfer Learning -- Scouty Meetup 2018 Feb., ...
 Taskonomy: Disentangling Task Transfer Learning -- Scouty Meetup 2018 Feb., ... Taskonomy: Disentangling Task Transfer Learning -- Scouty Meetup 2018 Feb., ...
Taskonomy: Disentangling Task Transfer Learning -- Scouty Meetup 2018 Feb., ...Tatsuya Shirakawa
 
Learning to Compose Domain-Specific Transformations for Data Augmentation
Learning to Compose Domain-Specific Transformations for Data AugmentationLearning to Compose Domain-Specific Transformations for Data Augmentation
Learning to Compose Domain-Specific Transformations for Data AugmentationTatsuya Shirakawa
 
Poincare embeddings for Learning Hierarchical Representations
Poincare embeddings for Learning Hierarchical RepresentationsPoincare embeddings for Learning Hierarchical Representations
Poincare embeddings for Learning Hierarchical RepresentationsTatsuya Shirakawa
 
Improving Variational Inference with Inverse Autoregressive Flow
Improving Variational Inference with Inverse Autoregressive FlowImproving Variational Inference with Inverse Autoregressive Flow
Improving Variational Inference with Inverse Autoregressive FlowTatsuya Shirakawa
 

More from Tatsuya Shirakawa (13)

NeurIPS2021読み会 Fairness in Ranking under Uncertainty
NeurIPS2021読み会 Fairness in Ranking under UncertaintyNeurIPS2021読み会 Fairness in Ranking under Uncertainty
NeurIPS2021読み会 Fairness in Ranking under Uncertainty
 
2021 10-07 kdd2021読み会 uc phrase
2021 10-07 kdd2021読み会 uc phrase2021 10-07 kdd2021読み会 uc phrase
2021 10-07 kdd2021読み会 uc phrase
 
医療ビッグデータの今後を見通すために知っておきたい機械学習の基礎〜最前線 agains COVID-19
医療ビッグデータの今後を見通すために知っておきたい機械学習の基礎〜最前線 agains COVID-19医療ビッグデータの今後を見通すために知っておきたい機械学習の基礎〜最前線 agains COVID-19
医療ビッグデータの今後を見通すために知っておきたい機械学習の基礎〜最前線 agains COVID-19
 
ICCV2019 report
ICCV2019 reportICCV2019 report
ICCV2019 report
 
データに内在する構造をみるための埋め込み手法
データに内在する構造をみるための埋め込み手法データに内在する構造をみるための埋め込み手法
データに内在する構造をみるための埋め込み手法
 
Seeing Unseens with Machine Learning -- 
見えていないものを見出す機械学習
Seeing Unseens with Machine Learning -- 
見えていないものを見出す機械学習Seeing Unseens with Machine Learning -- 
見えていないものを見出す機械学習
Seeing Unseens with Machine Learning -- 
見えていないものを見出す機械学習
 
Taskonomy: Disentangling Task Transfer Learning -- Scouty Meetup 2018 Feb., ...
 Taskonomy: Disentangling Task Transfer Learning -- Scouty Meetup 2018 Feb., ... Taskonomy: Disentangling Task Transfer Learning -- Scouty Meetup 2018 Feb., ...
Taskonomy: Disentangling Task Transfer Learning -- Scouty Meetup 2018 Feb., ...
 
Hyperbolic Neural Networks
Hyperbolic Neural NetworksHyperbolic Neural Networks
Hyperbolic Neural Networks
 
Learning to Compose Domain-Specific Transformations for Data Augmentation
Learning to Compose Domain-Specific Transformations for Data AugmentationLearning to Compose Domain-Specific Transformations for Data Augmentation
Learning to Compose Domain-Specific Transformations for Data Augmentation
 
Icml2017 overview
Icml2017 overviewIcml2017 overview
Icml2017 overview
 
Poincare embeddings for Learning Hierarchical Representations
Poincare embeddings for Learning Hierarchical RepresentationsPoincare embeddings for Learning Hierarchical Representations
Poincare embeddings for Learning Hierarchical Representations
 
Dynamic filter networks
Dynamic filter networksDynamic filter networks
Dynamic filter networks
 
Improving Variational Inference with Inverse Autoregressive Flow
Improving Variational Inference with Inverse Autoregressive FlowImproving Variational Inference with Inverse Autoregressive Flow
Improving Variational Inference with Inverse Autoregressive Flow
 

Recently uploaded

MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。
MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。
MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。iPride Co., Ltd.
 
YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)
YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)
YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)NTT DATA Technology & Innovation
 
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアルLoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアルCRI Japan, Inc.
 
20240523_IoTLT_vol111_kitazaki_v1___.pdf
20240523_IoTLT_vol111_kitazaki_v1___.pdf20240523_IoTLT_vol111_kitazaki_v1___.pdf
20240523_IoTLT_vol111_kitazaki_v1___.pdfAyachika Kitazaki
 
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptxyassun7010
 
論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes
論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes
論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizesatsushi061452
 
Amazon Cognitoで実装するパスキー (Security-JAWS【第33回】 勉強会)
Amazon Cognitoで実装するパスキー (Security-JAWS【第33回】 勉強会)Amazon Cognitoで実装するパスキー (Security-JAWS【第33回】 勉強会)
Amazon Cognitoで実装するパスキー (Security-JAWS【第33回】 勉強会)keikoitakurag
 
論文紹介: Exploiting semantic segmentation to boost reinforcement learning in vid...
論文紹介: Exploiting semantic segmentation to boost reinforcement learning in vid...論文紹介: Exploiting semantic segmentation to boost reinforcement learning in vid...
論文紹介: Exploiting semantic segmentation to boost reinforcement learning in vid...atsushi061452
 
2024年5月25日Serverless Meetup大阪 アプリケーションをどこで動かすべきなのか.pptx
2024年5月25日Serverless Meetup大阪 アプリケーションをどこで動かすべきなのか.pptx2024年5月25日Serverless Meetup大阪 アプリケーションをどこで動かすべきなのか.pptx
2024年5月25日Serverless Meetup大阪 アプリケーションをどこで動かすべきなのか.pptxssuserbefd24
 

Recently uploaded (10)

MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。
MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。
MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。
 
【AI論文解説】Consistency ModelとRectified Flow
【AI論文解説】Consistency ModelとRectified Flow【AI論文解説】Consistency ModelとRectified Flow
【AI論文解説】Consistency ModelとRectified Flow
 
YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)
YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)
YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)
 
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアルLoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
 
20240523_IoTLT_vol111_kitazaki_v1___.pdf
20240523_IoTLT_vol111_kitazaki_v1___.pdf20240523_IoTLT_vol111_kitazaki_v1___.pdf
20240523_IoTLT_vol111_kitazaki_v1___.pdf
 
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
 
論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes
論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes
論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes
 
Amazon Cognitoで実装するパスキー (Security-JAWS【第33回】 勉強会)
Amazon Cognitoで実装するパスキー (Security-JAWS【第33回】 勉強会)Amazon Cognitoで実装するパスキー (Security-JAWS【第33回】 勉強会)
Amazon Cognitoで実装するパスキー (Security-JAWS【第33回】 勉強会)
 
論文紹介: Exploiting semantic segmentation to boost reinforcement learning in vid...
論文紹介: Exploiting semantic segmentation to boost reinforcement learning in vid...論文紹介: Exploiting semantic segmentation to boost reinforcement learning in vid...
論文紹介: Exploiting semantic segmentation to boost reinforcement learning in vid...
 
2024年5月25日Serverless Meetup大阪 アプリケーションをどこで動かすべきなのか.pptx
2024年5月25日Serverless Meetup大阪 アプリケーションをどこで動かすべきなのか.pptx2024年5月25日Serverless Meetup大阪 アプリケーションをどこで動かすべきなのか.pptx
2024年5月25日Serverless Meetup大阪 アプリケーションをどこで動かすべきなのか.pptx
 

Retail Face Analysis Inside-Out

  • 1. Oct 10th, 2019 Tatsuya Shirakawa Retail Face Analysis Inside-Out
  • 2. Tatsuya Shirakawa 2 ABEJA, Inc. (Researcher) - Deep Learning (CV, Graph, NLP, ) - Machine Learning Github https://github.com/TatsuyaShirakawa NTT Data Mathematical Systems Inc. - Mathematical Optimization - Machine Learning / Deep Learning Math. Tech blog http://tech-blog.abeja.asia/ - 異空間への埋め込み!Poincare Embeddingsが拓く表現学習の新展開 - 機は熟した!グラフ構造に対するDeep Learning、Graph Convolutionのご紹介 - 双曲空間でのMachine Learningの最近の進展 - より良い機械学習のためのアノテーションの機械学習 Now
  • 3. LabsのResearcherの仕事 1. イケててヤバい新規事業の創出 2. 新しい技術や領域にたいするチャレンジ 3. 深い理解にもとづくコアモデル・アルゴリズムの開発 4. 社内外相談役 … 3
  • 4. 今回は、ABEJA Insight for Retailの 顔認識・デモグラ推定技術 についてResearcherの⽴場からお話します。 4
  • 7. Face AnalysisのInput/Outputイメージ 7 z Input Video [0] Male, 25 years old, New [1] Male, 30 years old, Repeater [2] Male, 24 years old, Repeater ?
  • 8. Face Analysis Flow 8※ subtle modification for ease of explanation Camera Dashboard Analysis Core Cloud System
  • 9. Face Journey 9 Input Video Detection & Tracking Tracks Scoring & Filtering Filtered Tracks = x x x x x x x x x x x x x x x x x x x x x x x Embedding 0 10 20 30 40 50 60 70 ♂ ♂ ♂ ♂ ♂ ♂ ♂ Gender & Age Prediction [0] Male, 25 years old, New [1] Male, 30 years old, Repeater [2] Male, 24 years old, Repeater Result Aggregate XX XX X XXXXXX X X X XX X ※ subtle modification for ease of explanation
  • 10. Detection & Tracking 10 Input Video Detection & Tracking Tracks Scoring & Filtering Filtered Tracks = XX XX X XXXXXX X X X XX X x x x x x x x x x x x x x x x x x x x x x x x Embedding 0 10 20 30 40 50 60 70 ♂ ♂ ♂ ♂ ♂ ♂ ♂ Gender & Age Prediction [0] Male, 25 years old, New [1] Male, 30 years old, Repeater [2] Male, 24 years old, Repeater Result Integrate ⼊⼒動画から顔を検出し、連続フレーム間の同⼀⼈物の顔を 連結する(トラッキング) 難しさ • 顔をなるべく⾼速にもれなく検出する • 顔ではないものを検出しない • ⾮⽣体由来の顔(ポスター、サイネージ)に反応しない • トラッキング時、かならず同⼀⼈物同⼠を結びつける • トラックをむやみにぶつ切りにしない
  • 13. Face Journey 13 Input Video Detection & Tracking Tracks Scoring & Filtering Filtered Tracks = x x x x x x x x x x x x x x x x x x x x x x x Embedding 0 10 20 30 40 50 60 70 ♂ ♂ ♂ ♂ ♂ ♂ ♂ Gender & Age Prediction [0] Male, 25 years old, New [1] Male, 30 years old, Repeater [2] Male, 24 years old, Repeater Result Aggregate XX XX X XXXXXX X X X XX X ※ subtle modification for ease of explanation
  • 14. Scoring & Filtering 14 z Input Video Detection & Tracking Tracks Scoring & Filtering Filtered Tracks = x x x x x x x x x x x x x x x x x x x x x x x Embedding 0 10 20 30 40 50 60 70 ♂ ♂ ♂ ♂ ♂ ♂ ♂ Gender & Age Prediction [0] Male, 25 years old, New [1] Male, 30 years old, Repeater [2] Male, 24 years old, Repeater Result Integrate 顔画像の品質を計算し、認識に不向きな顔画像 を除外する。 XX XX X XXXXXX X X X XX X 研究の蓄積がすくなく、アプリケーションに応じて 独⾃に⽅法を考案する必要がある。。。 そもそもよい顔ってなに? • 正⾯向き? • オクルージョンしてない? • ノイズが乗っていない? • 変顔してない? …
  • 15. 考案⼿法 Error Regression Networks (ERNs) ※ 未発表 顔認識モデルの認識誤差を予測するモデル 「そのモデルを適⽤したときに、どれくらい誤差が出てしまうか?」 「良い顔」にたいする複雑で多様なルールが不要で、かつ、 追加のアノテーションなしで半⾃動的にスコアリングを学習することが可能 15
  • 16. ERNsの中⾝ 顔認識の場合は下記の2点間の距離を回帰するモデル。 (1) 与えられた顔画像のEmbedding(後述) (2) 顔画像が表す⼈物の全顔画像のEmbeddingから求めた中⼼ベクター 16 観察 Large distortion ⇔ Noisy • 経験的には⼩さいモデルで⼗分 • 追加の教師データ不要(顔認識データセットがあればよい) • 顔認識にとって最適化された品質推定が可能
  • 17. ERNs on VGGFace2 17 Q. Cao+, “VGGFace2: A dataset for recognising face across pose and age”, 2018
  • 20. Face Journey 20 Input Video Detection & Tracking Tracks Scoring & Filtering Filtered Tracks = x x x x x x x x x x x x x x x x x x x x x x x Embedding 0 10 20 30 40 50 60 70 ♂ ♂ ♂ ♂ ♂ ♂ ♂ Gender & Age Prediction [0] Male, 25 years old, New [1] Male, 30 years old, Repeater [2] Male, 24 years old, Repeater Result Aggregate XX XX X XXXXXX X X X XX X ※ subtle modification for ease of explanation
  • 21. Embedding 21 z Input Video Detection & Tracking Tracks Scoring & Filtering Filtered Tracks = x x x x x x x x x x x x x x x x x x x x x x x Embedding 0 10 20 30 40 50 60 70 ♂ ♂ ♂ ♂ ♂ ♂ ♂ Gender & Age Prediction [0] Male, 25 years old, New [1] Male, 30 years old, Repeater [2] Male, 24 years old, Repeater Result Integrate 顔画像から特徴ベクター(e.g. 128次元、512次元)を抽出する。 XX XX X XXXXXX X X X XX X 難しさ • 異なる⼈物からの⼤量の顔画像が必要 • ⼀般に、⼤きなモデルのほうが精度が出やすく、取り回しが悪い • 精度のよいデータセットを作るのが困難
  • 23. Face Journey 23 Input Video Detection & Tracking Tracks Scoring & Filtering Filtered Tracks = x x x x x x x x x x x x x x x x x x x x x x x Embedding 0 10 20 30 40 50 60 70 ♂ ♂ ♂ ♂ ♂ ♂ ♂ Gender & Age Prediction [0] Male, 25 years old, New [1] Male, 30 years old, Repeater [2] Male, 24 years old, Repeater Result Aggregate XX XX X XXXXXX X X X XX X ※ subtle modification for ease of explanation
  • 24. Gender Age Prediction 24 z Input Video Detection & Tracking Tracks Scoring & Filtering Filtered Tracks = x x x x x x x x x x x x x x x x x x x x x x x Embedding 0 10 20 30 40 50 60 70 ♂ ♂ ♂ ♂ ♂ ♂ ♂ Gender & Age Prediction [0] Male, 25 years old, New [1] Male, 30 years old, Repeater [2] Male, 24 years old, Repeater Result Integrate 顔画像から年齢性別を推定するXX XX X XXXXXX X X X XX X 難しさ • 実的年齢か⾒た⽬年齢か • ⾒た⽬年齢アノテーションは困難 • 実的年齢付きデータの取得は困難 • 顔だけから推定する難しさ • 研究として最近流⾏ってない…
  • 25. 実年齢 vs ⾒た⽬年齢 20台半ばを中⼼に、実年齢 - ⾒た⽬の正負の⼊れ替わりが起きる? (アノテーションの認知バイアス) 25 APPA-REALを解析 (http://chalearnlap.cvc.uab.es/dataset/26/description/)
  • 27. Face Journey 27 Input Video Detection & Tracking Tracks Scoring & Filtering Filtered Tracks = x x x x x x x x x x x x x x x x x x x x x x x Embedding 0 10 20 30 40 50 60 70 ♂ ♂ ♂ ♂ ♂ ♂ ♂ Gender & Age Prediction [0] Male, 25 years old, New [1] Male, 30 years old, Repeater [2] Male, 24 years old, Repeater Result Aggregate XX XX X XXXXXX X X X XX X ※ subtle modification for ease of explanation
  • 28. Aggregating Multiple Predictions 28 z Input Video Detection & Tracking Tracks Scoring & Filtering Filtered Tracks = XX XX X XXXXXX X X X XX X x x x x x x x x x x x x x x x x x x x x x x x Embedding 0 10 20 30 40 50 60 70 ♂ ♂ ♂ ♂ ♂ ♂ ♂ Gender & Age Prediction [0] Male, 25 years old, New [1] Male, 30 years old, Repeater [2] Male, 24 years old, Repeater Result Aggregate 顔Embedding、年齢性別推定結果のマージ ヒューリスティックになりがち。 可能なら論理的に整合性のとれた⽅法でマージしたい。 (後述のvMF分布の存在を想定するなど)
  • 30. Embedding(再掲) 30 z Input Video Detection & Tracking Tracks Scoring & Filtering Filtered Tracks = x x x x x x x x x x x x x x x x x x x x x x x Embedding 0 10 20 30 40 50 60 70 ♂ ♂ ♂ ♂ ♂ ♂ ♂ Gender & Age Prediction [0] Male, 25 years old, New [1] Male, 30 years old, Repeater [2] Male, 24 years old, Repeater Result Integrate 顔画像から特徴ベクター(e.g. 128次元、512次元)を抽出する。 XX XX X XXXXXX X X X XX X 難しさ • 異なる⼈物からの⼤量の顔画像が必要 • ⼀般に、⼤きなモデルのほうが精度が出やすく、取り回しが悪い • 精度のよいデータセットを作るのが困難
  • 31. ArcFace J. Deng+, “ArcFace: Additive Angular Margin Loss for Deep Face Recognition”, 2018 顔画像の球⾯へ埋め込んだ後、⾮ターゲットクラスと間のマージンを加味しつつ ⼈物識別学習を⾏うことで⾼精度のEmbeddingを得ることができる。 31
  • 32. ArcFace 通常のCross Entropy Loss ArcFaceはTarget Class以外のClassとの間にマージンを考慮する 32
  • 34. [再現実験] ArcFace — だいたい論⽂通り 34 ※ ResNet101は1回の学習にDGX-1で32GのGPU8並列で1⽇超かかる…
  • 35. AdaCos = ArcFaceのハイパラ⾃動チューニング😝 X. Zhang+, “AdaCos: Adaptively Scaling Cosine Logits for Effectively Learning Deep Face Representations”, 2019 Fixed AdaCos マージンm = 0, スケールs = √2 log (クラス数 - 1) Dynamic AdaCos m, sを学習中のstatsを⽤いて動的設定 35
  • 37. EfficientNet 😝 M. Tan+, “EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks”, 2019 37 ResNetなどの数分の1のパラメータ数で ResNetを凌ぐ精度を達成!!
  • 38. EfficientNetの考え⽅ 1. (a) ⼊⼒画像の解像度、 (b) 各層のチャンネル/次元数、(c) 層数 の最適なバランスを、⼩さいネットワークで探索する 2. ⾒つかった(a-c)の最適なバランスを保ったまま(a-c)をスケールアップしていく 38
  • 39. [再現実験] EfficientNet — 全然精度が出ない…😥 Benchmarking Facial Recognition Models (https://abeja.docbase.io/posts/797939) 39 オリジナルの画像サイズ(224x224)から 速度的な理由でサイズを減らして実験。 論⽂が出た翌⽇くらいから3週間くらい パラメータなどをいじくったりネットワーク を微調整したりして試したが、全く精度が でない。 ※ ⼊⼒画像サイズを224x224にすると そこそこ精度は出る。
  • 40. 画像サイズに最適化されてるんじゃないか疑惑 40 ※ 縦横2倍 = 計算量4倍なので、画像サイズを⼤きくするのは、結構タブー
  • 41. 閑話休題 Rethinking — 球⾯Embeddings 球⾯へのEmbeddingをするのは、⼀体何をしているのか? この定式化は何を意味しているのか? 41 → 各⼈物の中⼼点が球⾯に分布し、その点を中⼼にした von Mises Fisher分布で顔画像のEmbeddingsが発⽣している確率モデル!
  • 42. Rethinking — 球⾯Embeddings von-Mises Fisher分布 点の発⽣確率は空間の中⼼点μとの内積から定まる、とする分布。 正規分布の球⾯版(μ = 中⼼/平均、s = 集中度/分散の逆数) 42 x x x x x x x x x x x x x x x x x x x x x x x μ p(x|y; , µ, s) = C(sy) exp syµT y f (x)<latexit sha1_base64="VswAyNHzYd5iLP4iwvjdBdBAVMQ=">AAADiHicdZFdb9MwFIadhY9Rvjq45OaIaVIrocoZlBahSdN2w+WQ1m5SXSLHdVpvsRPZDjRE4b/wi7jm3+B0LbSssxTpnOec18c5b5QlwliMf3s7/r37Dx7uPmo8fvL02fPm3ouhSXPN+IClSaovI2p4IhQfWGETfplpTmWU8Ivo+rSuX3zl2ohUndsi42NJp0rEglHrUNj8lbWIpHYWxeW8AuJaLRQfYcVINhPVm3+pzNcyU7XhCE5bJizaQPg8A5Lw2Nb5hiIsvpxDHG7cCWtjnViL6cy2Gweu3YmPgMSaspKYXIZlEQpHigrmoahKMqyfeLsCi0IVNvdxJwhwD3cBd3C//x5jF7zFQfewC0EHL84+Wp6zcM/7SSYpyyVXliXUmFGAMzsurwzVVrCEVw2SG55Rdk2nfORCRSU343Kx+woOHJlAnGr3KQsLuq4oqTSmkJHrrH/Y/F+r4bbaKLdxf1wKleWWK3YzKM4TsCnURsJEaM5sUriAMi3cW4HNqFubdXY3iOLfWColVZOSUD2VdO52V09Js5JoCY79qCFJhBTWVLcVQm1ROLhd4e5y+Dvf1Pyld4iE2iZa0ZXImbpyDu4OhoedwHn/+d3+8cnS3l30Cr1GLRSgHjpGn9AZGiDmdb2RN/G43/Cx3/M/3LTueEvNS7Rx/JM/Kgwr/w==</latexit><latexit sha1_base64="VswAyNHzYd5iLP4iwvjdBdBAVMQ=">AAADiHicdZFdb9MwFIadhY9Rvjq45OaIaVIrocoZlBahSdN2w+WQ1m5SXSLHdVpvsRPZDjRE4b/wi7jm3+B0LbSssxTpnOec18c5b5QlwliMf3s7/r37Dx7uPmo8fvL02fPm3ouhSXPN+IClSaovI2p4IhQfWGETfplpTmWU8Ivo+rSuX3zl2ohUndsi42NJp0rEglHrUNj8lbWIpHYWxeW8AuJaLRQfYcVINhPVm3+pzNcyU7XhCE5bJizaQPg8A5Lw2Nb5hiIsvpxDHG7cCWtjnViL6cy2Gweu3YmPgMSaspKYXIZlEQpHigrmoahKMqyfeLsCi0IVNvdxJwhwD3cBd3C//x5jF7zFQfewC0EHL84+Wp6zcM/7SSYpyyVXliXUmFGAMzsurwzVVrCEVw2SG55Rdk2nfORCRSU343Kx+woOHJlAnGr3KQsLuq4oqTSmkJHrrH/Y/F+r4bbaKLdxf1wKleWWK3YzKM4TsCnURsJEaM5sUriAMi3cW4HNqFubdXY3iOLfWColVZOSUD2VdO52V09Js5JoCY79qCFJhBTWVLcVQm1ROLhd4e5y+Dvf1Pyld4iE2iZa0ZXImbpyDu4OhoedwHn/+d3+8cnS3l30Cr1GLRSgHjpGn9AZGiDmdb2RN/G43/Cx3/M/3LTueEvNS7Rx/JM/Kgwr/w==</latexit><latexit sha1_base64="VswAyNHzYd5iLP4iwvjdBdBAVMQ=">AAADiHicdZFdb9MwFIadhY9Rvjq45OaIaVIrocoZlBahSdN2w+WQ1m5SXSLHdVpvsRPZDjRE4b/wi7jm3+B0LbSssxTpnOec18c5b5QlwliMf3s7/r37Dx7uPmo8fvL02fPm3ouhSXPN+IClSaovI2p4IhQfWGETfplpTmWU8Ivo+rSuX3zl2ohUndsi42NJp0rEglHrUNj8lbWIpHYWxeW8AuJaLRQfYcVINhPVm3+pzNcyU7XhCE5bJizaQPg8A5Lw2Nb5hiIsvpxDHG7cCWtjnViL6cy2Gweu3YmPgMSaspKYXIZlEQpHigrmoahKMqyfeLsCi0IVNvdxJwhwD3cBd3C//x5jF7zFQfewC0EHL84+Wp6zcM/7SSYpyyVXliXUmFGAMzsurwzVVrCEVw2SG55Rdk2nfORCRSU343Kx+woOHJlAnGr3KQsLuq4oqTSmkJHrrH/Y/F+r4bbaKLdxf1wKleWWK3YzKM4TsCnURsJEaM5sUriAMi3cW4HNqFubdXY3iOLfWColVZOSUD2VdO52V09Js5JoCY79qCFJhBTWVLcVQm1ROLhd4e5y+Dvf1Pyld4iE2iZa0ZXImbpyDu4OhoedwHn/+d3+8cnS3l30Cr1GLRSgHjpGn9AZGiDmdb2RN/G43/Cx3/M/3LTueEvNS7Rx/JM/Kgwr/w==</latexit><latexit sha1_base64="VswAyNHzYd5iLP4iwvjdBdBAVMQ=">AAADiHicdZFdb9MwFIadhY9Rvjq45OaIaVIrocoZlBahSdN2w+WQ1m5SXSLHdVpvsRPZDjRE4b/wi7jm3+B0LbSssxTpnOec18c5b5QlwliMf3s7/r37Dx7uPmo8fvL02fPm3ouhSXPN+IClSaovI2p4IhQfWGETfplpTmWU8Ivo+rSuX3zl2ohUndsi42NJp0rEglHrUNj8lbWIpHYWxeW8AuJaLRQfYcVINhPVm3+pzNcyU7XhCE5bJizaQPg8A5Lw2Nb5hiIsvpxDHG7cCWtjnViL6cy2Gweu3YmPgMSaspKYXIZlEQpHigrmoahKMqyfeLsCi0IVNvdxJwhwD3cBd3C//x5jF7zFQfewC0EHL84+Wp6zcM/7SSYpyyVXliXUmFGAMzsurwzVVrCEVw2SG55Rdk2nfORCRSU343Kx+woOHJlAnGr3KQsLuq4oqTSmkJHrrH/Y/F+r4bbaKLdxf1wKleWWK3YzKM4TsCnURsJEaM5sUriAMi3cW4HNqFubdXY3iOLfWColVZOSUD2VdO52V09Js5JoCY79qCFJhBTWVLcVQm1ROLhd4e5y+Dvf1Pyld4iE2iZa0ZXImbpyDu4OhoedwHn/+d3+8cnS3l30Cr1GLRSgHjpGn9AZGiDmdb2RN/G43/Cx3/M/3LTueEvNS7Rx/JM/Kgwr/w==</latexit>
  • 43. Rethinking — 球⾯Embeddings von-Mises Fisher分布 点の発⽣確率は空間の中⼼点μとの内積から定まる、とする分布。 正規分布の球⾯版(μ = 中⼼/平均、s = 集中度/分散の逆数) μ, sの推定量は容易に求めることができる。 例) μの推定量は平均の球⾯射影。 43 μ p(x|y; , µ, s) = C(sy) exp syµT y f (x)<latexit sha1_base64="VswAyNHzYd5iLP4iwvjdBdBAVMQ=">AAADiHicdZFdb9MwFIadhY9Rvjq45OaIaVIrocoZlBahSdN2w+WQ1m5SXSLHdVpvsRPZDjRE4b/wi7jm3+B0LbSssxTpnOec18c5b5QlwliMf3s7/r37Dx7uPmo8fvL02fPm3ouhSXPN+IClSaovI2p4IhQfWGETfplpTmWU8Ivo+rSuX3zl2ohUndsi42NJp0rEglHrUNj8lbWIpHYWxeW8AuJaLRQfYcVINhPVm3+pzNcyU7XhCE5bJizaQPg8A5Lw2Nb5hiIsvpxDHG7cCWtjnViL6cy2Gweu3YmPgMSaspKYXIZlEQpHigrmoahKMqyfeLsCi0IVNvdxJwhwD3cBd3C//x5jF7zFQfewC0EHL84+Wp6zcM/7SSYpyyVXliXUmFGAMzsurwzVVrCEVw2SG55Rdk2nfORCRSU343Kx+woOHJlAnGr3KQsLuq4oqTSmkJHrrH/Y/F+r4bbaKLdxf1wKleWWK3YzKM4TsCnURsJEaM5sUriAMi3cW4HNqFubdXY3iOLfWColVZOSUD2VdO52V09Js5JoCY79qCFJhBTWVLcVQm1ROLhd4e5y+Dvf1Pyld4iE2iZa0ZXImbpyDu4OhoedwHn/+d3+8cnS3l30Cr1GLRSgHjpGn9AZGiDmdb2RN/G43/Cx3/M/3LTueEvNS7Rx/JM/Kgwr/w==</latexit><latexit sha1_base64="VswAyNHzYd5iLP4iwvjdBdBAVMQ=">AAADiHicdZFdb9MwFIadhY9Rvjq45OaIaVIrocoZlBahSdN2w+WQ1m5SXSLHdVpvsRPZDjRE4b/wi7jm3+B0LbSssxTpnOec18c5b5QlwliMf3s7/r37Dx7uPmo8fvL02fPm3ouhSXPN+IClSaovI2p4IhQfWGETfplpTmWU8Ivo+rSuX3zl2ohUndsi42NJp0rEglHrUNj8lbWIpHYWxeW8AuJaLRQfYcVINhPVm3+pzNcyU7XhCE5bJizaQPg8A5Lw2Nb5hiIsvpxDHG7cCWtjnViL6cy2Gweu3YmPgMSaspKYXIZlEQpHigrmoahKMqyfeLsCi0IVNvdxJwhwD3cBd3C//x5jF7zFQfewC0EHL84+Wp6zcM/7SSYpyyVXliXUmFGAMzsurwzVVrCEVw2SG55Rdk2nfORCRSU343Kx+woOHJlAnGr3KQsLuq4oqTSmkJHrrH/Y/F+r4bbaKLdxf1wKleWWK3YzKM4TsCnURsJEaM5sUriAMi3cW4HNqFubdXY3iOLfWColVZOSUD2VdO52V09Js5JoCY79qCFJhBTWVLcVQm1ROLhd4e5y+Dvf1Pyld4iE2iZa0ZXImbpyDu4OhoedwHn/+d3+8cnS3l30Cr1GLRSgHjpGn9AZGiDmdb2RN/G43/Cx3/M/3LTueEvNS7Rx/JM/Kgwr/w==</latexit><latexit sha1_base64="VswAyNHzYd5iLP4iwvjdBdBAVMQ=">AAADiHicdZFdb9MwFIadhY9Rvjq45OaIaVIrocoZlBahSdN2w+WQ1m5SXSLHdVpvsRPZDjRE4b/wi7jm3+B0LbSssxTpnOec18c5b5QlwliMf3s7/r37Dx7uPmo8fvL02fPm3ouhSXPN+IClSaovI2p4IhQfWGETfplpTmWU8Ivo+rSuX3zl2ohUndsi42NJp0rEglHrUNj8lbWIpHYWxeW8AuJaLRQfYcVINhPVm3+pzNcyU7XhCE5bJizaQPg8A5Lw2Nb5hiIsvpxDHG7cCWtjnViL6cy2Gweu3YmPgMSaspKYXIZlEQpHigrmoahKMqyfeLsCi0IVNvdxJwhwD3cBd3C//x5jF7zFQfewC0EHL84+Wp6zcM/7SSYpyyVXliXUmFGAMzsurwzVVrCEVw2SG55Rdk2nfORCRSU343Kx+woOHJlAnGr3KQsLuq4oqTSmkJHrrH/Y/F+r4bbaKLdxf1wKleWWK3YzKM4TsCnURsJEaM5sUriAMi3cW4HNqFubdXY3iOLfWColVZOSUD2VdO52V09Js5JoCY79qCFJhBTWVLcVQm1ROLhd4e5y+Dvf1Pyld4iE2iZa0ZXImbpyDu4OhoedwHn/+d3+8cnS3l30Cr1GLRSgHjpGn9AZGiDmdb2RN/G43/Cx3/M/3LTueEvNS7Rx/JM/Kgwr/w==</latexit><latexit sha1_base64="VswAyNHzYd5iLP4iwvjdBdBAVMQ=">AAADiHicdZFdb9MwFIadhY9Rvjq45OaIaVIrocoZlBahSdN2w+WQ1m5SXSLHdVpvsRPZDjRE4b/wi7jm3+B0LbSssxTpnOec18c5b5QlwliMf3s7/r37Dx7uPmo8fvL02fPm3ouhSXPN+IClSaovI2p4IhQfWGETfplpTmWU8Ivo+rSuX3zl2ohUndsi42NJp0rEglHrUNj8lbWIpHYWxeW8AuJaLRQfYcVINhPVm3+pzNcyU7XhCE5bJizaQPg8A5Lw2Nb5hiIsvpxDHG7cCWtjnViL6cy2Gweu3YmPgMSaspKYXIZlEQpHigrmoahKMqyfeLsCi0IVNvdxJwhwD3cBd3C//x5jF7zFQfewC0EHL84+Wp6zcM/7SSYpyyVXliXUmFGAMzsurwzVVrCEVw2SG55Rdk2nfORCRSU343Kx+woOHJlAnGr3KQsLuq4oqTSmkJHrrH/Y/F+r4bbaKLdxf1wKleWWK3YzKM4TsCnURsJEaM5sUriAMi3cW4HNqFubdXY3iOLfWColVZOSUD2VdO52V09Js5JoCY79qCFJhBTWVLcVQm1ROLhd4e5y+Dvf1Pyld4iE2iZa0ZXImbpyDu4OhoedwHn/+d3+8cnS3l30Cr1GLRSgHjpGn9AZGiDmdb2RN/G43/Cx3/M/3LTueEvNS7Rx/JM/Kgwr/w==</latexit> µy = P yi=y xi k P yi=y xik <latexit sha1_base64="DY7ikL8+aI74xx0WsEcjQryAVOs=">AAADo3icfZJtb9MwEMedhYdRnjp4yRuLqlIrocoZlFVCSBN7g8SbgtpuUl0ix3VaM9uJbGc0RAG+Ch+Lr8CnwOla1kLHSZHu/ne/u5MvUSq4sQj99Pb8Gzdv3d6/U7t77/6Dh/WDRyOTZJqyIU1Eos8iYpjgig0tt4KdpZoRGQl2Gp2fVPnTC6YNT9TA5imbSDJTPOaUWCeF9V/NtIUlsfMoLhYlxK7WwvwVXGs4nfPy2VUos43IlG34Gp60TJi3IWaLFGLBYlvFW0SYfxzAONzqCTfGOljz2dy2a9uUa45jTWiBTSbDIg+5U/ISXpEhLws8qnb+TwlcVpRhvYE6QYCOUBeiDur1XiLknOco6B52YdBBS2uAlfXDA+8HniY0k0xZKogx4wCldlJ8MkRbTgUrazgzLCX0nMzY2LmKSGYmxfIsJWw6ZQrjRLtPWbhUN4mCSGNyGbnKalvzd64Sd+XGmY17k4KrNLNM0ctBcSagTWB1YzjlmlErcucQqrnbFdI5cQ9p3Z9Qw4p9pomURE0LTPRMkoV7xGpKkhZYS+i0r5WIBZfcmvJfgqsdhBN3E66Xk7+wbeaPeg3E1S5ora4hd9T15eD1zuiwE7jbv3/ROH6zOu8+eAKeghYIwBE4Bm9BHwwB9frehffN++43/Xf+B39wWbrnrZjHYMv8yW9Ovzhf</latexit><latexit sha1_base64="DY7ikL8+aI74xx0WsEcjQryAVOs=">AAADo3icfZJtb9MwEMedhYdRnjp4yRuLqlIrocoZlFVCSBN7g8SbgtpuUl0ix3VaM9uJbGc0RAG+Ch+Lr8CnwOla1kLHSZHu/ne/u5MvUSq4sQj99Pb8Gzdv3d6/U7t77/6Dh/WDRyOTZJqyIU1Eos8iYpjgig0tt4KdpZoRGQl2Gp2fVPnTC6YNT9TA5imbSDJTPOaUWCeF9V/NtIUlsfMoLhYlxK7WwvwVXGs4nfPy2VUos43IlG34Gp60TJi3IWaLFGLBYlvFW0SYfxzAONzqCTfGOljz2dy2a9uUa45jTWiBTSbDIg+5U/ISXpEhLws8qnb+TwlcVpRhvYE6QYCOUBeiDur1XiLknOco6B52YdBBS2uAlfXDA+8HniY0k0xZKogx4wCldlJ8MkRbTgUrazgzLCX0nMzY2LmKSGYmxfIsJWw6ZQrjRLtPWbhUN4mCSGNyGbnKalvzd64Sd+XGmY17k4KrNLNM0ctBcSagTWB1YzjlmlErcucQqrnbFdI5cQ9p3Z9Qw4p9pomURE0LTPRMkoV7xGpKkhZYS+i0r5WIBZfcmvJfgqsdhBN3E66Xk7+wbeaPeg3E1S5ora4hd9T15eD1zuiwE7jbv3/ROH6zOu8+eAKeghYIwBE4Bm9BHwwB9frehffN++43/Xf+B39wWbrnrZjHYMv8yW9Ovzhf</latexit><latexit sha1_base64="DY7ikL8+aI74xx0WsEcjQryAVOs=">AAADo3icfZJtb9MwEMedhYdRnjp4yRuLqlIrocoZlFVCSBN7g8SbgtpuUl0ix3VaM9uJbGc0RAG+Ch+Lr8CnwOla1kLHSZHu/ne/u5MvUSq4sQj99Pb8Gzdv3d6/U7t77/6Dh/WDRyOTZJqyIU1Eos8iYpjgig0tt4KdpZoRGQl2Gp2fVPnTC6YNT9TA5imbSDJTPOaUWCeF9V/NtIUlsfMoLhYlxK7WwvwVXGs4nfPy2VUos43IlG34Gp60TJi3IWaLFGLBYlvFW0SYfxzAONzqCTfGOljz2dy2a9uUa45jTWiBTSbDIg+5U/ISXpEhLws8qnb+TwlcVpRhvYE6QYCOUBeiDur1XiLknOco6B52YdBBS2uAlfXDA+8HniY0k0xZKogx4wCldlJ8MkRbTgUrazgzLCX0nMzY2LmKSGYmxfIsJWw6ZQrjRLtPWbhUN4mCSGNyGbnKalvzd64Sd+XGmY17k4KrNLNM0ctBcSagTWB1YzjlmlErcucQqrnbFdI5cQ9p3Z9Qw4p9pomURE0LTPRMkoV7xGpKkhZYS+i0r5WIBZfcmvJfgqsdhBN3E66Xk7+wbeaPeg3E1S5ora4hd9T15eD1zuiwE7jbv3/ROH6zOu8+eAKeghYIwBE4Bm9BHwwB9frehffN++43/Xf+B39wWbrnrZjHYMv8yW9Ovzhf</latexit><latexit sha1_base64="DY7ikL8+aI74xx0WsEcjQryAVOs=">AAADo3icfZJtb9MwEMedhYdRnjp4yRuLqlIrocoZlFVCSBN7g8SbgtpuUl0ix3VaM9uJbGc0RAG+Ch+Lr8CnwOla1kLHSZHu/ne/u5MvUSq4sQj99Pb8Gzdv3d6/U7t77/6Dh/WDRyOTZJqyIU1Eos8iYpjgig0tt4KdpZoRGQl2Gp2fVPnTC6YNT9TA5imbSDJTPOaUWCeF9V/NtIUlsfMoLhYlxK7WwvwVXGs4nfPy2VUos43IlG34Gp60TJi3IWaLFGLBYlvFW0SYfxzAONzqCTfGOljz2dy2a9uUa45jTWiBTSbDIg+5U/ISXpEhLws8qnb+TwlcVpRhvYE6QYCOUBeiDur1XiLknOco6B52YdBBS2uAlfXDA+8HniY0k0xZKogx4wCldlJ8MkRbTgUrazgzLCX0nMzY2LmKSGYmxfIsJWw6ZQrjRLtPWbhUN4mCSGNyGbnKalvzd64Sd+XGmY17k4KrNLNM0ctBcSagTWB1YzjlmlErcucQqrnbFdI5cQ9p3Z9Qw4p9pomURE0LTPRMkoV7xGpKkhZYS+i0r5WIBZfcmvJfgqsdhBN3E66Xk7+wbeaPeg3E1S5ora4hd9T15eD1zuiwE7jbv3/ROH6zOu8+eAKeghYIwBE4Bm9BHwwB9frehffN++43/Xf+B39wWbrnrZjHYMv8yW9Ovzhf</latexit>
  • 44. Rethinking — 球⾯Embeddingsの理解 下式を最適化することは、 下記の確率モデルの最尤推定に等しい。 (1) 各Identityごとの顔画像は集中度パラメータsが共通なvMF分布に従い、 (2) 各Identityは等確率に選択される。 ※ ArcFaceは確率モデル化できてないが、ノリはだいたい同じ? 44 共通でいいの? 実際は⾮⼀様では?
  • 48. Copyright © ABEJA, Inc. All rights reserved. We are hiring! 48 https://www.wantedly.com/companies/abeja