62. 特徴点分布同士の近さを測る
Earth Mover's Distance 3/3
どの特徴量同士をマッチさせる?→ 全部(完全2部グラフ)
出来るかぎり近い者同士がマッチするように(最小化問題)
0.2 0.30.5
0.15 0.10.30.45
各円が特徴量、
その大きさが頻度を表しています
T da
j
i
=
db
輸送量 輸送距離 / 正規化
63. 文書同士の近さを測る
Word Mover's Distance 1/3
文書=「word2vec の分布」と捉え、EMD を適用
[Kusner et al., '15]
単語のベクトル表現の一覧 X ∈ Rd×n
特徴量集合は文書間で共有(ないところは 0 になるスパース表現)
文書の正規化された BoW (nBoW) da, db
64. 文書同士の近さを測る
Word Mover's Distance 1/3
文書=「word2vec の分布」と捉え、EMD を適用
[Kusner et al., '15]
単語のベクトル表現の一覧 X ∈ Rd×n
特徴量集合は文書間で共有(ないところは 0 になるスパース表現)
文書の正規化された BoW (nBoW) da, db 正規化項は不要
65. 文書同士の近さを測る
Word Mover's Distance 1/3
文書=「word2vec の分布」と捉え、EMD を適用
[Kusner et al., '15]
単語のベクトル表現の一覧 X ∈ Rd×n
特徴量集合は文書間で共有(ないところは 0 になるスパース表現)
文書の正規化された BoW (nBoW) da, db 正規化項は不要
word2vec の
L2 ノルム
66. 文書同士の近さを測る
Word Mover's Distance 1/3
文書=「word2vec の分布」と捉え、EMD を適用
[Kusner et al., '15]
単語のベクトル表現の一覧 X ∈ Rd×n
特徴量集合は文書間で共有(ないところは 0 になるスパース表現)
文書の正規化された BoW (nBoW) da, db 正規化項は不要
word2vec の
L2 ノルム
不等号ではなく等号
67. 文書同士の近さを測る
Word Mover's Distance 1/3
文書=「word2vec の分布」と捉え、EMD を適用
[Kusner et al., '15]
単語のベクトル表現の一覧 X ∈ Rd×n
特徴量集合は文書間で共有(ないところは 0 になるスパース表現)
文書の正規化された BoW (nBoW) da, db 正規化項は不要
word2vec の
L2 ノルム
不等号ではなく等号
92. 原著論文 1/2
[Huang et al., '16] Supervised Word Mover's Distance
G. Huang, C. Guo, M.J. Kusner, Y. Sun, K.Q. Weinberger, F. Sha.
Supervised Word Mover's Distance. In NIPS 2016.
https://papers.nips.cc/paper/6139-supervised-word-movers-distance
[Mikolov et al., '13] word2vec
T. Mikolov, K. Chen, G. Corrado, J. Dean. Efficient Estimation of Word
Representations in Vector Space. In ICLR 2013 Workshop.
https://arxiv.org/abs/1301.3781
[Rubner et al., '98] Eearth Mover's Distance
Y. Rubner, C. Tomasi, L.J. Guibas. A Metric for Distributions with
Applications to Image Databases. In ICCV 1998.
http://ieeexplore.ieee.org/abstract/document/710701/
http://ai.stanford.edu/~rubner/papers/rubnerIccv98.pdf
93. 原著論文 2/2
[Kusner et al., '15] Word Mover's Distance
M.J. Kusner, Y. Sun, N.I. Kolkin, K.Q. Weinberger. From Word
Embedding To Documents Distances. In ICML 2015.
http://www.jmlr.org/proceedings/papers/v37/kusnerb15.html
[Goldberger et al., '05] Neighborhood Component Analysis
J. Goldberger, S. Roweis, G. Hinton, R. Salakhutdinov. Neighborhood
Component Analysis. In NIPS 2005.
https://papers.nips.cc/paper/2566-neighbourhood-components-analysis
94. 日本語の参考文献
Word Mover's Distance
Word Mover's Distance: word2vecの文書間距離への応用 -
yubessy.hatenablog.com
http://yubessy.hatenablog.com/entry/2017/01/10/122737
From Word Embeddings To Document Distances
http://www.slideshare.net/kentonozawa75/from-word-embeddings-
to-document-distances
Earth Mover's Distance
Earth Mover's Distance (EMD) - 人工知能に関する断創録
http://aidiary.hatenablog.com/entry/20120804/1344058475