Your SlideShare is downloading. ×
入門機械学習読書会9章
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

入門機械学習読書会9章

368
views

Published on

入門機械学習読書会9章

入門機械学習読書会9章

Published in: Technology

0 Comments
2 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
368
On Slideshare
0
From Embeds
0
Number of Embeds
2
Actions
Shares
0
Downloads
10
Comments
0
Likes
2
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. 第5回入門機械学習 読書会 2013.08.24 @kzfm
  • 2. 9章 MDS
  • 3. サンプルコード !   https://gist.github.com/kzfm/ 6325547 !  
  • 4. 距離とは? !   2つのデータが似ている度合い(非類似度、距 離) !   ユークリッド距離 !   マンハッタン距離 !   tanimoto(A&B/(A¦B-(A&B))) !   コサイン類似度
  • 5. とりあえず相関 !   これだとあまり有益な情報が出てこない sseett..sseeeedd((885511998822)) eexx..mmaattrriixx <<-- mmaattrriixx((ssaammppllee((cc((--11,, 00,, 11)),, 2244,, rreeppllaaccee == TTRRUUEE)),, nnrrooww == 44,, nnccooll == 66)) rrooww..nnaammeess((eexx..mmaattrriixx)) <<-- cc((''AA'',, ''BB'',, ''CC'',, ''DD'')) ccoollnnaammeess((eexx..mmaattrriixx)) <<-- cc((''PP11'',, ''PP22'',, ''PP33'',, ''PP44'',, ''PP55'',, ''PP66'')) eexx..mmaattrriixx eexx..mmuulltt <<-- eexx..mmaattrriixx %%**%% tt((eexx..mmaattrriixx)) eexx..mmuulltt
  • 6. 距離行列を作る !   下三角 >> eexx..ddiisstt <<-- ddiisstt((eexx..mmuulltt)) >> eexx..ddiisstt AA BB CC BB 66..224444999988 CC 55..447777222266 55..000000000000 DD 22..223366006688 66..778822333300 66..008822776633
  • 7. MDS(Multi Dimensional Scaling)とは !   距離の類似度を可視化して表現するための手法 !   主成分分析の様に分類対象物の関係を低次元空 間における点の布置で表現する手法である(似 たものは近くに、異なったものは遠くに配置す る) !   距離行列を用い、二点の距離を近似する座標を 返す !   二次元に潰すので近似になる !   三角錐を二次元に射影することを考えれば
  • 8. MDSを使う !   cmdscale関数が用意されている eexx..mmddss <<-- ccmmddssccaallee((eexx..ddiisstt)) pplloott((eexx..mmddss,, ttyyppee == ''nn'')) tteexxtt((eexx..mmddss,, cc((''AA'',, ''BB'',, ''CC'',, ''DD''))))
  • 9. 事例 !   米国の議会は分極しているのか? !   共和党と民主党は重ならないのか? !   点呼投票データ !   法案に賛成したか反対したかのデータを用いて政 治的な距離を測る !   点呼投票データでクラスタリングしたとき、異 なる政党の上院議員は交わるか?
  • 10. result
  • 11. result 2
  • 12. おまけ !   距離を使うやり方には他にはstochastic proximity embedding(SPE)という方法も あります。 !   利点は計算時間がはやい !   http://blog.kzfmix.com/entry/ 1273835887 !   右の本もクラスタリング手法の情報が多い