Unigram mixtures

1,007 views
838 views

Published on

Unigram mixturesの簡単な紹介

Published in: Technology
0 Comments
2 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
1,007
On SlideShare
0
From Embeds
0
Number of Embeds
28
Actions
Shares
0
Downloads
2
Comments
0
Likes
2
Embeds 0
No embeds

No notes for slide

Unigram mixtures

  1. 1. Unigram Mixtures の話 @fmkz___
  2. 2. 教師あり学習とは?
  3. 3. 教師なし学習とは?
  4. 4. 教師あり学習でのラベルを潜在変 数として推定するのが 教師なし学習
  5. 5. •  教師あり学習: p(y¦x) •  教師なし学習: p(x) = Σyp(x¦y)p(y)
  6. 6. K-means h"p://tech.nitoyon.com/ja/blog/2009/04/09/kmeans-­‐visualise/
  7. 7. •  距離の中心を計算して •  最も近いクラスに割り当てて •  を繰り返す
  8. 8. EMアルゴリズム •  EMアルゴリズムは観測データの対数尤度 を、E stepとM stepの繰り返しにより 最大化するアルゴリズム
  9. 9. スパムとハムの話に戻る •  教師あり学習 –  事前にスパムとハムに分類していた •  これをラベルを付与してない状態から2つ のグループに分割できないか? –  教師なし学習
  10. 10. Unigram Mixtures
  11. 11. アルゴリズム •  このスライドが詳しい –  http://www.ism.ac.jp/ daichi/ lectures/ISM-2012-TopicModelsdaichi.pdf
  12. 12. 実装 •  R –  https://github.com/ariddell/ mixture-of-unigrams •  C –  http://www.ism.ac.jp/ daichi/ lectures/H24-TopicModels.html
  13. 13. デモ 本当はいつものようにeしずおかのブログ のデータを分類するつもりだったのだけど 読書が急がしくてやる暇なかったw
  14. 14. まとめ •  入門機械学習のナイーブベイズの応用とし てUnigram Mixturesの紹介とデモを しました

×