Ml for nlp_chapter_4
- 9. 多変数ベルヌーイモデル 単語の生起・不生起をモデル化 モデルの導入 語彙V:単語の集合 :ベルヌーイ分布に従う確率変数 単語w クラスc ・単語wがクラスcの事例内で出現する場合に1の値をとる :各ベルヌーイ分布を規定するパラメータ ・これらのベルヌーイ分布は互いに独立とする P(d|c)は多変数ベルヌーイ分布に従う (1.3.4)
- 14. 例題4.1 “good bad good good” “exciting exciting” P氏 “good goodexciting boring” “bad boringboringboring” “bad good bad” N氏 “bad badexciting boring” 統計値の一部 同じ文書における頻度情報は パラメータ計算に影響しない パラメータの一部
- 30. 最尤推定 パラメータの比較 多項モデル 多変数ベルヌーイモデル (クラスcに属する訓練文書全体のうちwの出現回数) (クラスcに属する訓練文書全体の全単語の出現回数) (クラスcに属する訓練文書のうちwを含む文書の数) (クラスcに属する訓練文書数)
- 31. 例題4.6 “good bad good good” “exciting exciting” P氏 “good goodexciting boring” “bad boringboringboring” “bad good bad” N氏 “bad badexciting boring” 統計値の一部 パラメータの一部 単語に関する和を取る