More Related Content
PPTX
PDF
PDF
StanとRでベイズ統計モデリング読書会 導入編(1章~3章) PDF
PPTX
StanとRでベイズ統計モデリングに関する読書会(Osaka.stan) 第四章 PDF
PPTX
PDF
Cmdstanr入門とreduce_sum()解説 What's hot
PDF
PDF
PPTX
PDF
PDF
PPTX
StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章 PPTX
PDF
なぜベイズ統計はリスク分析に向いているのか? その哲学上および実用上の理由 PDF
PPTX
PPT
PPTX
【読書会資料】『StanとRでベイズ統計モデリング』Chapter12:時間や空間を扱うモデル PDF
StanとRでベイズ統計モデリング読書会 Chapter 7(7.6-7.9) 回帰分析の悩みどころ ~統計の力で歌うまになりたい~ PPTX
PPTX
PDF
PDF
PPTX
PDF
PDF
Viewers also liked
PDF
2012-1110「マルチレベルモデルのはなし」(censored) PDF
PDF
第3章 変分近似法 LDAにおける変分ベイズ法・周辺化変分ベイズ法 PDF
読書会 「トピックモデルによる統計的潜在意味解析」 第2回 3.2節 サンプリング近似法 PDF
RStanとShinyStanによるベイズ統計モデリング入門 PDF
PDF
『予測にいかす統計モデリングの基本』の売上データの分析をトレースしてみた PDF
PDF
PDF
データ解析で割安賃貸物件を探せ!(山手線沿線編) LT PDF
PDF
「トピックモデルによる統計的潜在意味解析」読書会「第1章 統計的潜在意味解析とは」 PPTX
PDF
「トピックモデルによる統計的潜在意味解析」読書会 2章前半 PDF
トピックモデルによる統計的潜在意味解析 2章後半 Similar to 順序データでもベイズモデリング
PDF
PDF
PDF
PDF
Bayesian Sushistical Modeling PDF
PPT
PDF
読書会 「トピックモデルによる統計的潜在意味解析」 第6回 4.3節 潜在意味空間における分類問題 PPTX
PDF
PDF
ビジネス基礎講座:統計学入門 introduction to statistics PDF
Jubatusにおける大規模分散オンライン機械学習 PDF
【Zansa】第12回勉強会 -PRMLからベイズの世界へ PDF
PDF
PPTX
Nttr study 20130206_share PDF
PDF
PDF
Appendix document of Chapter 6 for Mining Text Data PPTX
離散一般化ベータ分布を仮定した研究分野マッピングの導出 PDF
Infer net wk77_110613-1523 More from . .
PDF
MCMCサンプルの使い方 ~見る・決める・探す・発生させる~ PDF
統計モデリングで癌の5年生存率データから良い病院を探す PDF
PDF
PDF
Stanの紹介と応用事例(age heapingの統計モデル) PDF
とある病んだ院生の体内時計(サーカディアンリズム) PDF
PDF
PDF
順序データでもベイズモデリング
- 1.
- 2.
- 3.
- 4.
- 5.
- 6.
幅を見る
• (パラメータの)信頼区間
• (新しいデータの)予測区間
•ブートストラップ
• クロスバリデーション
Take a Risk:林岳彦の研究メモ
おっと危ない:信頼区間と予測区間を混同しちゃダメ
http://takehiko-i-hayashi.hatenablog.com/entry/20110204/1296773267
参考: takehiko-i-hayashi さんの記事
- 7.
おすすめはベイズモデリング
• 十分に広い一様な事前分布𝑝 𝜃をとれば、
事後分布 𝑝 𝜃|𝑋 ∝ 𝑝 𝜃 𝑝 𝑋|𝜃 を最大にする𝜃 = 𝜃∗は最尤推定量と一致する。
• しかし、最尤推定量𝜃∗を使った予測分布𝑓 𝑥 = 𝑝 𝑥|𝜃∗ と、
ベイズ推定による予測分布 𝑓 𝑥 = 𝑝 𝑥|𝜃 𝑝 𝜃|𝑋 𝑑𝜃 は
モデルが複雑になると一致しない。 𝜃の幅(分布)が効いてくる!
• 最尤推定量を使った予測分布は過適合になりやすい。
事前分布を決めないとダメ
なんでも幅をつけられる
複雑な確率モデルでも大丈夫
- 8.
ベイズモデリング可能なRパッケージ
• {bayesm}
• {MCMCpack}
•{Zelig}
• SAS MCMC proc
• {R2WinBUGS}
• {rjags},{runjags}
• {rstan}
• {LaplacesDemon}
息してない?
約40個のモデルから選ぶのが面倒 ラク・結構速い
ちょっと遅い サンプラーが豊富
1行で
実行
モデル式
書くよ
離散パラメータ使いづらい 収束しやすい
エラーメッセージが地獄 使いやすい
- 9.
- 10.
- 11.
- 12.
- 13.
- 14.
worst1 worst2 worst3worst4 worst5 best5 best4 best3 best2 best1
法政大 日大 慶応 九大 成蹊 東大 北大 東大 九大 東工大
慶応 一橋 慶応 慶応 東北大 中央大 神戸 早稲田 東北大 慶応
青学 青学 学習院 明治大 学習院 東北大 慶応 名大 立命館 早稲田
独協 九大 京大 九大 名大 阪大 東大 慶応 慶応 一橋
… … … … … … … … … …
日大 日大 日大 日大 お茶の水 九大 九大 北大 東大 早稲田
明治大 明治大 お茶の水 東大 慶応 立命館 慶応 北大 早稲田 早稲田
慶応 東北大 東北大 明治大 九大 阪大 京大 お茶の水 阪大 東大
使えない 使える
※データはイメージです
Q. どのようにランキングしますか?
- 15.
worst1 worst2 worst3worst4 worst5 best5 best4 best3 best2 best1
法政大 日大 慶応 九大 成蹊 東大 北大 東大 九大 東工大
慶応 一橋 慶応 慶応 東北大 中央大 神戸 早稲田 東北大 慶応
青学 青学 学習院 明治大 学習院 東北大 慶応 名大 立命館 早稲田
独協 九大 京大 九大 名大 阪大 東大 慶応 慶応 一橋
・・・ ・・・ ・・・ ・・・ ・・・ ・・・ ・・・ ・・・ ・・・ ・・・
日大 日大 日大 日大 お茶の水 九大 九大 北大 東大 早稲田
明治大 明治大 お茶の水 東大 慶応 立命館 慶応 北大 早稲田 早稲田
慶応 東北大 東北大 明治大 九大 阪大 京大 お茶の水 阪大 東大
1点 2点 3点 4点 5点5点 4点 3点 2点 1点
「使えるポイント・使えないポイント」の集計
- 16.
ネット上の議論
使えるポイント − 使えないポイントでソートすべき
使えるポイント
使えるポイント + 使えないポイント
でソートすべき
僕個人の意見
可視化としては上記のようなオレオレ指標をどんどん使ってOK
でもそれはトドメの解析や意思決定では使わない方がよい
- 17.
以降で扱う仮想データ
worst1 worst2 worst3worst4 worst5 best5 best4 best3 best2 best1
法政大 日大 慶応 九大 成蹊 東大 北大 東大 九大 東工大
慶応 一橋 慶応 慶応 東北大 中央大 神戸 早稲田 東北大 慶応
青学 青学 学習院 明治大 学習院 東北大 慶応 名大 立命館 早稲田
独協 九大 京大 九大 名大 阪大 東大 慶応 慶応 一橋
・・・ ・・・ ・・・ ・・・ ・・・ ・・・ ・・・ ・・・ ・・・ ・・・
日大 日大 日大 日大 お茶の水 九大 九大 北大 東大 早稲田
明治大 明治大 お茶の水 東大 慶応 立命館 慶応 北大 早稲田 早稲田
慶応 東北大 東北大 明治大 九大 阪大 京大 お茶の水 阪大 東大
worst1 worst2 worst3 worst4 worst5 best5 best4 best3 best2 best1
16 30 7 2 19 4 15 4 2 29
7 5 7 7 6 13 25 11 6 7
12 12 23 3 23 6 7 8 9 11
1 2 22 2 8 24 4 7 7 5
30 30 30 30 26 2 2 15 4 11
3 3 26 4 7 9 7 15 11 11
7 6 6 3 2 24 22 26 24 4
IDに置き換え
- 18.
worst1 worst2 worst3worst4 worst5 best5 best4 best3 best2 best1
16 30 7 2 19 4 15 4 2 29
7 5 7 7 6 13 25 11 6 7
12 12 23 3 23 6 7 8 9 11
1 2 22 2 8 24 4 7 7 5
30 30 30 30 26 2 2 15 4 11
3 3 26 4 7 9 7 15 11 11
7 6 6 3 2 24 22 26 24 4
V
投票者
W職場の人数
U
大学の数
- 19.
- 20.
- 21.
- 22.
- 23.
- 24.
- 25.
- 26.
- 27.
シンプルなモデルから考える V=1, U=2,W=2の例
確率 𝑝 確率 1 − 𝑝
1 2
𝑝 ~ unif 0,1
入社
1 2
いびつなコインで決めた
1or2 ~ bernoulli 𝑝
worst1 best1
1 2
𝜇1 𝜇2
𝑝𝑓 𝑝𝑓<
𝜇 𝑢 ~ normal 0, 𝜎
𝜎 ~ unif 0,100
入った人のパフォーマンス
𝑢 = 1,2
知りたいパラメータの値
- 28.
V=1, U=3, W=4の例
確率𝑝1 確率 𝑝2
1 2
𝑝1, 𝑝2, 𝑝3~ dirichlet 1,1,1
3
確率 𝑝3
入社
1 1 2 3
いびつなサイコロで決めた
1or2or3 ~ categorical 𝑝1, 𝑝2, 𝑝3
worst1 worst2 best2 best1
1 2 1 3
𝜇1 𝜇2
𝑝𝑓 < 𝑝𝑓 < 𝑝𝑓 < 𝑝𝑓
𝜇 𝑢 ~ normal 0, 𝜎
𝜇3
𝜎 ~ unif 0,100
𝑢 = 1,2,3
- 29.
最終的なモデル
V=50, U=30, W=20に相当
𝑝1, 𝑝2, … , 𝑝 𝑈~ dirichlet 1,1, … , 1
𝜇 𝑢 ~ normal 0, 𝜎
𝜎 ~ unif 0,100
𝑼𝒏𝒊𝒗 𝒗,𝒘 ~ categorical 𝑝1, 𝑝2, … , 𝑝 𝑈
𝑝𝑓𝑣,𝑤 ~ normal 𝜇 𝑼𝒏𝒊𝒗 𝒗,𝒘
, 1
𝑝𝑓𝑣,1 < 𝑝𝑓𝑣,2 < ⋯ < 𝑝𝑓𝑣,𝑊 𝑣 = 1,2, … , 𝑉
が成り立つ時だけサンプリングを行う (その時だけ尤度に寄与があると考える)
データは大学のインデックス𝑼𝒏𝒊𝒗 𝒗,𝒘だけ.
𝑢 = 1,2, … , 𝑈
𝑣 = 1,2, … , 𝑉 𝑤 = 1,2, … , 𝑊
𝑣 = 1,2, … , 𝑉 𝑤 = 1,2, … , 𝑊
- 30.
- 31.
- 32.
- 33.