StanとRでベイズ統計モデリング 1-2章
葛木美紀 Miki Katsuragi
I Chapter 1
統計モデリングとStanの概要
- モデル:複雑な事象の不要な部分を無視してエッセ
ンスだけを取り上げたもの(例:プラモデル)
- 確率モデル:エッセンスを確率分布を取り入れた数
式で表現
- 統計モデリング:確率モデルをデータに当てはめて
現象の理解と予測を促すこと、データ発生のメカニズ
ムを確率分布で表現
- パラメータ:確率分布を特徴づける値 • 正規分布な
ら平均値と分散(あるいは標準偏差)->これを知るこ
とが統計モデリング の1つの目的
I 統計モデリングとは
I Chapter 2
ベイズ推定の復習
確率分布:確率変数がとりうる値の発生しやすさ=分布 p(a)
I 基本用語と記法
離散確率変数
-> 確率質量関数
連続確率変数
-> 確率密度関数
同時分布と周辺分布
I 基本用語と記法
同時分布:確率分布が複数個ある場合に
発生しやすさを確率で表したもの。確率
変数がaとbの二つである場合 P(a,b) と書
き、確率変数がK個ある場合以下のように
書く。
周辺化:同時分布から特定の確率変数の
とりうる値について和をとるもしくは積
分することで消去すること。
その他の用語
I 基本用語と記法
- 条件付き確率分布:同時分
布p(a,b)で確率変数b0が与え
られた時の確率変数aの分布
を条件付き確率分布p(a|b0)
と書き以下が成り立つ。
-正規化:ある関数の和や積
分が1になるように関数に定
数をかけること。
-大文字からはじまるアルフ
ァベット:YやAgeなど大文
字からはじまるアルファベッ
トは、与えられたデータを示
す
-ベクトルは x, 行列はXとい
うように大文字の太字で表す。
-偏微分:ある2変数の関数
f(θ1,θ2)でθ2を定数とみなし
てθ1のみを動かす時の微分
をf(θ1,θ2)のθ1についての
偏微分と呼ぶ。
-yが確率分布p(y)に従う
(例) yがPoisson(y|λ)から確率的に生成される
パラメータθはある一点の真の値を持つ定数と考える
I 伝統的な統計学の問題点
- 検定の解釈が直感的でない
- 仮説Hが正しいとした時にデータYかそれより極端なデータが得られる確
率(例:p(y>=Y|H))をp値と呼んで検定に使うが、p値は有意水準との比
較に使われるものなので直感的に解釈しにくい
- ベイズ統計はデータが得られた時の仮説Hが正しいかという確率p(H|Y)を
求めることができ、解釈しやすい。
- 信頼区間の解釈が直感的でない
- パラメータθは定数なので「θの値が区間[a,b]にある確率は95%である」
という言い方ができない
- 「データを取り直して解析を繰り返した時に『θの値が区間[a,b]にある』
と言えば95%くらい当たっているだろう」という解釈をしなければなら
ない
- 複雑なモデルにおいて信頼区間と予測区間の算出が難しい
- 複雑なモデルに含まれるパラメータの信頼区間や予測区間を求めるのは
理論的に難しく、数式も難解。
I 尤度とは
- 母数(パラメータ)の尤もら
しい値を推定する方法
- θ=母数=パラメーター:確率分
布を特徴づける数的指標
- P(D|H)
壺A
5分の3
壺B
5分の1
が各壺から選ばれる確率
99%
1%
ジャイアンが勝ちそうな確率 v.s.
のび太が勝ちそうな確率
- 理論分布の母数を観測データから推定する
方法
- フィッシャーが提案した20世紀の伝統的統
計論
- 推定論の中心的方法
- 例:コインの表が出る確率p(母数)を推定
- 5回コインを投げると表、表、裏、表、
裏と出た場合の尤度関数
MLE(maximum likelihood estimation)
I 最尤推定法とは
p=0.6 のとき尤度関数
L(p) が最大 -> 表が出る確
率 p は0.6 と推定される
(最尤推定法)
0.6
L(p)
最尤推定値
尤度
I コインの表が出る確率pを推定する場合
● 2項分布の確率関数は、本来成功回数xの関数
○ f(x|0.3) = 10Cx 0.3 (1-0.3)
○ 成功回数:変数 / 母数は定数=既知
● だが、(2.19)では以下のように定義される
○ f(4|0.3) = 10C4 0.3 (1-0.3)
○ 成功回数:定数 / 母数が変数=未知
x
(n−x)
4 (10−4)
現実世界ではデータ
(成功数)が固定されて
いるのでこちらが近
い(母数が既知なのは
サイコロなどに限ら
れてる)
確率0.3で成功するフリースローが10投中4回成功する確率は?
I 2項分布における尤度の例
● 確率関数の定数と変数を逆転して
○ f(x|θ)=nCx θ(1-θ)
● というようにθの関数と見た式を尤度関数と呼ぶ
○ θについて積分しても1にならない
○ 尤度が最大のときの変数θ=母数の推定値
● 確率は上記式をxの関数と見たもの
■ xについて足すと1になる
(n−x)
I 2項分布における尤度の例
- 積の連なりなので最大化するのが困難 -
>対数変換で足し算に
- logf(x|θ) = xlog(θ) + (n-x)log(1-θ) + C
- Cは母数を含まない定数
- この式を対数尤度関数と呼ぶ
I 対数尤度関数
● 最大地点は丘のピーク(平ら)で
ある必要があるため母数で微分し
て0になる方程式を解く
● logf(x|θ) = − − = 0 -
>尤度方程式
● 10投中4回成功した場合成功率は
0.4と推定される -> 推定値
d
dθ
x
θ
n − x
1 − θ
I 対数尤度関数をθに関して最大化するには
モデルが複雑になると最尤推定では効果が期待できない場合も。。
I 最尤法の問題点
- 過学習しやすくなる
- サイコロを3回振って3回とも1が出てしまった場合、最
尤推定では「1の目が出る確率が1、それ以外が0」と推
定してしまう
- 計算が難しくなる
- パラメータ空間全体の中で最もよい値を大域最適値と呼
び、制限された範囲の中で最も良い値を局所最適値と呼
ぶが、最尤推定アルゴリズムの多くで初期値の近くにあ
る局所最適値にひっかかりやすいため、十分に最適化さ
れない場合も。
I Chapter 2.4
ベイズ推定とMCMC
- 母数(例:平均値)を
固定して得られたデー
タの確率を算出
- 固定された母数の正当
性を調べる(例:μの区
間推定)
0
固定
x
横軸がデータ
I 従来の統計学
- 母数(例:平均値、分
散)をデータから調べる
- θは固定されているとい
う考えにかわりない
μ
パラメータを調べる
I 最尤推定の場合
θの分布p(θ)を調べる
母数θ1
母数θ2
母数θ3
データD
I ベイズ統計の場合
I MCMCの考え方
事後分布 事前分布尤度
正規化定数
(計算が大変)
ここから乱数サンプル
を多数発生させて事後
分布のかわりにする
I RStanのtrace plot例
収束しない場合
thinningで改善す
ることもあるが、
モデルが適切でな
いといくらステッ
プ数やthinningを
増やしても収束し
ない
Warmup:
P(Y|θ)P(θ)が高いところを探し
ている
どのchainも同様
の値をとるように
->収束
I ベイズ信頼区間と予測区間
- ベイズ信頼区間:パ
ラメータの幅、
MCMCによる事後分
布
- ベイズ予測区間:ベ
イズ推定で求めた予
測分布から算出した
予測区間
I 事前分布の選び方
- 第一の選択肢:無情報事前分布(以下いずれか)
- 範囲の広い一様分布
- 十分に平らな正規分布
- 背景知識がある場合:弱情報事前分布
- 例:人間の身長は3m以内
- 背景知識が十分でない時:主観的な事前分布は良く
ない
- 再現性の低下の元になる
- 無情報事前分布と結果を比較すべき

StanとRでベイズ統計モデリング 1,2章

Editor's Notes

  • #3 I How to : Editing Animated Interstitial Slides Step 1 - Text Replace the following text on this slide: Title Subtitle Step 2 - Animated Slide This is an animated interstitial slide, please do not move any content.
  • #5 I How to : Editing Animated Interstitial Slides Step 1 - Text Replace the following text on this slide: Title Subtitle Step 2 - Animated Slide This is an animated interstitial slide, please do not move any content.
  • #13 母数が既知なのはコインやサイコロ投げなど限られた場面のみ
  • #15 あてはまりのよさを計算するときもカイ二乗値を計算するのに対数尤度を使う
  • #18 I How to : Editing Animated Interstitial Slides Step 1 - Text Replace the following text on this slide: Title Subtitle Step 2 - Animated Slide This is an animated interstitial slide, please do not move any content.