SlideShare a Scribd company logo
1 of 41
Download to read offline
いいからベイズ推定してみる
広島大学大学院教育学研究科
平川 真
第3回Hijiyama.R (2015.11.28)
おしながき
 ベイズ推定について
 ベイズ推定のやりかた
 glmmstan()で遊んでみた
ベイズ推定について
推定法としてのベイズ
 従来の推定法(最尤法、最小二乗法)
> パラメタが定数、データが確率変数と考える
 ベイズ推定
> パラメタが確率変数、データが定数と考える
> 手元のデータからパラメタを推測 (=不確実性が伴う) する、
という自然な発想
推定法としてのベイズ
http://norimune.net/708
推定法としてのベイズ
𝑓(𝜃|𝐷) =
𝑓 𝐷 𝜃 ∗ 𝑓(𝜃)
𝑓(𝐷)
事後分布
尤度 事前分布
周辺尤度
あるデータのときの
θの分布
データを得る前の
θの分布
尤度ってなんだ
 あるデータを得たときに、分布のパラメタが特定の値である
ことがどれほど尤もらしいか
> 最尤法: 尤度が最も高い値をパラメタの推定値とする
http://norimune.net/2510
ベイズ推定のいいところ
 事前分布を設定できる
 データが少なくても推定できる
 解析的に解けない複雑なモデルでもいける
 パラメタを確率変数として考える
事前分布を設定できる
 いろんな立場がある
> 豊田(2015)の立場
“公的分析では無情報事前分布を使用し、
尤度への影響を最小限にすべきである (p. 69)”
 おそらく研究実践では無情報事前分布を使うことになる
⇒ 最尤法と変わらないではないか
最尤推定量 = 尤度 * 一様分布
データが少なくても推定できる
とはいえ、
データはあった方が良い
パラメタを確率変数と考える
 頻度主義の区間推定
> 標準誤差: 標本統計量 (≠パラメタ) のちらばり
> 95%信頼区間:「95%の95%CIが真値を含む」という意味
 ベイズ主義の区間推定
> 事後標準偏差: パラメタのちらばり
> 95%信用区間:「真値が含まれる確率が95%」という意味
ベイズ推定のやり方
rstanでt検定的な
サンプリングしたパラメタを利用
して生成量を定義
μ2-μ1>0である確率を求められる
rstanで回帰分析
2番目に簡単なrstanコード
http://qiita.com/hoxo_m/items/ad4ffb091aec535f3125
rstanで混合分布
GLMM
 一般化線形混合モデル
> Generalized Linear Mixed Modeling
> G: 正規分布以外の確率分布を扱える
> M: 固定効果だけでなく変量効果を組み込める
> 線形モデル(LM)を含んでいる
⇒ ベイズ推定でGLMMできたらなぁ(お手軽に)
あった
SappoRo.R #5 (2015.11.14)
 開発者による説明
> http://www.slideshare.net/simizu706/glmmstan-55104119
 youtubeでもみれる
> https://www.youtube.com/watch?v=Kd0pxFq9F6c
> 30分でスライド70枚越を疾走する動画
glmmstanパッケージ
 インストール方法
glmmstanの特徴
 stanコードを生成し、実行してくれる
> stanコードを自力で書かなくても分析できる
> stanコードをみることができるので、コードの書き方の勉
強もできる
 モデル式はglmer()と同じ文法
> glmmstan(y ~ x1+x2+(1|id), data=dat)
glmmstanの遊び方(開発者推奨)
 いろんなモデルをベイズ推定してみる
 慣れたらstanコードを修正してみる
 ハマってきたらstanコードを自分で書いてみる
 興奮してきたら新しい統計モデルを作ってみる
glmmstan()で遊んでみた
データの説明
 間接的発話の理解傾向を測定する尺度(18項目)
> 状況についての簡単な説明文+発話
> 発話の字義的意味と間接的意味を呈示し、妥当だと思う解
釈を選択させる(2値)
分析したいこと
 間接的意味を妥当だと思う程度を検討したい
> 妥当だと思う・思わないの2値変数
> 上限がある (n=18) ので二項分布を使ったモデリング
 個人は確率θで間接的意味を妥当だと思う
> 反応数 ~ binomial(θ, n)
反応確率の推定
 結果
間接的意味を妥当
だと判断した数
字義的意味を妥当
だと判断した数
データはこんな感じ→
←確率になおす
個人差を考えたい
 確率θは個人によって異なるだろう(むしろそこが知りたい
> 反応数 ~ binomial (θi, n)
> θiも何らかの確率分布から発生する
⇒ 階層ベイズ!
個人を変量効果として
モデルにいれる
個人差を考えたい
 stanコードをみてみる
個人差を考えたい
 モデルブロックを拡大
変量効果が
ないモデル→
分布をまぜまぜ
個人差を考えたい
 結果
beta →
tau_sd1 →
けっこう大きい
ベータ二項分布
 二項分布のθがベータ分布に従う分布
⇒ 階層モデルと何が違う?
やってみる
うまくいってない。。
項目の違いを考えても構わんのだろう?
 確率θは項目によっても異なるだろう
> 間接的意味がわかりやすい項目
> わかりにくい項目
 データを縦長の型にする
 項目の変量効果もモデルにいれる
分布をまぜまぜ
項目の違いを考えても構わんのだろう?
項目の違いを考えても構わんのだろう?
 結果
95%CIが広くなった
項目の違いを考えても構わんのだろう?
 結果
ASD尺度との関連
 間接的発話の理解における個人差
> 自閉スペクトラム症 (ASD: autism spectrum disorder)
> 定型発達者の中でも、理解が困難な人も
> 過剰に間接的な意味を読み取る人も
⇒ ASD傾向が高い人は字義的解釈を妥当だと判断するだろう
ASD尺度との関連
stan_glmer()
さわりだけ
 rstanarmのインストール
 glmer()の文法
> glmmstan()とかわらない
使える分布
 stan_glmer()
 glmmstan()
擬似○○
過分散が生じたとき
こんな感じ
ちょっと結果がみにくい、かなぁ

More Related Content

What's hot

ベイズファクターとモデル選択
ベイズファクターとモデル選択ベイズファクターとモデル選択
ベイズファクターとモデル選択kazutantan
 
ブースティング入門
ブースティング入門ブースティング入門
ブースティング入門Retrieva inc.
 
ベイズ統計によるデータ解析
ベイズ統計によるデータ解析ベイズ統計によるデータ解析
ベイズ統計によるデータ解析Kunihiro Hisatsune
 
ベイズ統計入門
ベイズ統計入門ベイズ統計入門
ベイズ統計入門Miyoshi Yuya
 
Stanコードの書き方 中級編
Stanコードの書き方 中級編Stanコードの書き方 中級編
Stanコードの書き方 中級編Hiroshi Shimizu
 
ベイズ統計学の概論的紹介
ベイズ統計学の概論的紹介ベイズ統計学の概論的紹介
ベイズ統計学の概論的紹介Naoki Hayashi
 
GEE(一般化推定方程式)の理論
GEE(一般化推定方程式)の理論GEE(一般化推定方程式)の理論
GEE(一般化推定方程式)の理論Koichiro Gibo
 
質的変数の相関・因子分析
質的変数の相関・因子分析質的変数の相関・因子分析
質的変数の相関・因子分析Mitsuo Shimohata
 
構造方程式モデルによる因果探索と非ガウス性
構造方程式モデルによる因果探索と非ガウス性構造方程式モデルによる因果探索と非ガウス性
構造方程式モデルによる因果探索と非ガウス性Shiga University, RIKEN
 
StanとRでベイズ統計モデリング読書会 Chapter 7(7.6-7.9) 回帰分析の悩みどころ ~統計の力で歌うまになりたい~
StanとRでベイズ統計モデリング読書会 Chapter 7(7.6-7.9) 回帰分析の悩みどころ ~統計の力で歌うまになりたい~StanとRでベイズ統計モデリング読書会 Chapter 7(7.6-7.9) 回帰分析の悩みどころ ~統計の力で歌うまになりたい~
StanとRでベイズ統計モデリング読書会 Chapter 7(7.6-7.9) 回帰分析の悩みどころ ~統計の力で歌うまになりたい~nocchi_airport
 
ベータ分布の謎に迫る
ベータ分布の謎に迫るベータ分布の謎に迫る
ベータ分布の謎に迫るKen'ichi Matsui
 
階層ベイズによるワンToワンマーケティング入門
階層ベイズによるワンToワンマーケティング入門階層ベイズによるワンToワンマーケティング入門
階層ベイズによるワンToワンマーケティング入門shima o
 
相関と因果について考える:統計的因果推論、その(不)可能性の中心
相関と因果について考える:統計的因果推論、その(不)可能性の中心相関と因果について考える:統計的因果推論、その(不)可能性の中心
相関と因果について考える:統計的因果推論、その(不)可能性の中心takehikoihayashi
 
Fisher線形判別分析とFisher Weight Maps
Fisher線形判別分析とFisher Weight MapsFisher線形判別分析とFisher Weight Maps
Fisher線形判別分析とFisher Weight MapsTakao Yamanaka
 
ベイズモデリングで見る因子分析
ベイズモデリングで見る因子分析ベイズモデリングで見る因子分析
ベイズモデリングで見る因子分析Shushi Namba
 
Stanの便利な事後処理関数
Stanの便利な事後処理関数Stanの便利な事後処理関数
Stanの便利な事後処理関数daiki hojo
 

What's hot (20)

ベイズファクターとモデル選択
ベイズファクターとモデル選択ベイズファクターとモデル選択
ベイズファクターとモデル選択
 
ブースティング入門
ブースティング入門ブースティング入門
ブースティング入門
 
ベイズ統計によるデータ解析
ベイズ統計によるデータ解析ベイズ統計によるデータ解析
ベイズ統計によるデータ解析
 
ベイズ統計入門
ベイズ統計入門ベイズ統計入門
ベイズ統計入門
 
Stanコードの書き方 中級編
Stanコードの書き方 中級編Stanコードの書き方 中級編
Stanコードの書き方 中級編
 
MCMC法
MCMC法MCMC法
MCMC法
 
ベイズ統計学の概論的紹介
ベイズ統計学の概論的紹介ベイズ統計学の概論的紹介
ベイズ統計学の概論的紹介
 
GEE(一般化推定方程式)の理論
GEE(一般化推定方程式)の理論GEE(一般化推定方程式)の理論
GEE(一般化推定方程式)の理論
 
Rによるベイジアンネットワーク入門
Rによるベイジアンネットワーク入門Rによるベイジアンネットワーク入門
Rによるベイジアンネットワーク入門
 
質的変数の相関・因子分析
質的変数の相関・因子分析質的変数の相関・因子分析
質的変数の相関・因子分析
 
構造方程式モデルによる因果探索と非ガウス性
構造方程式モデルによる因果探索と非ガウス性構造方程式モデルによる因果探索と非ガウス性
構造方程式モデルによる因果探索と非ガウス性
 
StanとRでベイズ統計モデリング読書会 Chapter 7(7.6-7.9) 回帰分析の悩みどころ ~統計の力で歌うまになりたい~
StanとRでベイズ統計モデリング読書会 Chapter 7(7.6-7.9) 回帰分析の悩みどころ ~統計の力で歌うまになりたい~StanとRでベイズ統計モデリング読書会 Chapter 7(7.6-7.9) 回帰分析の悩みどころ ~統計の力で歌うまになりたい~
StanとRでベイズ統計モデリング読書会 Chapter 7(7.6-7.9) 回帰分析の悩みどころ ~統計の力で歌うまになりたい~
 
ベータ分布の謎に迫る
ベータ分布の謎に迫るベータ分布の謎に迫る
ベータ分布の謎に迫る
 
階層ベイズとWAIC
階層ベイズとWAIC階層ベイズとWAIC
階層ベイズとWAIC
 
階層ベイズによるワンToワンマーケティング入門
階層ベイズによるワンToワンマーケティング入門階層ベイズによるワンToワンマーケティング入門
階層ベイズによるワンToワンマーケティング入門
 
相関と因果について考える:統計的因果推論、その(不)可能性の中心
相関と因果について考える:統計的因果推論、その(不)可能性の中心相関と因果について考える:統計的因果推論、その(不)可能性の中心
相関と因果について考える:統計的因果推論、その(不)可能性の中心
 
MICの解説
MICの解説MICの解説
MICの解説
 
Fisher線形判別分析とFisher Weight Maps
Fisher線形判別分析とFisher Weight MapsFisher線形判別分析とFisher Weight Maps
Fisher線形判別分析とFisher Weight Maps
 
ベイズモデリングで見る因子分析
ベイズモデリングで見る因子分析ベイズモデリングで見る因子分析
ベイズモデリングで見る因子分析
 
Stanの便利な事後処理関数
Stanの便利な事後処理関数Stanの便利な事後処理関数
Stanの便利な事後処理関数
 

More from Makoto Hirakawa

今日は何回やればいいのか―状態空間モデルで最大挙上重量を推定し、挙上回数を決める―
今日は何回やればいいのか―状態空間モデルで最大挙上重量を推定し、挙上回数を決める―今日は何回やればいいのか―状態空間モデルで最大挙上重量を推定し、挙上回数を決める―
今日は何回やればいいのか―状態空間モデルで最大挙上重量を推定し、挙上回数を決める―Makoto Hirakawa
 
Rで架空データの発生
Rで架空データの発生Rで架空データの発生
Rで架空データの発生Makoto Hirakawa
 
重回帰分析で交互作用効果
重回帰分析で交互作用効果重回帰分析で交互作用効果
重回帰分析で交互作用効果Makoto Hirakawa
 
重回帰分析で交互作用効果
重回帰分析で交互作用効果重回帰分析で交互作用効果
重回帰分析で交互作用効果Makoto Hirakawa
 

More from Makoto Hirakawa (6)

今日は何回やればいいのか―状態空間モデルで最大挙上重量を推定し、挙上回数を決める―
今日は何回やればいいのか―状態空間モデルで最大挙上重量を推定し、挙上回数を決める―今日は何回やればいいのか―状態空間モデルで最大挙上重量を推定し、挙上回数を決める―
今日は何回やればいいのか―状態空間モデルで最大挙上重量を推定し、挙上回数を決める―
 
Osaka.stan#2 chap5-1
Osaka.stan#2 chap5-1Osaka.stan#2 chap5-1
Osaka.stan#2 chap5-1
 
ベータ分布
ベータ分布ベータ分布
ベータ分布
 
Rで架空データの発生
Rで架空データの発生Rで架空データの発生
Rで架空データの発生
 
重回帰分析で交互作用効果
重回帰分析で交互作用効果重回帰分析で交互作用効果
重回帰分析で交互作用効果
 
重回帰分析で交互作用効果
重回帰分析で交互作用効果重回帰分析で交互作用効果
重回帰分析で交互作用効果
 

いいからベイズ推定してみる