一般化線形モデル色々
~ロジスティック回帰~
1
2
一般化線形モデルをマスターしよう
予測と確率分布
尤度と最尤法
一般化線形モデル基礎
Devianceと尤度比検定
一般化線形モデル色々
是非!!
ゼロ切断・過剰モデル、 一般化線形混合モデル
3
今回やること
1.ポアソン回帰をもっと使いこなす
• CPUE標準化
• Offset項
2.ロジスティック回帰
3.ガンマ回帰
4.対数線形モデル
4
今回やること
2.ロジスティック回帰
• リンク関数=ロジット
• 誤差項=二項分布
なGLMのこと
5
二項分布
あるなし(0,1)データ
→結果が二つしかないから二項分布
○○すると、××になる確率は何倍に増えるか?
→喫煙した人としない人では死亡率が何倍違う?
𝑛
𝑘
𝑝 𝑘
1 − 𝑘 𝑝
n回の試行のうちk回成功する確率
n回コインを投げてk回表になる確率(一枚投げて表になる確率はp)
6
リンク関数
log
𝑝
1 − 𝑝
= 𝑎𝑋 + 𝑏
ロジット (logit)
p:成功確率(コインが表になる、死ぬ)
→成功じゃなくても成功確率…
7
log
𝑝
1 − 𝑝
= 対数オッズ
ロジット (logit)
リンク関数
𝑝
1 − 𝑝
=オッズ
8
オッズ
リンク関数
3
4
1 − 3
4
=
3
4
1
4
= 3
p=3/4の場合
成功確率 3/4
失敗確率 1/4
何倍成功するか
𝑝
1 − 𝑝
失敗確率
成功確率
9
オッズ
リンク関数
オッズ=3の場合
失敗するより3倍成功しやすい
何倍成功するか
成功確率
失敗確率
𝑝
1 − 𝑝
10
リンク関数
log
𝑝
1 − 𝑝
= 𝑎𝑋 + 𝑏
ロジット (logit)
𝑝
1 − 𝑝
= 𝑒 𝑎𝑋
× 𝑒 𝑏
Xが1増えるとオッズは𝒆 𝒂
倍に変化
11
リンク関数
log
𝑝
1 − 𝑝
= 𝑎𝑋 + 𝑏
ロジット (logit)
Xが1増えるとオッズは𝒆 𝒂
倍に変化
質問どうぞ!
オッズ=3の場合
失敗するより3倍成功しやすい
成功確率
失敗確率
12
実演
13
過分散
二項分布
パラメタは成功確率pのみ
ポアソン分布
パラメタはλのみ
平均と分散:パラメタはたった一つ
14
過分散
二項分布
ポアソン分布
期待値が決まると、分散も「自動的に」決まる
期待値と分散の関係が「理論」と異なるかも
過分散(or過小分散)
15
過分散
過分散のみつけかた
Null deviance: 671.96 on 13 degrees of freedom
Residual deviance: 112.57 on 8 degrees of freedom
summary(model.binom_1)
自由度に比べて
devianceが大きすぎる
やや粗い見分け方
予測区間を出すのが最も正確(しかし面倒)
16
過分散の対処法
疑似尤度を使う
分散のためのパラメタを新たに導入する
もはや二項分布ではない
(正しい)尤度やAICは計算できない
しかし、計算が楽。検定だけなら問題なし。
一般化線形混合モデル(GLMM)を使う
ランダムエフェクトなるノイズを加える
分散の増加はランダムエフェクトで表す
計算は大変だが、AICが計算可能。
あとで紹介します。。。
17
実演

2 5 2.一般化線形モデル色々_ロジスティック回帰