Successfully reported this slideshow.
Your SlideShare is downloading. ×

2 5 2.一般化線形モデル色々_ロジスティック回帰

Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Loading in …3
×

Check these out next

1 of 17 Ad

2 5 2.一般化線形モデル色々_ロジスティック回帰

2013年8月10~11日にかけて北大函館キャンパス内で行われた統計勉強会の投影資料です。

2日目
2-5-2.一般化線形モデル色々~ロジスティック回帰~
二項分布を仮定したGLMであるロジスティック回帰を解説します。

サイト作ってます
http://logics-of-blue.com/

2013年8月10~11日にかけて北大函館キャンパス内で行われた統計勉強会の投影資料です。

2日目
2-5-2.一般化線形モデル色々~ロジスティック回帰~
二項分布を仮定したGLMであるロジスティック回帰を解説します。

サイト作ってます
http://logics-of-blue.com/

Advertisement
Advertisement

More Related Content

Slideshows for you (20)

Advertisement

Recently uploaded (20)

Advertisement

2 5 2.一般化線形モデル色々_ロジスティック回帰

  1. 1. 一般化線形モデル色々 ~ロジスティック回帰~ 1
  2. 2. 2 一般化線形モデルをマスターしよう 予測と確率分布 尤度と最尤法 一般化線形モデル基礎 Devianceと尤度比検定 一般化線形モデル色々 是非!! ゼロ切断・過剰モデル、 一般化線形混合モデル
  3. 3. 3 今回やること 1.ポアソン回帰をもっと使いこなす • CPUE標準化 • Offset項 2.ロジスティック回帰 3.ガンマ回帰 4.対数線形モデル
  4. 4. 4 今回やること 2.ロジスティック回帰 • リンク関数=ロジット • 誤差項=二項分布 なGLMのこと
  5. 5. 5 二項分布 あるなし(0,1)データ →結果が二つしかないから二項分布 ○○すると、××になる確率は何倍に増えるか? →喫煙した人としない人では死亡率が何倍違う? 𝑛 𝑘 𝑝 𝑘 1 − 𝑘 𝑝 n回の試行のうちk回成功する確率 n回コインを投げてk回表になる確率(一枚投げて表になる確率はp)
  6. 6. 6 リンク関数 log 𝑝 1 − 𝑝 = 𝑎𝑋 + 𝑏 ロジット (logit) p:成功確率(コインが表になる、死ぬ) →成功じゃなくても成功確率…
  7. 7. 7 log 𝑝 1 − 𝑝 = 対数オッズ ロジット (logit) リンク関数 𝑝 1 − 𝑝 =オッズ
  8. 8. 8 オッズ リンク関数 3 4 1 − 3 4 = 3 4 1 4 = 3 p=3/4の場合 成功確率 3/4 失敗確率 1/4 何倍成功するか 𝑝 1 − 𝑝 失敗確率 成功確率
  9. 9. 9 オッズ リンク関数 オッズ=3の場合 失敗するより3倍成功しやすい 何倍成功するか 成功確率 失敗確率 𝑝 1 − 𝑝
  10. 10. 10 リンク関数 log 𝑝 1 − 𝑝 = 𝑎𝑋 + 𝑏 ロジット (logit) 𝑝 1 − 𝑝 = 𝑒 𝑎𝑋 × 𝑒 𝑏 Xが1増えるとオッズは𝒆 𝒂 倍に変化
  11. 11. 11 リンク関数 log 𝑝 1 − 𝑝 = 𝑎𝑋 + 𝑏 ロジット (logit) Xが1増えるとオッズは𝒆 𝒂 倍に変化 質問どうぞ! オッズ=3の場合 失敗するより3倍成功しやすい 成功確率 失敗確率
  12. 12. 12 実演
  13. 13. 13 過分散 二項分布 パラメタは成功確率pのみ ポアソン分布 パラメタはλのみ 平均と分散:パラメタはたった一つ
  14. 14. 14 過分散 二項分布 ポアソン分布 期待値が決まると、分散も「自動的に」決まる 期待値と分散の関係が「理論」と異なるかも 過分散(or過小分散)
  15. 15. 15 過分散 過分散のみつけかた Null deviance: 671.96 on 13 degrees of freedom Residual deviance: 112.57 on 8 degrees of freedom summary(model.binom_1) 自由度に比べて devianceが大きすぎる やや粗い見分け方 予測区間を出すのが最も正確(しかし面倒)
  16. 16. 16 過分散の対処法 疑似尤度を使う 分散のためのパラメタを新たに導入する もはや二項分布ではない (正しい)尤度やAICは計算できない しかし、計算が楽。検定だけなら問題なし。 一般化線形混合モデル(GLMM)を使う ランダムエフェクトなるノイズを加える 分散の増加はランダムエフェクトで表す 計算は大変だが、AICが計算可能。 あとで紹介します。。。
  17. 17. 17 実演

×