Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

2 5 1.一般化線形モデル色々_CPUE標準化

30,414 views

Published on

2013年8月10~11日にかけて北大函館キャンパス内で行われた統計勉強会の投影資料です。

2日目
2-5-1.一般化線形モデル色々~CPUE標準化~
ポアソン回帰を使ってCPUEを標準化する方法を解説します。
offset項やas.factorの使い方も解説。

サイト作ってます
http://logics-of-blue.com/

Published in: Technology
  • Be the first to comment

2 5 1.一般化線形モデル色々_CPUE標準化

  1. 1. 一般化線形モデル色々 ~CPUE標準化~ 1
  2. 2. 2 一般化線形モデルをマスターしよう 予測と確率分布 尤度と最尤法 一般化線形モデル基礎 Devianceと尤度比検定 一般化線形モデル色々 是非!! ゼロ切断・過剰モデル、 一般化線形混合モデル
  3. 3. 3 今回やること 1.ポアソン回帰をもっと使いこなす • CPUE標準化 • Offset項 2.ロジスティック回帰 3.ガンマ回帰 4.対数線形モデル
  4. 4. 4 今回やること 1.ポアソン回帰をもっと使いこなす • CPUE標準化 • Offset項
  5. 5. 5 CPUE 目的:魚の数を調べたい 魚がたくさん獲れたらたくさん魚がいる? 一人が釣りに行った:5尾釣れた 二人で釣りに行った:7尾釣れた 人数の割には釣れてない。。。
  6. 6. 6 CPUE 目的:魚の数を調べたい 「一人あたりの漁獲量」が多ければたくさん魚がいる 漁獲量 人数 = 漁獲量 漁獲努力量 =CPUE
  7. 7. 7 CPUE 目的:魚の数を調べたい 「CPUE」が多ければたくさん魚がいる? 2000年:とても暑かったので食いつきが悪かった 2001年:涼しかったので、食いつきが良かった 気温の影響を排除したい
  8. 8. 8 目的 目的:魚の数を調べたい 気温の影響を排除した「標準化CPUE」を予測する 景気の影響を排除した「標準化経常利益」 売り子の数を除外した「標準化販売個数」 質問どうぞ!
  9. 9. 9 目標 二つの技を会得する 1.as.factor 2.offset
  10. 10. 10 モデル 漁獲尾数 ~ ポアソン分布 CPUE ~ ポアソン分布・・・?
  11. 11. 11 ポアソン分布の特徴 ○個売れた・○匹居た →個数のデータが与えられたら、 まずはポアソン分布を疑う 群れない ○たまたま人が来てたまたま売れた個数 ×団体客が来て、どさっと売れる個数 平均も分散もパラメタλで表される こいつ(λ)を最尤推定する
  12. 12. 12 モデル CPUE ~ ポアソン分布・・・? 漁獲尾数:5 努力量:3 CPUE = 5/3 整数じゃない→ポアソンじゃない
  13. 13. 13 モデル 漁獲尾数 ~ ポアソン分布 CPUE ~ 対数正規分布 対数をとったら正規分布になる →リンク関数=logの正規線形モデルでOK
  14. 14. 14 モデル CPUE ~ 対数正規分布 対数をとったら正規分布になる log 5 3 ≒ 0.51 log 0 3 ≒ 計算不能!! 漁獲尾数が0だった
  15. 15. 15 モデル CPUE ~ 対数正規分布 0.1を足してから対数をとる log 0 3 + 0.1 ≒ 一応計算はできるけど …
  16. 16. 16 モデル 最初からポアソン分布で解析する 漁獲尾数 ~ ポアソン分布 漁獲尾数のままでモデルを作ろう! → Catchモデル 質問どうぞ!
  17. 17. 17 モデル 漁獲尾数 ~ ポアソン分布 漁獲量の期待値 = 年 + 努力量 + 水温 Catch ~ Year + Effort + SST ここを抽出すれば「水温の影響を除外した」 年別の魚の資源量の指標を求められるはず
  18. 18. 18 Catchモデル 漁獲尾数 ~ ポアソン分布 glm( Catch ~ Year + Effort + SST, data=data5, family=poisson(link=log) ) 省略可能 線形予測子 誤差項 リンク関数
  19. 19. 19 Catchモデル 漁獲尾数 ~ ポアソン分布 glm( Catch ~ Year + Effort + SST, data=data5, family=poisson(link=log) ) Yearが怪しい
  20. 20. 20 年の問題 年に対して線形 年に対して非線形 年 年
  21. 21. 21 Catchモデル 漁獲尾数 ~ ポアソン分布 Step1:年変動をカテゴリデータ(選択肢) として扱いたい 2001年という年の持つ漁獲量 2005年という年の持つ漁獲量を個別に推定 「2001」という「数値」は無視する
  22. 22. 22 年の問題 年を数値として扱わない as.factor(年)Option(A) Option(B) Option(C)
  23. 23. 23 年の問題 年を数値として扱わない 年{2001, 2002, 2003, ・・・, 2009, 2010} Option{A, B, C, ・・・, I, J}
  24. 24. 24 年の問題 年を数値として扱わない ギザギザを表せる 薬Aの効果 薬Bの効果 薬Cの効果 年Aの効果 年Bの効果 年Cの効果
  25. 25. 25 Catchモデル 漁獲尾数 ~ ポアソン分布 glm( Catch ~ as.factor(Year) + Effort + SST, data=data5, family=poisson(link=log) ) Yearをカテゴリにした 次はここをいじる
  26. 26. 26 CPUE 「一人あたりの漁獲量」が多ければたくさん魚がいる 漁獲量 人数 = 漁獲量 漁獲努力量 =CPUE ≈ 資源量 人数が倍になったら、漁獲量も倍になってほしい →漁獲量は努力量に比例してほしい
  27. 27. 27 努力量の入れ方(改訂版) 比例 → 努力量が倍になると漁獲量も倍 → log(漁獲量) ~ 1×log(努力量) リンク関数がlogなので
  28. 28. 28 努力量の入れ方(追加スライド) log 漁獲量 努力量 = 𝑎 + 𝑏水温 + 年効果 log 漁獲量 − log 努力量 = 𝑎 + 𝑏水温 + 年効果 log 漁獲量 = 𝑎 + 𝑏水温 + 年効果 + log 努力量 log(努力量)の傾きを1にすればよい
  29. 29. 29 Catchモデル 漁獲尾数 ~ ポアソン分布 glm( Catch ~ as.factor(Year) + offset(log(Effort)) + SST, data=data5, family=poisson(link=log) ) Offset項を導入した 質問どうぞ!
  30. 30. 30 実演

×