Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Doing Bayesian Data Analysis; Chapter 14

2,399 views

Published on

東京大学松尾研
2013年夏の勉強会

Published in: Education
  • Be the first to comment

  • Be the first to like this

Doing Bayesian Data Analysis; Chapter 14

  1. 1. Doing Bayesian Data Analysis Part 3 一般化線形モデル(GLM)への応用 Chapter 14 一般化線形モデルの概要 07/SEP/13 Haru Negami
  2. 2. 詩(お約束のようなので。) Straight and proportionate, deep in your core All is orthogonal, ceiling to floor. But on the outside the vines creep and twist 'round all the parapets shrouded in mist. 心の中にはまっすぐな想いがあるのに、 彼女はなぜか意地っ張り。 いつも想いとは裏腹なことばっかり言ってしまう。 という乙女心の複雑さを詠んだ詩です。 (投げやり。)
  3. 3. 目標 • テキストでは・・・ – 一般化線形モデルの概要を、式を通じて学ぶ – 詳細はのちの章で詳しく解説されています。 • 補足として・・・ – 一般化線形モデルと線形モデルの関連を知る – 参考:http://www012.upp.so- net.ne.jp/doi/biostat/CT39/glm.pdf
  4. 4. 一般化線形モデル(GLM) とは • 線形モデルの拡張 – (一般)線形モデル (General Linear Model) • 確率密度関数が正規分布などに従うもの。分散分 析(ANOVA)、共分散分析(ANCOVA)、線形回帰、t 検定などいくつかの統計モデルに組み込まれてい る。 – 一般化線形モデル (Generalized Linear Model) • 確率密度関数としてさらに様々な種類の分布を取 れる。上に加えて、ポアソン回帰、ロジスティク ス回帰などが含まれる。
  5. 5. 本日のラインナップ 一般化の プロセス 用語の確認 一般化線形 モデル LOOP!
  6. 6. シグモイド関数 など 線形モデルの一般化のプロセス 説明変数 応答変数 一次結合 説明変数 応答変数 一般化 正規分布 データの 分布 指数型分布族 データの 分布 一次結合 一次結合+変換 拡張 1 2 Link Function Link Function pdf pdf
  7. 7. シグモイド関数 など 線形モデルの一般化のプロセス 説明変数 応答変数 一次結合 説明変数 応答変数 一般化 正規分布 データの 分布 指数型分布族 データの 分布 一次結合 一次結合+変換 拡張 1 2 Link Function Link Function pdf pdf
  8. 8. 用語の確認 (広義の)線形関数 : 変数X1, X2, … に対してある定数β0, β1, β2,…が存在 して、 ある変数Yとの間に Y = β0+β1X1+β2X2+・・・ という関係があるとき、X1, X2, …に対する作用 を線形関数という。 ※数学における線形性の定義(β0がない)とは異なることに注 意!
  9. 9. 用語の確認 • Predictor Variables (説明変数) : X1, X2, … • Predicted Variables (応答変数) : Y ただし、Y = β0+β1X1+β2X2+・・・ ※和訳は様々あるようですが、上に統一します。
  10. 10. 用語の確認(補足) このように式変形し、x-θ=x’とする と、 数学的な意味でも線形であること が分かる。 このようなθをThresholdとして、 直感的に理解することもできる。 多変数の場合も同様の議論ができ る。 1変数の場合 多変数の場合
  11. 11. シグモイド関数 など 用語の確認 説明変数 応答変数 一次結合 説明変数 応答変数 一般化 正規分布 データの 分布 指数型分布族 データの 分布 一次結合 一次結合+変換 拡張 1 2 Link Function Link Function pdf pdf
  12. 12. 一般化線形モデルと実験データ 説明変数 応答変数 データの 分布 実験的に得られるデータ ノイズを含むため、 確率密度関数となる。 pdf Link Function y ~ pdf(μ, *, τ, …+)y = f(xの一次結合) βなどのパラメーターは最尤法により決定。 ノイズを含むため、 確率密度関数となる。
  13. 13. シグモイド関数 など 用語の確認 説明変数 応答変数 一次結合 説明変数 応答変数 一般化 正規分布 データの 分布 指数型分布族 データの 分布 一次結合 一次結合+変換 拡張 1 2 Link Function Link Function pdf pdf
  14. 14. 用語の確認
  15. 15. 一般化線形モデルの俯瞰
  16. 16. 1. 線形モデル • 例1:血圧の分布(その1) 1. 説明変数(X1, X2, … ,Xn)をn人の血圧の平均とし、 2. 応答変数(μ)を全員の血圧の平均値とする。 3. μ = (X1+X2+…)/n 4. 血圧が正規分布に従うとして分布を生成す る。 5. Y 〜 N(μ, σ)
  17. 17. 1. 線形モデル • 例2 : 血圧の分布(その2) 1. 説明変数(Xi,1, Xi,2, … ,Xi,n)をiさんの血圧とし、 2. 応答変数(μi)を i さんの血圧の平均値とす る。 3. μi = (Xi,1+Xi,2+…)/ni 4. 血圧が正規分布に従うとして分布を生成す る。 5. Yi〜 N(μi, σi) 6. 結果を統合する。
  18. 18. 2. 一般化線形モデル 1. シグモイド関数 1. 1変数の場合 γ : gain。β1に対応する。 θ : threshold。-β0/β1に対応する。
  19. 19. 2. 一般化線形モデル 1. シグモイド関数 1. 1変数の場合
  20. 20. 2. 一般化線形モデル 1. シグモイド関数 2. 多変数の場合
  21. 21. 2. 一般化線形モデル 1. シグモイド関数 2. 多変数の場合
  22. 22. 2. 一般化線形モデル 1. シグモイド関数 1. p.d.f. 2値の分布になることに注意する。 詳細は以降の章で解説するので省きます。
  23. 23. 2. 一般化線形モデル 1. シグモイド関数 1. p.d.f.
  24. 24. 2. 一般化線形モデル 2. 正規累積分布関数 – シグモイド関数と似た概形。 – 扱いやすさや数学的処理のしやすさで選ぶ。 – Chapter 21にて詳しく扱う。
  25. 25. 3. EXERCISES • 問のポイント • 14.1. – 説明変数、応答変数のデータ型が何かを知 る。 • 14.2. – 現象からモデルの構造を把握する。
  26. 26. 3. EXERCISES • 14.1. 1. A – predictor (Metric) • money per pupil spent by each of the 51 states – predicted (Metric) • percentage of eligible students took SAT – pdf • Normal distribution

×