Successfully reported this slideshow.
Your SlideShare is downloading. ×

Tokyo r12 - R言語による回帰分析入門

Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad

Check these out next

1 of 81 Ad

More Related Content

Slideshows for you (20)

Similar to Tokyo r12 - R言語による回帰分析入門 (20)

Advertisement

More from Yohei Sato (20)

Tokyo r12 - R言語による回帰分析入門

  1. 1. R言語による 回帰分析入門 @yokkuns 里 洋平 第12回R勉強会@東京(Tokyo.R#12) 2011/03/05 1
  2. 2. AGENDA ● 自己紹介 ● 回帰分析とは ● 線形回帰分析 ● 非線形回帰分析 ● まとめ ● 最後に 2
  3. 3. AGENDA ● 自己紹介 ● 回帰分析とは ● 線形回帰分析 ● 非線形回帰分析 ● まとめ ● 最後に 3
  4. 4. 自己紹介 ● 名前 : 里 洋平 ● ID : yokkuns ● 職業 : Webエンジニア ● 興味のある事 – 統計解析、データマイニング、機械学習など 4
  5. 5. slideshareに資料を公開しています 5
  6. 6. AGENDA ● 自己紹介 ● 回帰分析とは ● 線形回帰分析 ● 非線形回帰分析 ● まとめ ● 最後に 6
  7. 7. 回帰分析 ● 変数間の関係を分析する手法 – 説明変数を用いて目的変数を説明 7
  8. 8. 回帰分析 ● 変数間の関係を分析する手法 – 説明変数を用いて目的変数を説明 8
  9. 9. 回帰分析 ● 変数間の関係を分析する手法 – 説明変数を用いて目的変数を説明 目的変数 説明変数 9
  10. 10. 回帰分析 線形関係 非線形関係 10
  11. 11. 回帰分析 時系列解析 - ARモデル 図 : http://ameblo.jp/kazue-fujiwara/entry-10762340069.html 11
  12. 12. 回帰分析 金融工学 - ベータの推定 図 : http://www.sigmabase.co.jp/keyword/list/h/beta_chi.htm 12
  13. 13. AGENDA ● 自己紹介 ● 回帰分析とは ● 線形回帰分析 ● 非線形回帰分析 ● まとめ ● 最後に 13
  14. 14. 線形回帰分析 ■線形単回帰分析 ■線形重回帰分析 14
  15. 15. 線形単回帰分析 ● 説明変数が1つの線形回帰分析 15
  16. 16. 線形単回帰分析 lm(formula, data, weights, subset, na.action) formula : モデルの形式 data : 回帰分析に用いるデータセット weights : 用いる説明変数に重みを指定 subset : データセットの中の一部を用いる場合に指定 na.action : 欠損値の扱いを指定 16
  17. 17. 線形単回帰分析 回帰分析の関連関数 関数 内容 使用例 coef 回帰係数 coef(cars.lm), cars.lm$coef fitted 用いたデータの予測値 fitted(cars.lm), cars.lm$fitted deviance 残差の平方和 deviance(cars.lm) anova 回帰係数の分散分析 anova(cars.lm) predict 新たなデータに対する予 predict(cars.lm) 測値 print 要約より簡単な結果 print(cars.lm) summary 回帰分析結果の要約 summary(cars.lm) plot 回帰診断プロット plot(cars.lm) 17
  18. 18. 線形単回帰分析 電子部品データ 標本番号 1 2 3 4 5 6 7 8 9 10 11 12 抵抗値x 0.91 0.83 0.8 0.83 0.86 0.85 0.84 0.81 0.79 0.89 0.85 0.83 仕上がり 7.2 4.1 2.9 3.8 5.7 5.1 4.4 3.6 3.1 6.4 4.7 4.2 のスコアy ● xは製造工程である部分を測定した抵抗値 ● yは最終的に出来た製品の仕上がりを表すスコア 18
  19. 19. 線形単回帰分析 19
  20. 20. 線形単回帰分析 20
  21. 21. 線形単回帰分析 最小2乗法 21
  22. 22. 線形単回帰分析 最小2乗法 22
  23. 23. 線形単回帰分析 最小2乗法 残差 23
  24. 24. 線形単回帰分析 最小2乗法 残差の2乗和を最小にする 直線を求める 残差 24
  25. 25. 線形単回帰分析 25
  26. 26. 線形単回帰分析 指定したモデルの確認の出力 26
  27. 27. 線形単回帰分析 残差分布の四分位数 27
  28. 28. 線形単回帰分析 切片の推定値と その検定結果 28
  29. 29. 線形単回帰分析 傾きの推定値と その検定結果 29
  30. 30. 線形単回帰分析 標準誤差 30
  31. 31. 線形単回帰分析 決定係数と 調整済み決定係数 31
  32. 32. 線形単回帰分析 分散分析後のF値 と結果 32
  33. 33. 線形単回帰分析 33
  34. 34. 線形単回帰分析 残差とフィット値のプロット 34
  35. 35. 線形単回帰分析 残差の正規Q-Qプロット 35
  36. 36. 線形単回帰分析 残差の平方根プロット 36
  37. 37. 線形単回帰分析 残差と影響力プロット(梃子値とクックの距離) 37
  38. 38. 線形単回帰分析 信頼区間と予測区間 38
  39. 39. 線形重回帰分析 説明変数が複数の線形回帰分析 39
  40. 40. 線形重回帰分析 airquality 1973年5月から9月までのニューヨークの大気状態を記録したデータ ● 40
  41. 41. 線形重回帰分析 41
  42. 42. 線形重回帰分析 Ozoneを目的変数として、Solar.R、Wind、Tempを説明変数とした重回帰分析 42
  43. 43. 線形重回帰分析 Ozoneを目的変数として、Solar.R、Wind、Tempを説明変数とした重回帰分析 AIC ● 統計モデルを評価するための指標 43
  44. 44. 線形重回帰分析 44
  45. 45. 線形重回帰分析 相互作用をを考慮したモデルを構築 45
  46. 46. 線形重回帰分析 相互作用をを考慮したモデルを構築 相互作用を考慮しないモデルより AICの値が小さくなった! 662.3732 < 681.7127 46
  47. 47. 線形重回帰分析 AICを用いてモデル•変数を選択する関数step 47
  48. 48. 線形重回帰分析 AICを用いてモデル•変数を選択する関数step AICが一番小さくなる回帰式 48
  49. 49. 線形重回帰分析 step関数で求めたモデルの要約 49
  50. 50. AGENDA ● 自己紹介 ● 回帰分析とは ● 線形回帰分析 ● 非線形回帰分析 ● まとめ ● 最後に 50
  51. 51. 非線形回帰分析 目的変数と説明変数が非線形的な関係である回帰分析 51
  52. 52. 非線形回帰分析 ● 多項式回帰 ● 一般化線形モデル ● ロジスティック回帰 ● 平滑化回帰 ● 加法モデル 52
  53. 53. 多項式回帰 目的変数を多項式で表す 53
  54. 54. 多項式回帰 非線形回帰分析を行う関数 nls(formula, data, start, trace) formula : モデルの形式 data : 回帰分析に用いるデータセット start : パラメータの初期値 trace : 計算過程の結果を返す場合はTRUEを指定 54
  55. 55. 多項式回帰 人工デー タ 55
  56. 56. 多項式回帰 56
  57. 57. 多項式回帰 57
  58. 58. 多項式回帰 58
  59. 59. 一般化線形モデル ● 線形回帰分析 – 残差が正規分布に従うと仮定 – 従っていない場合使えない ● 一般化線形モデル – 正規分布を拡張した分布族に対応させる – 非線形の現象を線形と同じように簡単に – 不自然な尺度で解釈しないように工夫した解析方法 59
  60. 60. 一般化線形モデル 一般化線形モデルの関数 glm(formula, family, data) formula : モデルの形式 family : 当てはめる分布族のリンク関 数 data : データセット 60
  61. 61. 一般化線形モデル 関数glmで仕様可能な主な分布 族 分布族(family) リンク リンク関数 正規(gaussian) μ link=”identity” ニ項(binomial) log(μ/(1-μ)) link=”logit” ポアソン(poisson) log(μ) link=”log” ガンマ(Gamma) 1/μ link=”inverse” 逆正規(Inverse.gaussian) 1/μ^2 Link=”1/mu^2” 61
  62. 62. 一般化線形モデル airquality ● 1973年5月から9月までのニューヨークの大気状態を記録したデータ 62
  63. 63. 一般化線形モデル 63
  64. 64. 一般化線形モデル 64
  65. 65. ロジスティック回帰 ● 2値データを目的変数とした回帰モデル ● ロジスティック関数を用いて分析を行う 65
  66. 66. ロジスティック回帰 SpaceShuttle スペースシャトル•チャレンジャーの打ち上げ時に生じるO-リングの故障状況 66
  67. 67. ロジスティック回帰 glmを使ってロジスティック回帰 67
  68. 68. ロジスティック回帰 68
  69. 69. ロジスティック回帰 69
  70. 70. 平滑化回帰 複雑な傾向のデータを滑らかな曲線で当てはめる 70
  71. 71. 平滑化回帰 局所重み付き回帰法を行う関数 loess(formula, data, span, degree...) formula : モデルの形式 data : 用いるデータセット span : 平滑の度合いをコントロールするパラメータ degree : 当てはめる多項式の次数 71
  72. 72. 平滑化回帰 B-スプライン関数による 平滑化スプライン曲線を当てはめる smooth.spline(x, y, df, spar, ...) x : 予測変量 y : 反応変量 df : 等価自由度 spar : 平滑化パラメー タ 72
  73. 73. 73
  74. 74. 一般化加法モデル 74
  75. 75. 一般化加法モデル 一般化加法モデルを求める関数 gam(formula, family, data, ...) formula : モデルの書式。モデル式の右辺に平滑化関数を使 う family : 残差の分布族 data : データセット 使える平滑化関数 lo : 局所回帰関数 s : 平滑化スプライン関数 bs : B-スプライン関数 ns : 自然スプライン関数 75
  76. 76. AGENDA ● 自己紹介 ● 回帰分析とは ● 線形回帰分析 ● 非線形回帰分析 ● まとめ ● 最後に 76
  77. 77. まとめ ● Rで回帰分析を学びました ● Rでは、lm、glm、nlsなどの回帰分析をする ための関数が用意されており、簡単に分析が出 来る ● gamを使う事で、非常に複雑なデータも扱うこ とが出来る 77
  78. 78. AGENDA ● 自己紹介 ● 回帰分析とは ● 線形回帰分析 ● 非線形回帰分析 ● まとめ ● 最後に 78
  79. 79. 発表者募集しています! 79
  80. 80. AGENDA ● 自己紹介 ● 回帰分析とは ● 線形回帰分析 ● 非線形回帰分析 ● まとめ ● 最後に 80
  81. 81. ご清聴 ありがとうございました 81

×