Successfully reported this slideshow.
R言語による回帰分析入門    @yokkuns 里 洋平第12回R勉強会@東京(Tokyo.R#12)       2011/03/05                          1
AGENDA●    自己紹介●    回帰分析とは●    線形回帰分析●    非線形回帰分析●    まとめ●    最後に                      2
AGENDA●    自己紹介●    回帰分析とは●    線形回帰分析●    非線形回帰分析●    まとめ●    最後に                      3
自己紹介               ●                   名前 : 里 洋平               ●   ID   : yokkuns               ●                   職業 : W...
slideshareに資料を公開しています                        5
AGENDA●    自己紹介●    回帰分析とは●    線形回帰分析●    非線形回帰分析●    まとめ●    最後に                      6
回帰分析●    変数間の関係を分析する手法     –   説明変数を用いて目的変数を説明                           7
回帰分析●    変数間の関係を分析する手法     –   説明変数を用いて目的変数を説明                           8
回帰分析●    変数間の関係を分析する手法     –   説明変数を用いて目的変数を説明     目的変数       説明変数                           9
回帰分析線形関係          非線形関係                      10
回帰分析時系列解析 - ARモデル                図 : http://ameblo.jp/kazue-fujiwara/entry-10762340069.html                               ...
回帰分析金融工学 - ベータの推定                図 : http://www.sigmabase.co.jp/keyword/list/h/beta_chi.htm                               ...
AGENDA●    自己紹介●    回帰分析とは●    線形回帰分析●    非線形回帰分析●    まとめ●    最後に                      13
線形回帰分析■線形単回帰分析■線形重回帰分析               14
線形単回帰分析●    説明変数が1つの線形回帰分析                     15
線形単回帰分析lm(formula, data, weights, subset, na.action)formula : モデルの形式data      : 回帰分析に用いるデータセットweights : 用いる説明変数に重みを指定subse...
線形単回帰分析           回帰分析の関連関数 関数        内容             使用例coef       回帰係数          coef(cars.lm), cars.lm$coeffitted     用いた...
線形単回帰分析                          電子部品データ標本番号     1    2     3      4      5    6      7      8      9     10     11     12...
線形単回帰分析          19
線形単回帰分析          20
線形単回帰分析最小2乗法                  21
線形単回帰分析最小2乗法                  22
線形単回帰分析最小2乗法         残差                  23
線形単回帰分析最小2乗法残差の2乗和を最小にする直線を求める          残差                  24
線形単回帰分析          25
線形単回帰分析   指定したモデルの確認の出力               26
線形単回帰分析     残差分布の四分位数                 27
線形単回帰分析          切片の推定値と          その検定結果                28
線形単回帰分析          傾きの推定値と          その検定結果                29
線形単回帰分析          標準誤差             30
線形単回帰分析          決定係数と          調整済み決定係数                31
線形単回帰分析          分散分析後のF値          と結果                32
線形単回帰分析          33
線形単回帰分析残差とフィット値のプロット                 34
線形単回帰分析残差の正規Q-Qプロット                  35
線形単回帰分析残差の平方根プロット                 36
線形単回帰分析残差と影響力プロット(梃子値とクックの距離)                         37
線形単回帰分析信頼区間と予測区間                 38
線形重回帰分析説明変数が複数の線形回帰分析                 39
線形重回帰分析           airquality1973年5月から9月までのニューヨークの大気状態を記録したデータ●                                    40
線形重回帰分析          41
線形重回帰分析Ozoneを目的変数として、Solar.R、Wind、Tempを説明変数とした重回帰分析                                          42
線形重回帰分析Ozoneを目的変数として、Solar.R、Wind、Tempを説明変数とした重回帰分析                       AIC                       ●                     ...
線形重回帰分析          44
線形重回帰分析相互作用をを考慮したモデルを構築                   45
線形重回帰分析相互作用をを考慮したモデルを構築               相互作用を考慮しないモデルより               AICの値が小さくなった!                   662.3732 < 681.7127   ...
線形重回帰分析AICを用いてモデル•変数を選択する関数step                           47
線形重回帰分析AICを用いてモデル•変数を選択する関数step                           AICが一番小さくなる回帰式                                      48
線形重回帰分析step関数で求めたモデルの要約                    49
AGENDA●    自己紹介●    回帰分析とは●    線形回帰分析●    非線形回帰分析●    まとめ●    最後に                      50
非線形回帰分析目的変数と説明変数が非線形的な関係である回帰分析                           51
非線形回帰分析●    多項式回帰●    一般化線形モデル●    ロジスティック回帰●    平滑化回帰●    加法モデル                      52
多項式回帰目的変数を多項式で表す              53
多項式回帰           非線形回帰分析を行う関数      nls(formula, data, start, trace)formula   : モデルの形式data      : 回帰分析に用いるデータセットstart     : ...
多項式回帰人工データ        55
多項式回帰        56
多項式回帰        57
多項式回帰        58
一般化線形モデル●    線形回帰分析     –   残差が正規分布に従うと仮定     –   従っていない場合使えない●    一般化線形モデル     –   正規分布を拡張した分布族に対応させる     –   非線形の現象を線形と同...
一般化線形モデル          一般化線形モデルの関数       glm(formula, family, data)formula   : モデルの形式family    : 当てはめる分布族のリンク関数data       : データ...
一般化線形モデル          関数glmで仕様可能な主な分布          族分布族(family)              リンク            リンク関数正規(gaussian)            μ        ...
一般化線形モデル               airquality●   1973年5月から9月までのニューヨークの大気状態を記録したデータ                                        62
一般化線形モデル           63
一般化線形モデル           64
ロジスティック回帰●    2値データを目的変数とした回帰モデル●    ロジスティック関数を用いて分析を行う                         65
ロジスティック回帰            SpaceShuttleスペースシャトル•チャレンジャーの打ち上げ時に生じるO-リングの故障状況                                   66
ロジスティック回帰glmを使ってロジスティック回帰                   67
ロジスティック回帰            68
ロジスティック回帰            69
平滑化回帰複雑な傾向のデータを滑らかな曲線で当てはめる                         70
平滑化回帰           局所重み付き回帰法を行う関数     loess(formula, data, span, degree...)formula   : モデルの形式data      : 用いるデータセットspan      :...
平滑化回帰     B-スプライン関数による  平滑化スプライン曲線を当てはめるsmooth.spline(x, y, df, spar, ...)    x      : 予測変量    y      : 反応変量    df     : 等...
73
一般化加法モデル           74
一般化加法モデル            一般化加法モデルを求める関数         gam(formula, family, data, ...)formula : モデルの書式。モデル式の右辺に平滑化関数を使うfamily   : 残差の分...
AGENDA●    自己紹介●    回帰分析とは●    線形回帰分析●    非線形回帰分析●    まとめ●    最後に                      76
まとめ●    Rで回帰分析を学びました●    Rでは、lm、glm、nlsなどの回帰分析をする    ための関数が用意されており、簡単に分析が出    来る●    gamを使う事で、非常に複雑なデータも扱うこ    とが出来る      ...
AGENDA●    自己紹介●    回帰分析とは●    線形回帰分析●    非線形回帰分析●    まとめ●    最後に                      78
発表者募集しています!              79
AGENDA●    自己紹介●    回帰分析とは●    線形回帰分析●    非線形回帰分析●    まとめ●    最後に                      80
ご清聴ありがとうございました              81
Upcoming SlideShare
Loading in …5
×

Tokyo r12 - R言語による回帰分析入門

30,635 views

Published on

  • Be the first to comment

Tokyo r12 - R言語による回帰分析入門

  1. 1. R言語による回帰分析入門 @yokkuns 里 洋平第12回R勉強会@東京(Tokyo.R#12) 2011/03/05 1
  2. 2. AGENDA● 自己紹介● 回帰分析とは● 線形回帰分析● 非線形回帰分析● まとめ● 最後に 2
  3. 3. AGENDA● 自己紹介● 回帰分析とは● 線形回帰分析● 非線形回帰分析● まとめ● 最後に 3
  4. 4. 自己紹介 ● 名前 : 里 洋平 ● ID : yokkuns ● 職業 : Webエンジニア● 興味のある事 – 統計解析、データマイニング、機械学習など 4
  5. 5. slideshareに資料を公開しています 5
  6. 6. AGENDA● 自己紹介● 回帰分析とは● 線形回帰分析● 非線形回帰分析● まとめ● 最後に 6
  7. 7. 回帰分析● 変数間の関係を分析する手法 – 説明変数を用いて目的変数を説明 7
  8. 8. 回帰分析● 変数間の関係を分析する手法 – 説明変数を用いて目的変数を説明 8
  9. 9. 回帰分析● 変数間の関係を分析する手法 – 説明変数を用いて目的変数を説明 目的変数 説明変数 9
  10. 10. 回帰分析線形関係 非線形関係 10
  11. 11. 回帰分析時系列解析 - ARモデル 図 : http://ameblo.jp/kazue-fujiwara/entry-10762340069.html 11
  12. 12. 回帰分析金融工学 - ベータの推定 図 : http://www.sigmabase.co.jp/keyword/list/h/beta_chi.htm 12
  13. 13. AGENDA● 自己紹介● 回帰分析とは● 線形回帰分析● 非線形回帰分析● まとめ● 最後に 13
  14. 14. 線形回帰分析■線形単回帰分析■線形重回帰分析 14
  15. 15. 線形単回帰分析● 説明変数が1つの線形回帰分析 15
  16. 16. 線形単回帰分析lm(formula, data, weights, subset, na.action)formula : モデルの形式data : 回帰分析に用いるデータセットweights : 用いる説明変数に重みを指定subset : データセットの中の一部を用いる場合に指定na.action : 欠損値の扱いを指定 16
  17. 17. 線形単回帰分析 回帰分析の関連関数 関数 内容 使用例coef 回帰係数 coef(cars.lm), cars.lm$coeffitted 用いたデータの予測値 fitted(cars.lm), cars.lm$fitteddeviance 残差の平方和 deviance(cars.lm)anova 回帰係数の分散分析 anova(cars.lm)predict 新たなデータに対する予 predict(cars.lm) 測値print 要約より簡単な結果 print(cars.lm)summary 回帰分析結果の要約 summary(cars.lm)plot 回帰診断プロット plot(cars.lm) 17
  18. 18. 線形単回帰分析 電子部品データ標本番号 1 2 3 4 5 6 7 8 9 10 11 12抵抗値x 0.91 0.83 0.8 0.83 0.86 0.85 0.84 0.81 0.79 0.89 0.85 0.83仕上がり 7.2 4.1 2.9 3.8 5.7 5.1 4.4 3.6 3.1 6.4 4.7 4.2のスコアy● xは製造工程である部分を測定した抵抗値● yは最終的に出来た製品の仕上がりを表すスコア 18
  19. 19. 線形単回帰分析 19
  20. 20. 線形単回帰分析 20
  21. 21. 線形単回帰分析最小2乗法 21
  22. 22. 線形単回帰分析最小2乗法 22
  23. 23. 線形単回帰分析最小2乗法 残差 23
  24. 24. 線形単回帰分析最小2乗法残差の2乗和を最小にする直線を求める 残差 24
  25. 25. 線形単回帰分析 25
  26. 26. 線形単回帰分析 指定したモデルの確認の出力 26
  27. 27. 線形単回帰分析 残差分布の四分位数 27
  28. 28. 線形単回帰分析 切片の推定値と その検定結果 28
  29. 29. 線形単回帰分析 傾きの推定値と その検定結果 29
  30. 30. 線形単回帰分析 標準誤差 30
  31. 31. 線形単回帰分析 決定係数と 調整済み決定係数 31
  32. 32. 線形単回帰分析 分散分析後のF値 と結果 32
  33. 33. 線形単回帰分析 33
  34. 34. 線形単回帰分析残差とフィット値のプロット 34
  35. 35. 線形単回帰分析残差の正規Q-Qプロット 35
  36. 36. 線形単回帰分析残差の平方根プロット 36
  37. 37. 線形単回帰分析残差と影響力プロット(梃子値とクックの距離) 37
  38. 38. 線形単回帰分析信頼区間と予測区間 38
  39. 39. 線形重回帰分析説明変数が複数の線形回帰分析 39
  40. 40. 線形重回帰分析 airquality1973年5月から9月までのニューヨークの大気状態を記録したデータ● 40
  41. 41. 線形重回帰分析 41
  42. 42. 線形重回帰分析Ozoneを目的変数として、Solar.R、Wind、Tempを説明変数とした重回帰分析 42
  43. 43. 線形重回帰分析Ozoneを目的変数として、Solar.R、Wind、Tempを説明変数とした重回帰分析 AIC ● 統計モデルを評価するための指標 43
  44. 44. 線形重回帰分析 44
  45. 45. 線形重回帰分析相互作用をを考慮したモデルを構築 45
  46. 46. 線形重回帰分析相互作用をを考慮したモデルを構築 相互作用を考慮しないモデルより AICの値が小さくなった! 662.3732 < 681.7127 46
  47. 47. 線形重回帰分析AICを用いてモデル•変数を選択する関数step 47
  48. 48. 線形重回帰分析AICを用いてモデル•変数を選択する関数step AICが一番小さくなる回帰式 48
  49. 49. 線形重回帰分析step関数で求めたモデルの要約 49
  50. 50. AGENDA● 自己紹介● 回帰分析とは● 線形回帰分析● 非線形回帰分析● まとめ● 最後に 50
  51. 51. 非線形回帰分析目的変数と説明変数が非線形的な関係である回帰分析 51
  52. 52. 非線形回帰分析● 多項式回帰● 一般化線形モデル● ロジスティック回帰● 平滑化回帰● 加法モデル 52
  53. 53. 多項式回帰目的変数を多項式で表す 53
  54. 54. 多項式回帰 非線形回帰分析を行う関数 nls(formula, data, start, trace)formula : モデルの形式data : 回帰分析に用いるデータセットstart : パラメータの初期値trace : 計算過程の結果を返す場合はTRUEを指定 54
  55. 55. 多項式回帰人工データ 55
  56. 56. 多項式回帰 56
  57. 57. 多項式回帰 57
  58. 58. 多項式回帰 58
  59. 59. 一般化線形モデル● 線形回帰分析 – 残差が正規分布に従うと仮定 – 従っていない場合使えない● 一般化線形モデル – 正規分布を拡張した分布族に対応させる – 非線形の現象を線形と同じように簡単に – 不自然な尺度で解釈しないように工夫した解析方法 59
  60. 60. 一般化線形モデル 一般化線形モデルの関数 glm(formula, family, data)formula : モデルの形式family : 当てはめる分布族のリンク関数data : データセット 60
  61. 61. 一般化線形モデル 関数glmで仕様可能な主な分布 族分布族(family) リンク リンク関数正規(gaussian) μ link=”identity”ニ項(binomial) log(μ/(1-μ)) link=”logit”ポアソン(poisson) log(μ) link=”log”ガンマ(Gamma) 1/μ link=”inverse”逆正規(Inverse.gaussian) 1/μ^2 Link=”1/mu^2” 61
  62. 62. 一般化線形モデル airquality● 1973年5月から9月までのニューヨークの大気状態を記録したデータ 62
  63. 63. 一般化線形モデル 63
  64. 64. 一般化線形モデル 64
  65. 65. ロジスティック回帰● 2値データを目的変数とした回帰モデル● ロジスティック関数を用いて分析を行う 65
  66. 66. ロジスティック回帰 SpaceShuttleスペースシャトル•チャレンジャーの打ち上げ時に生じるO-リングの故障状況 66
  67. 67. ロジスティック回帰glmを使ってロジスティック回帰 67
  68. 68. ロジスティック回帰 68
  69. 69. ロジスティック回帰 69
  70. 70. 平滑化回帰複雑な傾向のデータを滑らかな曲線で当てはめる 70
  71. 71. 平滑化回帰 局所重み付き回帰法を行う関数 loess(formula, data, span, degree...)formula : モデルの形式data : 用いるデータセットspan : 平滑の度合いをコントロールするパラメータdegree : 当てはめる多項式の次数 71
  72. 72. 平滑化回帰 B-スプライン関数による 平滑化スプライン曲線を当てはめるsmooth.spline(x, y, df, spar, ...) x : 予測変量 y : 反応変量 df : 等価自由度 spar : 平滑化パラメー タ 72
  73. 73. 73
  74. 74. 一般化加法モデル 74
  75. 75. 一般化加法モデル 一般化加法モデルを求める関数 gam(formula, family, data, ...)formula : モデルの書式。モデル式の右辺に平滑化関数を使うfamily : 残差の分布族data : データセット使える平滑化関数lo : 局所回帰関数s : 平滑化スプライン関数bs : B-スプライン関数ns : 自然スプライン関数 75
  76. 76. AGENDA● 自己紹介● 回帰分析とは● 線形回帰分析● 非線形回帰分析● まとめ● 最後に 76
  77. 77. まとめ● Rで回帰分析を学びました● Rでは、lm、glm、nlsなどの回帰分析をする ための関数が用意されており、簡単に分析が出 来る● gamを使う事で、非常に複雑なデータも扱うこ とが出来る 77
  78. 78. AGENDA● 自己紹介● 回帰分析とは● 線形回帰分析● 非線形回帰分析● まとめ● 最後に 78
  79. 79. 発表者募集しています! 79
  80. 80. AGENDA● 自己紹介● 回帰分析とは● 線形回帰分析● 非線形回帰分析● まとめ● 最後に 80
  81. 81. ご清聴ありがとうございました 81

×