エクセルで統計分析3 回帰分析のやり方

55,025 views

Published on

Excelで動くフリーの統計分析プログラム、HADの解説です。
プログラムは、以下のサイトからダウンロードできます。
http://norimune.net/had

エクセルで統計分析 HADについて
http://slidesha.re/10ARA0k
エクセルで統計分析2 HADの使い方
http://slidesha.re/RsVBp7
エクセルで統計分析3 回帰分析のやり方
http://slidesha.re/XVATPV
エクセルで統計分析4 因子分析のやり方
http://slidesha.re/YWUGNY

Published in: Education

エクセルで統計分析3 回帰分析のやり方

  1. 1. エクセルで統計分析3 HADによる回帰分析・分散分析 清水裕士 関西学院大学社会学部
  2. 2. HADとは • 清水が作ったExcelで動くフリーソフト – 心理統計分析のほとんどが実行可能 – http://norimune.net/had • 無償・無登録で利用可能です。 • HADの基本的な使い方 – http://slidesha.re/RsVBp7 • こちらのスライドシェアを先に御覧ください
  3. 3. 多変量解析 • 2つのカテゴリから選ぶ – 回帰分析:因果関係を推測する分析 – 因子分析:次元圧縮やカテゴリ分けの分析 • 該当するオプションボタンを押すと、モデリングスペースが開く 下は回帰分析のモデリングスペース
  4. 4. 多変量解析の使用方法 • 使用変数のところに変数を指定 – これはほかの分析と同じ – その後、モデリングスペースでモデルを指定したり、 分析オプションを選択して、「分析実行」ボタンを押す – 「オプション」ボタンを押すと、各分析のより詳細な設 定を変更することができる • 詳しくはWebで。 – 清水のブログでも解説しています • HADのページ • http://norimune.net/?=800
  5. 5. 回帰分析グループ • モデリングシートの「回帰分析」を押す – 回帰分析用のモデリングスペースが開く – 主に変数の因果関係を検討する分析法の集まり • 「回帰分析」の中のサブカテゴリ – 回帰分析:回帰分析、ロジスティック、判別分析 – 分散分析:5要因までの分散分析と多重比較 – 媒介分析:3変数の媒介関係を分析 – 多変量:多変量回帰分析や正準相関分析
  6. 6. 回帰分析のモデリングスペース
  7. 7. 回帰分析
  8. 8. 回帰分析 • 分析のタイプを選択 – 重回帰分析 – 判別分析・・・従属変数がカテゴリ変数 – 多変量回帰分析・・・従属変数が多変量 • 変数の投入方法 – 階層的投入(デフォルト)・・・5ステップまで可能 – ステップワイズ法・・・変数を有意確率が低い順に 投入していく方法
  9. 9. モデルの指定 • 「目的変数を投入」ボタン – 選択したセルを目的変数に指定する • 「主効果を全投入」ボタン – 目的変数に指定した変数以外を主効果に投入 – Shiftキーを押しながら押すと、選択した変数のみ • 「交互作用を全投入」ボタン – 目的変数に指定した以外の変数の主効果と交互作用を すべて投入 – Shiftキーを押しながら押すと、選択した変数のみの交互 作用項を投入(主効果はすべて投入)
  10. 10. 交互作用項の単純効果検定 • スライス変数を指定 – スライス変数・・・群分けをする変数 • 高群・低群に分ける変数のこと – 3要因の交互作用の単純効果を検討可能 • スライス変数に指定できるのは2変数まで • それぞれ別のセルに変数名を入力する • 「スライスに」投入ボタンを押す – 選択したセルにある変数をスライス変数に投入
  11. 11. こんな感じ • 目的変数:idt • 説明変数:talkとperと、その交互作用項 • スライス変数:per
  12. 12. 分析実行 • 「分析実行」ボタンを押す – もしモデリングにエラーがあれば、分析が止まる • 出力 – Step・・・分析結果をステップごとに出力 • 階層的重回帰の場合は入力ステップ • 「各ステップを出力しない」を押すと、出力されない – HRA・・・階層的重回帰分析の結果をまとめたもの – Slice・・・単純効果検定の結果
  13. 13. 回帰分析の出力 talk talk -1SD +1SD per_-1SD 3.127 3.187 per_+1SD 3.181 4.172 ** 2 2.5 3 3.5 4 4.5 -1SD +1SD idt talk per_-1SD per_+1SD
  14. 14. 回帰分析の設定 • 2値データの説明変数をカテゴリ変数として扱う – 2値データをスライス変数に指定するとき、±1SDで スライスせず、2値のそれぞれの値の場合の単純効 果を推定します。 – これをチェックすると、分散分析と同じ結果になります。 • 交互作用項がある場合、主効果を中心化 – 交互作用項は主効果の変数の積で計算しますが、そ のまま計算すると多重共線性が問題となります。 – そこで、これをチェックすると交互作用項がある場合、 主効果をすべて中心化します。
  15. 15. ステップワイズ法 • ステップワイズ法をチェック – モデリングスペースが変わる
  16. 16. ステップワイズ法のモデル指定 • 変数の入力は1行で – モデルのところにだけ入力する – 「主効果を全投入」や「交互作用を全投入」を押すと便利。 • 強制投入 – 必ず投入する変数を指定 – その変数もモデルに入れておく • 出力 – 変数の投入ごとに結果を出力 – 「各ステップを出力しない」をチェックすると最後のモデル だけが出力される
  17. 17. 判別分析
  18. 18. 判別分析 • 従属変数がカテゴリカルデータの場合 – カテゴリへの所属を予測する • 回帰分析のオプションから選択 – 判別分析を選択する • 判別分析も、重回帰と同様のことができる – 階層的投入orステップワイズ – 交互作用と単純効果の検定
  19. 19. 回帰分析のオプション
  20. 20. 多変量回帰分析
  21. 21. 多変量回帰分析 • 従属変数が多変量の場合 – 複数の従属変数への影響を予測する • 回帰分析のオプションから選択 – 多変量回帰分析を選択する
  22. 22. 多変量を選択 • 多変量回帰分析のモデリングスペース
  23. 23. モデルの指定 • 目的変数 – 複数の目的変数を選択可 – 複数のセルを選択して、「目的変数を投入」 • 説明変数 – 主効果・交互作用を投入可 – ただし、単純効果の検定は不可
  24. 24. モデルの指定 • 以下のように投入
  25. 25. 分析実行 • 出力はこんな感じ モデル適合 ※PillaiとはPillaiのトレースを意味しています 変数名 R2 Pillai F値 df1 df2 p値 全体 .241 .245 13.469 6 578 .000 説明変数の多変量検定 変数名 β 偏η 2 F値 df1 df2 p値 skill skill .221 .060 6.179 3 288 .000 con con .423 .191 22.614 3 288 .000
  26. 26. 正準相関分析 • 同時に正準相関分析結果も出力 正準相関分析 正準相関 尤度 χ 2 値 自由度 p値 成分1 .477 0.759 80.039 6 .000 成分2 .135 0.982 5.337 2 .069  正準係数 目的変数 成分1 成分2 idt .485 .893 talk .762 -.542 per -.214 .161 説明変数 成分1 成分2 skill .429 .961 con 1.776 -.920
  27. 27. 分散分析
  28. 28. 分散分析 • モデリングスペースの「分散分析」を押す
  29. 29. モデルの指定 • 目的変数 – 従属変数を指定 – 参加者内要因(Within)がある場合、参加者内要因を構成する変 数すべてを指定する • モデル – 説明変数を主効果・交互作用ともに指定(共変量含む) – 「交互作用を全投入」ボタンを押すととりあえず全部入る • 共変量 – 共変量を指定。共変量もモデルに指定しておく。 • 反復要因 – 参加者内要因の水準数を入力する(後述)
  30. 30. 1要因参加者間要因 • 目的変数:x4・・・$マークはここでは気にしない • 要因:a・・・参加者間要因
  31. 31. 2要因参加者間要因 • 目的変数:x4・・・$マークはここでは気にしない • 要因:aとcと、その交互作用・・・すべて参加者間要因
  32. 32. 一要因参加者内要因 • 目的変数:x1~x4・・・$マークのあとに要因名をつける • 要因:b・・・$のあとの名前が参加者内要因名となる
  33. 33. 2要因以上の参加者内要因 • 参加者内要因の構造 – 入れ後になるように読み込む • 反復測定要因の水準数 – $マークの後に入力した順番に数字を指定 • 2以上の数値をセルごとに入力 – 上の例だと、b1が2水準、b2も2水準なので、2,2と書く • 参加者内要因が1つの場合は、水準数を書く必要はない 要因b1 要因b2 b2=1 b2=2 b2=1 b2=2 目的変数 x1 x2 x3 x4 b1=1 b1=2
  34. 34. 2要因参加者内要因 • 目的変数:x1~x4・・・$マークのあとに二つ指定 • 要因:b1とb2・・・$のあとの名前が参加者内要因名となる • 反復測定・・・参加者内要因の水準数を入力
  35. 35. 2要因混合計画 • 目的変数:x1~x4・・・$マークのあとに参加者内要因名を書く • 要因:aとbと、その交互作用
  36. 36. 共変量のあるモデル • 共変量はモデルにも指定しておく – さきに共変量に指定してから、「交互作用を全投入」 を押すのが便利 • 共変量の投入ルール – 「交互作用を全投入」ボタンを押した場合、 – 参加者間要因とは交互作用は作らない – 参加者内要因とは交互作用項を作る – というルールで投入される(SPSSのデフォルトと同じ)
  37. 37. 共変量のあるモデル • 目的変数:x1~x4 • 要因:aとbと交互作用・・・$のあとの名前が参加者内要因名となる • 共変量:d・・・参加者内要因とだけ交互作用を作る
  38. 38. 単純効果の検定 • スライスに群分け変数を指定 – 「スライスに投入」ボタンを利用すると便利 • 分散分析は5要因まで検討可能 – スライスには4変数まで指定できる – すべての単純主効果・単純交互作用を検討すること ができる • オプションで単純効果検定の方法を選択 – プールされた誤差項による検定・・・検出力が高い – 水準別の誤差項による検定・・・等分散を仮定しない
  39. 39. 単純効果の検定 • スライス変数:a・・・内・間どちらの要因でも指定可能
  40. 40. 分析結果 交互作用のp値 = .004 ** x1 x2 x3 x4 a=1 3.067 5.074 6.074 7.374 ** a=2 3.947 4.141 3.741 3.501 0.602 0.602 0.602 0.602 0.539 0.539 0.539 0.539 ※エラーバーは標準誤差 0 1 2 3 4 5 6 7 8 9 a=1 a=2 得点 b x1 x2 x3 x4
  41. 41. 分散分析のオプション
  42. 42. 一般化線形モデル
  43. 43. 一般化線形モデル • 目的変数に様々なタイプの変数を指定可能 – 順序・・・2値か順序性のある順序尺度変数 – 名義・・・順序性のない、名義尺度変数 – カウント・・・度数データ – 打ち切り・・・天井・床効果のように途中で測定が 打ち切られているようなデータ • 回帰分析とほぼ同じようなことができる – 階層的投入orステップワイズ – 交互作用と単純効果の検定
  44. 44. 一般化線形モデル • モデリングスペース
  45. 45. モデルの指定 • 基本は回帰分析と同じ – 一つの目的変数と,複数の説明変数を選択 – ステップは5つまで • 目的変数のタイプを指定 – 連続,順序,カウント,打ち切り,名義から一つ選択 • 頑健標準誤差の推定の有無 – モデルの仮定から逸脱していても,妥当な検定を行うこ とができる
  46. 46. 分析実行 • 「分析実行」ボタンを押す – もしモデリングにエラーがあれば、分析が止まる • 出力・・・重回帰と同じ – Step・・・分析結果をステップごとに出力 • 階層的投入の場合は入力ステップ • 「各ステップを出力しない」を押すと、出力されない – HRA・・・階層的重回帰分析の結果をまとめたもの – Slice・・・単純効果検定の結果
  47. 47. 分析結果 • モデル適合の指標が重回帰と異なる • Χ2乗値: – 有意な場合,モデルの説明率は0ではない • 適合指標 – 近似R2:残差分散から近似的に計算されたR2
  48. 48. 媒介分析
  49. 49. 媒介分析 • 目的変数と説明変数の関連を説明 – 間接効果検定とブートストラップ信頼区間を算出 • 多くの分析手法で実行可能 – 重回帰分析 – 一般化線形モデル・・・パラメトリックのみ – 階層線形モデル・・・パラメトリックのみ
  50. 50. 媒介分析を選択 • 媒介分析のモデリングスペース
  51. 51. モデルの指定 • 媒介モデル – X→Yの効果を、変数Mが媒介 – つまり、X→M→Yというモデルを検討 • 目的変数 – 変数Yを指定 • モデル – 変数M、変数Xの順に指定 – モデルに指定できるのは2変数のみ
  52. 52. モデルの指定 • con→talk→idtというモデルを検討
  53. 53. 分析実行 • 後は「分析実行」を押すだけ – ブートストラップ標本数などはオプションで指定 • 出力はこんな感じ con talk idt .38** .27** .19** → .09
  54. 54. 媒介分析の設定 • ブートストラップ標本の抽出法 – ノンパラメトリック法 • データから反復抽出によるサンプリングを行う – パラメトリック法 • 推定値とその標準誤差から、正規乱数を発生させる • ブートストラップ信頼区間の推定法 – バイアス修正法 • 推定値を平均値に調整した場合の信頼区間 – パーセンタイル法 • リサンプリングした推定値をそのまま使う方法
  55. 55. 媒介分析のオプション

×