Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

エクセルで統計分析3 回帰分析のやり方

74,915 views

Published on

Excelで動くフリーの統計分析プログラム、HADの解説です。
プログラムは、以下のサイトからダウンロードできます。
http://norimune.net/had

エクセルで統計分析 HADについて
http://slidesha.re/10ARA0k
エクセルで統計分析2 HADの使い方
http://slidesha.re/RsVBp7
エクセルで統計分析3 回帰分析のやり方
http://slidesha.re/XVATPV
エクセルで統計分析4 因子分析のやり方
http://slidesha.re/YWUGNY

Published in: Education

エクセルで統計分析3 回帰分析のやり方

  1. 1. エクセルで統計分析3 HADによる回帰分析・分散分析 清水裕士 関西学院大学社会学部
  2. 2. HADとは • 清水が作ったExcelで動くフリーソフト – 心理統計分析のほとんどが実行可能 – http://norimune.net/had • 無償・無登録で利用可能です。 • HADの基本的な使い方 – http://slidesha.re/RsVBp7 • こちらのスライドシェアを先に御覧ください
  3. 3. 多変量解析 • 2つのカテゴリから選ぶ – 回帰分析:因果関係を推測する分析 – 因子分析:次元圧縮やカテゴリ分けの分析 • 該当するオプションボタンを押すと、モデリングスペースが開く 下は回帰分析のモデリングスペース
  4. 4. 多変量解析の使用方法 • 使用変数のところに変数を指定 – これはほかの分析と同じ – その後、モデリングスペースでモデルを指定したり、 分析オプションを選択して、「分析実行」ボタンを押す – 「オプション」ボタンを押すと、各分析のより詳細な設 定を変更することができる • 詳しくはWebで。 – 清水のブログでも解説しています • HADのページ • http://norimune.net/?=800
  5. 5. 回帰分析グループ • モデリングシートの「回帰分析」を押す – 回帰分析用のモデリングスペースが開く – 主に変数の因果関係を検討する分析法の集まり • 「回帰分析」の中のサブカテゴリ – 回帰分析:回帰分析、ロジスティック、判別分析 – 分散分析:5要因までの分散分析と多重比較 – 媒介分析:3変数の媒介関係を分析 – 多変量:多変量回帰分析や正準相関分析
  6. 6. 回帰分析のモデリングスペース
  7. 7. 回帰分析
  8. 8. 回帰分析 • 分析のタイプを選択 – 重回帰分析 – 判別分析・・・従属変数がカテゴリ変数 – 多変量回帰分析・・・従属変数が多変量 • 変数の投入方法 – 階層的投入(デフォルト)・・・5ステップまで可能 – ステップワイズ法・・・変数を有意確率が低い順に 投入していく方法
  9. 9. モデルの指定 • 「目的変数を投入」ボタン – 選択したセルを目的変数に指定する • 「主効果を全投入」ボタン – 目的変数に指定した変数以外を主効果に投入 – Shiftキーを押しながら押すと、選択した変数のみ • 「交互作用を全投入」ボタン – 目的変数に指定した以外の変数の主効果と交互作用を すべて投入 – Shiftキーを押しながら押すと、選択した変数のみの交互 作用項を投入(主効果はすべて投入)
  10. 10. 交互作用項の単純効果検定 • スライス変数を指定 – スライス変数・・・群分けをする変数 • 高群・低群に分ける変数のこと – 3要因の交互作用の単純効果を検討可能 • スライス変数に指定できるのは2変数まで • それぞれ別のセルに変数名を入力する • 「スライスに」投入ボタンを押す – 選択したセルにある変数をスライス変数に投入
  11. 11. こんな感じ • 目的変数:idt • 説明変数:talkとperと、その交互作用項 • スライス変数:per
  12. 12. 分析実行 • 「分析実行」ボタンを押す – もしモデリングにエラーがあれば、分析が止まる • 出力 – Step・・・分析結果をステップごとに出力 • 階層的重回帰の場合は入力ステップ • 「各ステップを出力しない」を押すと、出力されない – HRA・・・階層的重回帰分析の結果をまとめたもの – Slice・・・単純効果検定の結果
  13. 13. 回帰分析の出力 talk talk -1SD +1SD per_-1SD 3.127 3.187 per_+1SD 3.181 4.172 ** 2 2.5 3 3.5 4 4.5 -1SD +1SD idt talk per_-1SD per_+1SD
  14. 14. 回帰分析の設定 • 2値データの説明変数をカテゴリ変数として扱う – 2値データをスライス変数に指定するとき、±1SDで スライスせず、2値のそれぞれの値の場合の単純効 果を推定します。 – これをチェックすると、分散分析と同じ結果になります。 • 交互作用項がある場合、主効果を中心化 – 交互作用項は主効果の変数の積で計算しますが、そ のまま計算すると多重共線性が問題となります。 – そこで、これをチェックすると交互作用項がある場合、 主効果をすべて中心化します。
  15. 15. ステップワイズ法 • ステップワイズ法をチェック – モデリングスペースが変わる
  16. 16. ステップワイズ法のモデル指定 • 変数の入力は1行で – モデルのところにだけ入力する – 「主効果を全投入」や「交互作用を全投入」を押すと便利。 • 強制投入 – 必ず投入する変数を指定 – その変数もモデルに入れておく • 出力 – 変数の投入ごとに結果を出力 – 「各ステップを出力しない」をチェックすると最後のモデル だけが出力される
  17. 17. 判別分析
  18. 18. 判別分析 • 従属変数がカテゴリカルデータの場合 – カテゴリへの所属を予測する • 回帰分析のオプションから選択 – 判別分析を選択する • 判別分析も、重回帰と同様のことができる – 階層的投入orステップワイズ – 交互作用と単純効果の検定
  19. 19. 回帰分析のオプション
  20. 20. 多変量回帰分析
  21. 21. 多変量回帰分析 • 従属変数が多変量の場合 – 複数の従属変数への影響を予測する • 回帰分析のオプションから選択 – 多変量回帰分析を選択する
  22. 22. 多変量を選択 • 多変量回帰分析のモデリングスペース
  23. 23. モデルの指定 • 目的変数 – 複数の目的変数を選択可 – 複数のセルを選択して、「目的変数を投入」 • 説明変数 – 主効果・交互作用を投入可 – ただし、単純効果の検定は不可
  24. 24. モデルの指定 • 以下のように投入
  25. 25. 分析実行 • 出力はこんな感じ モデル適合 ※PillaiとはPillaiのトレースを意味しています 変数名 R2 Pillai F値 df1 df2 p値 全体 .241 .245 13.469 6 578 .000 説明変数の多変量検定 変数名 β 偏η 2 F値 df1 df2 p値 skill skill .221 .060 6.179 3 288 .000 con con .423 .191 22.614 3 288 .000
  26. 26. 正準相関分析 • 同時に正準相関分析結果も出力 正準相関分析 正準相関 尤度 χ 2 値 自由度 p値 成分1 .477 0.759 80.039 6 .000 成分2 .135 0.982 5.337 2 .069  正準係数 目的変数 成分1 成分2 idt .485 .893 talk .762 -.542 per -.214 .161 説明変数 成分1 成分2 skill .429 .961 con 1.776 -.920
  27. 27. 分散分析
  28. 28. 分散分析 • モデリングスペースの「分散分析」を押す
  29. 29. モデルの指定 • 目的変数 – 従属変数を指定 – 参加者内要因(Within)がある場合、参加者内要因を構成する変 数すべてを指定する • モデル – 説明変数を主効果・交互作用ともに指定(共変量含む) – 「交互作用を全投入」ボタンを押すととりあえず全部入る • 共変量 – 共変量を指定。共変量もモデルに指定しておく。 • 反復要因 – 参加者内要因の水準数を入力する(後述)
  30. 30. 1要因参加者間要因 • 目的変数:x4・・・$マークはここでは気にしない • 要因:a・・・参加者間要因
  31. 31. 2要因参加者間要因 • 目的変数:x4・・・$マークはここでは気にしない • 要因:aとcと、その交互作用・・・すべて参加者間要因
  32. 32. 一要因参加者内要因 • 目的変数:x1~x4・・・$マークのあとに要因名をつける • 要因:b・・・$のあとの名前が参加者内要因名となる
  33. 33. 2要因以上の参加者内要因 • 参加者内要因の構造 – 入れ後になるように読み込む • 反復測定要因の水準数 – $マークの後に入力した順番に数字を指定 • 2以上の数値をセルごとに入力 – 上の例だと、b1が2水準、b2も2水準なので、2,2と書く • 参加者内要因が1つの場合は、水準数を書く必要はない 要因b1 要因b2 b2=1 b2=2 b2=1 b2=2 目的変数 x1 x2 x3 x4 b1=1 b1=2
  34. 34. 2要因参加者内要因 • 目的変数:x1~x4・・・$マークのあとに二つ指定 • 要因:b1とb2・・・$のあとの名前が参加者内要因名となる • 反復測定・・・参加者内要因の水準数を入力
  35. 35. 2要因混合計画 • 目的変数:x1~x4・・・$マークのあとに参加者内要因名を書く • 要因:aとbと、その交互作用
  36. 36. 共変量のあるモデル • 共変量はモデルにも指定しておく – さきに共変量に指定してから、「交互作用を全投入」 を押すのが便利 • 共変量の投入ルール – 「交互作用を全投入」ボタンを押した場合、 – 参加者間要因とは交互作用は作らない – 参加者内要因とは交互作用項を作る – というルールで投入される(SPSSのデフォルトと同じ)
  37. 37. 共変量のあるモデル • 目的変数:x1~x4 • 要因:aとbと交互作用・・・$のあとの名前が参加者内要因名となる • 共変量:d・・・参加者内要因とだけ交互作用を作る
  38. 38. 単純効果の検定 • スライスに群分け変数を指定 – 「スライスに投入」ボタンを利用すると便利 • 分散分析は5要因まで検討可能 – スライスには4変数まで指定できる – すべての単純主効果・単純交互作用を検討すること ができる • オプションで単純効果検定の方法を選択 – プールされた誤差項による検定・・・検出力が高い – 水準別の誤差項による検定・・・等分散を仮定しない
  39. 39. 単純効果の検定 • スライス変数:a・・・内・間どちらの要因でも指定可能
  40. 40. 分析結果 交互作用のp値 = .004 ** x1 x2 x3 x4 a=1 3.067 5.074 6.074 7.374 ** a=2 3.947 4.141 3.741 3.501 0.602 0.602 0.602 0.602 0.539 0.539 0.539 0.539 ※エラーバーは標準誤差 0 1 2 3 4 5 6 7 8 9 a=1 a=2 得点 b x1 x2 x3 x4
  41. 41. 分散分析のオプション
  42. 42. 一般化線形モデル
  43. 43. 一般化線形モデル • 目的変数に様々なタイプの変数を指定可能 – 順序・・・2値か順序性のある順序尺度変数 – 名義・・・順序性のない、名義尺度変数 – カウント・・・度数データ – 打ち切り・・・天井・床効果のように途中で測定が 打ち切られているようなデータ • 回帰分析とほぼ同じようなことができる – 階層的投入orステップワイズ – 交互作用と単純効果の検定
  44. 44. 一般化線形モデル • モデリングスペース
  45. 45. モデルの指定 • 基本は回帰分析と同じ – 一つの目的変数と,複数の説明変数を選択 – ステップは5つまで • 目的変数のタイプを指定 – 連続,順序,カウント,打ち切り,名義から一つ選択 • 頑健標準誤差の推定の有無 – モデルの仮定から逸脱していても,妥当な検定を行うこ とができる
  46. 46. 分析実行 • 「分析実行」ボタンを押す – もしモデリングにエラーがあれば、分析が止まる • 出力・・・重回帰と同じ – Step・・・分析結果をステップごとに出力 • 階層的投入の場合は入力ステップ • 「各ステップを出力しない」を押すと、出力されない – HRA・・・階層的重回帰分析の結果をまとめたもの – Slice・・・単純効果検定の結果
  47. 47. 分析結果 • モデル適合の指標が重回帰と異なる • Χ2乗値: – 有意な場合,モデルの説明率は0ではない • 適合指標 – 近似R2:残差分散から近似的に計算されたR2
  48. 48. 媒介分析
  49. 49. 媒介分析 • 目的変数と説明変数の関連を説明 – 間接効果検定とブートストラップ信頼区間を算出 • 多くの分析手法で実行可能 – 重回帰分析 – 一般化線形モデル・・・パラメトリックのみ – 階層線形モデル・・・パラメトリックのみ
  50. 50. 媒介分析を選択 • 媒介分析のモデリングスペース
  51. 51. モデルの指定 • 媒介モデル – X→Yの効果を、変数Mが媒介 – つまり、X→M→Yというモデルを検討 • 目的変数 – 変数Yを指定 • モデル – 変数M、変数Xの順に指定 – モデルに指定できるのは2変数のみ
  52. 52. モデルの指定 • con→talk→idtというモデルを検討
  53. 53. 分析実行 • 後は「分析実行」を押すだけ – ブートストラップ標本数などはオプションで指定 • 出力はこんな感じ con talk idt .38** .27** .19** → .09
  54. 54. 媒介分析の設定 • ブートストラップ標本の抽出法 – ノンパラメトリック法 • データから反復抽出によるサンプリングを行う – パラメトリック法 • 推定値とその標準誤差から、正規乱数を発生させる • ブートストラップ信頼区間の推定法 – バイアス修正法 • 推定値を平均値に調整した場合の信頼区間 – パーセンタイル法 • リサンプリングした推定値をそのまま使う方法
  55. 55. 媒介分析のオプション

×