マルチレベルモデル講習会
実践編
清水裕士
広島大学大学院総合科学研究科
http://norimune.net
1
自己紹介
• 清水裕士
– 所属:広島大学 大学院総合科学研究科
• 助教
– 専門:社会心理学 グループダイナミクス
• 親密な対人関係におけるソーシャル・サポート
• 社会規範・道徳の進化
• 連絡先
– E-mail:simizu706(at)hiroshima-u.ac.jp
– Webサイト:http://norimune.net
– Twitter: @simizu706
実践編
3
SPSSによる分析の流れ
4
HLMの分析の流れ
• グループ内類似性の評価
– 級内相関係数の算出
• レベル1・レベル2の変数の用意
– レベル1の変数→集団平均で中心化を行う
• →各集団の平均を得点から引くこと
– レベル2の変数→全体平均で中心化を行う
• HLMを行うソフトに変数をセット
– モデリングをして推定値を算出
• 適合度などを参考に、モデルを修正
5
級内相関係数の算出
「分析」→
「混合モデル」
6
級内相関係数の算出
7
「変量をクリック」
「被験者のグループ化」のところにグループ変数を指定
8
共分散タイプ:無構造
「定数項を含める」をチェック
推定方法を最尤法にしておく
• 「推定」をクリック
– 今回は最尤法を使う
– どちらでも大きな違いはない
– 他はいじらなくていい
9
級内相関係数の算出
• 共分散パラメータを見る
– 残差・・・集団内変動
– 切片・・・集団間変動
– 級内相関 = 0.349 / (0.637 + 0.349) = 0.354
10
説明変数の準備
• 個人レベルの変数
– 集団平均値を算出
• 「グループ集計」で,グループごとの平均値を算出
– 集団平均で中心化
• 上で計算した集団平均値をデータから引く
• 集団レベルの変数
– 全体平均で中心化
• 平均値を計算して,データから引く
11
集団平均値の計算
12
集団平均で中心化
13
全体平均中心化
14
出来上がったデータセット
15
ではさっそくHLMを実行
• 満足度を目的変数にしたHLM
– レベル1に発話量_wc
– レベル2に発話量_m_gmと集団成績_gm
16
発話量_wc
集団成績_gm
満足度
満足度 レベル2
レベル1
発話量_m_gm
平均化
共変量に説明変数を入れて「固定」を押す
17
主効果として各説明変数を入れる
18
「変量」を押して変量効果を指定
19
出力のオプション
• 「統計量」をクリック
– パラメータ推定値
– 共分散パラメータの検定
• は最低限でも出力する
• ここまで出来たら,「OK」
– 分析結果が出力される
20
出力1:情報量基準
• モデルの適合度
– AIC・・・複雑なモデルを好む
– BIC・・・倹約的なモデルを好む
– AICC・・・中間ぐらい
21
固定効果
• 推定値
– いわゆる,回帰係数
– dfは自由度
• 小数があるのは,Satterthwaiteの補正をしているため
22
変量効果の分散成分
• 変量効果の分散と共分散
– UN(1,1)は切片の分散
– UN(2,2)は回帰係数の分散
– UN(2,1)は切片と回帰係数の共分散
• ゾロ目は分散,それ以外は共分散
23
レベル間交互作用
24
レベル間交互作用
25
単純効果分析
• 交互作用効果が出たら単純効果が知りたい
– 分散分析や回帰分析と同じ
– 説明変数が連続変量の場合は,±1SDの効果を
見ることが多い
• あくまで,多い,というだけで,そうすべきというわけで
はない
• SPSSでは単純効果の検定ができない
– PreacherのWebサイトにパラメータを入力
– http://www.quantpsy.org/interact/index.html
26
PreacherのWebサイト
27
グラフも出力してくれる
28
HADによる分析
29
HADとは
• 清水が作ったExcelのVBAで動くプログラム
– Excelのバージョンは2007以降に対応
– Macにも対応(Excel for Mac2011以降)
• WinとMacを同じファイルで使いまわせる
• 主に心理統計分析ができる
– 大抵の心理統計分析は可能
• データハンドリング,統計的検定,多変量解析など
– マルチレベル分析もできる
• 階層線形モデルや,マルチレベルSEMなど
30
HADとは
• 無償のソフトウェアです
– 利用は無償です
– 清水のブログからからダウンロードできます
• http://norimune.net/had
• 何度でもダウンロードできます
• 自由なソフトウェアです
– ソースコードを自由に閲覧・変更することができます
• 第三者への配布も自由です
– ライセンス
• GNU General Public License(GPL)に則ってます
• ライセンスについては「HADとは」
( http://norimune.net/had)のページを参照してください。
31
HLMにおけるHADの特徴
• フリーソフトウェアである
– SPSS(とお金)がなくても,Excelがあれば使える
• 単純効果分析ができる
– 簡単に単純効果とグラフの出力ができる
• 頑健標準誤差を出力できる
– SPSSは出力してくれない
• 最尤法しか対応していない
– 制限付き最尤法は現状,利用できない
– 今後搭載の可能性も0ではない
32
HADを起動する
• 起動時に、マクロを有効にするか聞かれる
– Excelのマクロセキュリティを「中」にする
• Excel上部に下のような警告が出たら、有効化を押す
• 下の通知が出てきたら「有効にする」を押す
33
HAD12以降の注意点
• HAD12からはExcelのソルバーを使っている
– ソルバー:Excelに入っているアドイン
• 最初に起動したときにエラーがでる場合
– コンパイルエラーというのが出ることがある
– その場合は,HADを一度閉じて,もう一度起動する。
すると,ソルバーが入っていれば普通に使うことがで
きる
• ソルバーがない場合
– ソルバーオフバージョンを使う必要がある
34
HADを起動
• B列にグループを識別する変数を入れる
35
モデリングシートに読み込む
• データの読み込み
– セットできたら「データ読み込み」ボタン
– データをチェックして、以下の場合に警告
• データセットに空白がある場合
• 欠損値記号以外の文字列がある場合
– 数式エラーの場合は、それらを欠損値に変換できる
• データが保存されているわけではない
– 変数名の読み込みと設定を読み込むだけ
– データセットを変えると分析結果も変わる
36
モデリングシートの機能
基本的な
統計分析
新しい変数の作成
多変量解析
変数情報の設定 データセット選択
使用変数の指定
37
• モデリングシートの9行目に変数名を指定
• 3通りの指定方法がある
– 自分でセルに入力する → コピペでもよい
– 「選択セルを使用」ボタンを押す
– GUIを使う
分析に使用する変数を指定
ここに入力
ID変数はB列に入力する
38
GUIを使用する
• 「使用変数」ボタンを押すとGUIが立ち上がる
• 追加と削除で指定
– ShiftやCtrlを使えば複数の
変数を選択できる
• 変数の登録
– よく使う変数のセットは登録
しておくと便利
– すぐにセットを呼び出せる
39
HADで基礎統計分析
• 使用変数を指定して,「分析」ボタンを押す
ヒストグラム
40
級内相関係数の算出
• 使用変数を指定して,「分析」ボタンを押す
– 級内相関係数を
チェック
• OKボタンを押す
41
級内相関係数の算出
• 推定値と信頼区間,検定統計量,p値を出力
42
回帰分析の方法
モデリングスペース
43
回帰分析の方法
• 「回帰分析」のラジオボタンをクリック
– 回帰分析用のモデリングスペースが表示される
– その中の「回帰分析」を選択
• 先に目的変数,あとで説明変数を指定
– 変数を選択して,「目的変数を投入」を押す
• ここでは満足度
– 「主効果を全投入」を押すと,自動的に説明変数
がモデルに投入される
44
回帰分析の方法
• 「分析実行」を押す
– 「Reg」というシートで結果が出力される
45
交互作用も簡単にできる
• 交互作用項は自動的に中心化して作成
46
ステップごとの結果
47
単純効果分析も出力する
48
HLMの方法
• モデリングシートで「階層線形モデル」を選択
– HLM用のモデリングスペースに切り替わる
今回はSPSSと結果を一致させるため
頑健標準誤差はオフにしておく
49
実行を押せばHLMができる
• 切片の集団間変動だけを仮定したモデル
– 「HLM」というシートに出力される
HADのHLMは,デフォルトで説明
変数は全体平均で中心化される
50
説明変数の中心化
• 「変数の作成」ボタンから行う
– 「変数の作成」を押して,「尺度変換」タブの「集団
平均で中心化する」をチェック
• 分析上で中心化を行う
– 「レベル1変数を集団平均で中心化」をチェックす
ると,自動的に中心化される
– 説明変数は自動的に全体平均で中心化される
• この設定をオフにすることもできる
51
説明変数の中心化
52
集団平均値の計算
• 「変数の作成」の「尺度変換」タブ
– 集団平均値にチェック → 列を選択して右クリック
53
回帰係数の集団間変動
• 「変量効果→」にレベル1変数を指定する
54
出力1
• モデル適合度
– 情報量基準を参照する
– 回帰係数の集団間変動を仮定すると,R2乗など
の計算はできなくなる
55
出力2
• 固定効果
– 集団平均で中心化した変数・・・wcがつく
– 全体平均で中心化した変数・・・gmがつく
56
出力3
• 変量効果の分散成分
– 検定方法はSPSSと異なる(HLM7と同じ)
57
交互作用項の投入
• 交互作用項を「*」を挟んで投入する
58
交互作用項の投入
• 「交互作用を全投入」ボタン
– 説明変数すべての交互作用項が投入される
• Shiftキー+「交互作用を全投入」ボタン
– 交互作用項を作りたい説明変数を選択した状態
で,Shiftキーを押しながらボタンを押すと,その変
数だけの交互作用項が投入される
– 今回は,「発話量」と「集団成績」の交互作用項だ
けを投入
59
交互作用項の投入
• 分析結果
– 交互作用項が有意
– 情報量基準も小さくなった AIC:777→764
60
単純効果分析
• 「スライス→」に群分け変数を指定
– ここでは集団成績をスライスに指定
61
• 集団成績±1SDの単純効果を推定
単純効果分析
62
単純効果分析
発話量 発話量
-1SD +1SD
集団成績_-1SD 3.230 3.097
集団成績_+1SD 3.350 4.057 **
2.5
3
3.5
4
4.5
-1SD +1SD
満足度
発話量
集団成績_-1SD
集団成績_+1SD
63
マルチレベルモデルあれこれ
64
HLMをするならどのソフトウェア?
• HLM7→ HLMだけならベスト
• HAD → REMLができない 単純効果分析可
• Mplus → REMLができない
• SPSS→ ロバストSEが出ない、DF設定が不自由
• R → ロバストSEが出ない
• HLMをするならとりあえずHLM7がオススメ
– フリーソフトならHADで十分
65
結果を報告するとき
• 固定効果は回帰分析とまったく同じ
– 推定値,効果量, 信頼区間,検定統計量,p値
– βとかγなど,数式や記号は必須ではない
• 変量効果は分散か標準偏差を報告
– 分散か標準偏差かは,ソフトウェアの出力による
• 適合度
– 逸脱度(-2*対数尤度)
• これも必須ではない
– モデル比較をするなら,情報量基準
66
階層「線形」モデル?
• 実は線形だけではない
– HLM7はロジットやポワソンなどのリンクを選べる
– SPSSも一般化線形混合モデルで可能
• ただし,推定精度はよくない
• 擬最尤法を使っているため
• HADでは,簡便的な推定法で可能
– 一般化線形モデルを使って,クラスタ標準誤差で
推定精度を補正する方法
67
HLMの限界
• 従属変数が一つ
– 重回帰分析の発展版であることの限界
– モデリングが限られる
• 集団レベルの独立変数の問題
– 個人レベルの変数を平均化する必要がある
– 説明変数の集団平均値の信頼性が低い場合,
推定にバイアスが生じる
68
マルチレベル構造方程式モデル
• Multilevel Structure Equation Modeling
– 以下、ML-SEM
– SEMの階層的データ分析版
• 多変量を扱ったモデリングが可能
– 適合度指標を参照できる
– 今のところ、Mplus、EQS、ML-winなどが対応
• 今回は簡単な紹介にとどめる
69
HLMとML-SEMのイメージ
個人レベル
説明変数 個人レベル
目的変数
個人レベル
HLM
集団レベル
分解
70
集団平均で中心化
集団レベル
独立変数
集団平均値
集団平均値には個人レベルの情報が含まれる
HLMとML-SEMのイメージ
説明変数
集団レベル
個人レベル
目的変数
個人レベル
分解
ML-SEM
集団レベル
分解
71
集団レベルの推定は,ML-SEMのほうが正確
HLMの結果
• 発言量の集団平均のパスが有意
– しかも高度に有意
72
発話量_wc
集団成績
満足度
満足度 レベル2
レベル1
発話量_m
平均化
0.154**
0.344**
0.220**
0.211**
0.604
72
ML-SEMの結果
• 集団レベルの発話量の効果が変化
– HLMの結果は個人レベルの情報を含んでいる
73
発話量
集団成績
満足度
満足度 レベル2
レベル1
0.150**
0.435*
0.220**
0.205**
0.604
73
発話量
HADによるML-SEM
74
W_満足度W_発話量
B_満足度
B_発話量
B_集団成績
0.220**
0.435**
0.150**
HLMとML-SEMの違い
• 同じ点
– 階層的なデータを分析できる
– ML-SEMはHLMの上位モデル
• 回帰分析と構造方程式モデルの関係と同じ
• ML-SEMの利点
– モデリングが自由(HLMは従属変数が一つ)
– 個人のデータから、集団レベルの独立変数を推定で
きる(HLMは平均値を算出する必要がある)
• HLMの利点
– 多くのソフトウェアが対応している
– 制限付き最尤法を利用できる
• 不偏分散を推定できる
75
階層線形モデルについての資料
• Raudenbush, S. W. & Bryk, A. S. (2002).
– Hierarchical linear models – Applications and data
analysis methods(2nd ED.).
– HLMについてのほぼすべてが書いてある
• PreacherのWebサイト
– http://www.quantpsy.org/interact/index.html
– HLMの単純効果分析を実行できる
• 奥村太一 (2006).
– 階層的線形モデルによるデータの分析例
– http://www.p.u-tokyo.ac.jp/~okumurin/gd_okumura.pdf
76
階層線形モデルについての資料
• 尾崎幸謙先生のWeb資料
– http://www.jartest.jp/pdf/3-5ozaki.pdf
– 独立変数の中心化についてまとめてある
• 水本篤先生のWebサイトの資料
– http://mizumot.com/lablog/archives/179
– 今日の話とは少し違った視点での説明がある
• 村山航先生のWebサイトの資料
– http://www4.ocn.ne.jp/~murakou/statistics.htm
– HLMについてのマニアックな話題がいくつかある
77
ありがとうございました
• 清水裕士
– 所属:広島大学 大学院総合科学研究科
• 助教
– 専門:社会心理学 グループダイナミクス
• 親密な対人関係におけるソーシャル・サポート
• 社会規範・道徳の進化
• 連絡先
– E-mail:simizu706(at)hiroshima-u.ac.jp
– Webサイト:http://norimune.net
– Twitter: @simizu706

マルチレベルモデル講習会 実践編