IR集中講習会 20180130
- 21. Rubinの因果モデル
個人ID 補習
補習を受
けた場合
のアウト
カム
補習を受
けなかっ
た場合の
アウトカ
ム
2つのアウト
カムの差
1 1 90 70 90-70=20
2 0 100 80 100-80=20
3 0 70 50 70-50=20
4 1 80 60 80-60=20
5 1 100 80 100-80=20
平均 88 68 88-68=20
表1. 各人の両方のアウトカムが観察できた場合
個人ID 補習
補習を受
けた場合
のアウト
カム
補習を受
けなかっ
た場合の
アウトカ
ム
2つのアウト
カムの差
1 1 90 ? 90-?=?
2 0 ? 80 ?-80=?
3 0 ? 50 ?-50=?
4 1 80 ? 80-?=?
5 1 100 ? 100-?=?
平均 ? ? ?
表2. 実際に観察できるアウトカム
統計学における因果推論(ルービンの因果モデル) – 医療政策学×医療経済学 :
https://healthpolicyhealthecon.com/2014/11/30/rubin_causal_model/ を改変
21
- 22. Rubinの因果モデル
もし補習を受けた群と補習
を受けなかった群の交絡因
子がすべて調整されていた
ら
唯一の違いは補習の有無
2群の平均の差を求めるこ
とで処置効果を求めること
ができる
個人ID 補習
補習を受
けた場合
のアウト
カム
補習を受
けなかっ
た場合の
アウトカ
ム
2つのアウト
カムの差
1 1 90 ? 90-?=?
2 0 ? 80 ?-80=?
3 0 ? 50 ?-50=?
4 1 80 ? 80-?=?
5 1 100 ? 100-?=?
平均 ? ? ?
表2. 実際に観察できるアウトカム
統計学における因果推論(ルービンの因果モデル) – 医療政策学×医療経済学 :
https://healthpolicyhealthecon.com/2014/11/30/rubin_causal_model/ を改変
22
- 27. ランダム化比較試験
(Randomized Controlled Trial)
すべての交絡因子のバランスがとれていて、唯一違うのが
処置を受けたかどうかだけ
因果推論を行う最良の方法
実験
デメリット
実験を準備するための費用がかかる
処置群と対照群への割り付けに際して、倫理的問題が生じる可能性
がある
日本では医療分野を除き忌避されてきた
Evidence Based Policy Making
27
- 32. 32
SA学生 非SA学生
1年次平均GPA2.47 1年次平均GPA:2.04
マッチング
32
3.3
2.9
1.2
3.3
2.9
1.2
対象群処置群
1年次GPAが同じ2.47の処置群と対照群ができあがり、この2群は比較可能
ここで1年次GPAは共変量(Covariate)
- 34. 傾向スコア
傾向スコア(Propensity Score)
処置群に割り付けられる確率のこと
PS=0.8ならSAになりやすい
でも実際は、PS=0.8でもSAになった学生と、ならない学生がいる
同じPSをもつ学生を2群から集めて、新しく2グループを作ると
すべての共変量において2グループ間の平均が同じような値になる
→ バランスがとれた状態になる
共変量の中には交絡因子も含まれている
→ 唯一の違いは処置を受けたか受けなかっただけになる
34
- 35. データ
2016年度の2年生
処置群:1年生クラスのSAをやった学生 38名
対照群:やらなかった学生 233名
35
Pr(T < t) = 0.0067 Pr(|T| > |t|) = 0.0134 Pr(T > t) = 0.9933
Ha: diff < 0 Ha: diff != 0 Ha: diff > 0
Ho: diff = 0 degrees of freedom = 269
diff = mean(0) - mean(1) t = -2.4906
diff -.3867592 .1552897 -.6924969 -.0810215
combined 271 2.155052 .0544362 .8961326 2.047878 2.262225
1 38 2.487579 .1398904 .8623426 2.204134 2.771024
0 233 2.10082 .0584098 .8915864 1.985738 2.215901
Group Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
Two-sample t test with equal variances
対照群と処置群
の平均は有意に
異なる
SAの方が2年次
GPAが0.39高い
SA
nonSA
- 39. 平均処置効果(ATE)
39
Note: S.E. does not take into account that the propensity score is estimated.
ATE .225597816 . .
ATU 2.10081974 2.36519745 .264377716 . .
ATT 2.48757896 2.49976316 -.012184205 .238191399 -0.05
gpa2 Unmatched 2.48757896 2.10081974 .386759222 .155289659 2.49
Variable Sample Treated Controls Difference S.E. T-stat
_cons -6.146723 1.060345 -5.80 0.000 -8.224961 -4.068485
koudou .0189293 .1722942 0.11 0.913 -.3187612 .3566198
jisin .1652998 .1536029 1.08 0.282 -.1357564 .466356
tousotu .114218 .1565927 0.73 0.466 -.1926981 .4211341
kyoudou -.1046393 .185908 -0.56 0.574 -.4690123 .2597338
sinwa .384141 .1508524 2.55 0.011 .0884757 .6798063
kanko .7735049 .5980319 1.29 0.196 -.3986161 1.945626
shougakka -.8141292 .5961178 -1.37 0.172 -1.982499 .3542402
gpa1 .957281 .2574782 3.72 0.000 .4526331 1.461929
sa Coef. Std. Err. z P>|z| [95% Conf. Interval]
Log likelihood = -87.841183 Pseudo R2 = 0.2004
Prob > chi2 = 0.0000
LR chi2(8) = 44.03
Logistic regression Number of obs = 271
. psmatch2 sa gpa1 shougakka kanko sinwa kyoudou tousotu jisin koudou , out(gpa2) logit ties ate
- 40. 平均処置効果(ATE)
40
Note: S.E. does not take into account that the propensity score is estimated.
ATE .225597816 . .
ATU 2.10081974 2.36519745 .264377716 . .
ATT 2.48757896 2.49976316 -.012184205 .238191399 -0.05
gpa2 Unmatched 2.48757896 2.10081974 .386759222 .155289659 2.49
Variable Sample Treated Controls Difference S.E. T-stat
_cons -6.146723 1.060345 -5.80 0.000 -8.224961 -4.068485
koudou .0189293 .1722942 0.11 0.913 -.3187612 .3566198
jisin .1652998 .1536029 1.08 0.282 -.1357564 .466356
tousotu .114218 .1565927 0.73 0.466 -.1926981 .4211341
kyoudou -.1046393 .185908 -0.56 0.574 -.4690123 .2597338
sinwa .384141 .1508524 2.55 0.011 .0884757 .6798063
kanko .7735049 .5980319 1.29 0.196 -.3986161 1.945626
shougakka -.8141292 .5961178 -1.37 0.172 -1.982499 .3542402
gpa1 .957281 .2574782 3.72 0.000 .4526331 1.461929
sa Coef. Std. Err. z P>|z| [95% Conf. Interval]
Log likelihood = -87.841183 Pseudo R2 = 0.2004
Prob > chi2 = 0.0000
LR chi2(8) = 44.03
Logistic regression Number of obs = 271
. psmatch2 sa gpa1 shougakka kanko sinwa kyoudou tousotu jisin koudou , out(gpa2) logit ties ate
- 42. バランス・チェック
42
M 4.2632 4.1842 4.8 88.2 0.23 0.822 1.39
koudou U 4.2632 3.5966 40.1 2.27 0.024 0.95
M 3.9211 3.6842 14.1 68.6 0.64 0.525 2.01*
jisin U 3.9211 3.1674 44.7 2.79 0.006 1.58
M 3.8684 3.2895 32.6 -3.5 1.36 0.179 1.14
tousotu U 3.8684 3.309 31.5 1.93 0.055 1.41
M 4.5789 4.0526 27.8 42.9 1.36 0.179 1.94*
kyoudou U 4.5789 3.6567 48.7 2.84 0.005 1.11
M 5 4.6316 19.1 73.5 0.89 0.378 1.41
sinwa U 5 3.6094 72.1 4.17 0.000 1.06
M .5 .5 0.0 100.0 0.00 1.000 .
kanko U .5 .21459 61.8 3.83 0.000 .
M .36842 .36842 0.0 100.0 0.00 1.000 .
shougakka U .36842 .6309 -54.0 -3.10 0.002 .
M 2.477 2.6379 -19.0 61.1 -0.88 0.382 0.98
gpa1 U 2.477 2.0632 48.9 2.68 0.008 0.78
Variable Matched Treated Control %bias |bias| t p>|t| V(C)
Unmatched Mean %reduct t-test V(T)/
. pstest gpa1 shougakka kanko sinwa kyoudou tousotu jisin koudou , treated(sa) both
- 44. マッチングの構成
One to One Matching
処置群の1名とPSが最も近い対照群の1名でマッチング
数が少ない方の群にあわせてサンプルサイズが小さくなる
k Nearest Neighbor Matching(k-最近傍マッチング)
処置群の1名とPSが最も近い対照群のk名でマッチング
今回は処置群(SA学生)1名に対して2名の対照群
同じPSを持つ対照群の学生を複数回使う(復元抽出有り)
44
(奥村 2015)
- 48. 参考文献
1. Guo S, Fraser MW(2014)Propensity Score Analysis: Statistical Methods and
Applications (Advanced Quantitative Techniques in the Social Sciences) 2 , SAGE
Publications, Inc.
2. 星野崇宏・岡田謙介(2006)「傾向スコアを用いた共変量調整による因果効果の推定と
臨床医学・疫学・薬学・公衆衛生分野での応用について」, 保健医療科学, 55(3), 230-
243.
3. 星野崇宏(2009)『調査観察データの統計科学―因果推論・選択バイアス・データ』,
岩波書店.
4. 中室牧子・藤原夏希・井口俊太朗(2014)「『AO入試』の再評価: 慶應義塾大学湘南藤
沢キャンパス (SFC) を事例に」, Keio SFC Journal, 14,178-197.
5. 中室牧子・津川友介(2017)『「原因と結果」の経済学―――データから真実を見抜く
思考法』, ダイヤモンド社.
6. 奥村泰之(2015)「傾向スコアの概念とその実践」第4回臨床研究実践講座ワーク
ショップ資料, https://www.slideshare.net/okumurayasuyuki/ss-43780294
48
- 49. 参考文献
1. Rosenbaum PR, Rubin DB(1983)”The central role of the propensity score in
observational studies for causal effects”, Biometrika;70:41-55.
2. 新谷歩(2017)『みんなの医療統計 多変量解析編 10日間で基礎理論とEZRを完全マス
ター! 』, 講談社.
3. 白鳥成彦・田尻慎太郎(2016)「在学中キャリアを意識した初年次教育」, Eco-Forum
31(2), 35-41. 統計研究会.
4. Stuart, E. A. (2010). "Matching Methods for Causal Inference: A Review and a
Look Forward." Statistical Science 25(1): 1–21.
5. 津川友介(2014)「統計学における因果推論(ルービンの因果モデル) – 医療政策学×
医療経済学」,
https://healthpolicyhealthecon.com/2014/11/30/rubin_causal_model/
6. プロペンシティスコア(Propensity score; PS)(1)-PSの正しい使い方 – 医療政策
学×医療経済学 : https://healthpolicyhealthecon.com/2015/05/04/propensity-
score-1/
49