SlideShare a Scribd company logo
1 of 148
Download to read offline
因果推論駅の奥へ!
“What works” meets “why it works”
某講演会@東京某所 2019/7/14(⽇)
@国⽴環境研究所 環境リスク・健康研究センター
林岳彦
解題
(イントロとして)
I. 解題:”因果推論駅”の奥へ|
東京駅
東京駅の3つの⼊り⼝
端的に⾔って愚問である
どれも「東京駅」としかいいようがないし
そもそもぜんぶ奥で繋がってる
八重洲口丸の内口
日本橋口
どの入口が最も優れた「東京駅」か?
どの入口が本物の「東京駅」か?
ぱっと⾒の外観は
それぞれ個性的
特定の⽬的の上では
どれが良いかという
議論はありうるけど
因果推論
I. 解題:”因果推論駅”の奥へ|
どれも「因果推論」としかいいようがないし
そもそもぜんぶ奥で繋がってる
どの入口が本物の「因果推論」か?
どの入口が最も優れた「因果推論」か?
統計的因果推論の3つの⼊り⼝
Pearl口Rubin口
Robins口
Hernan & Robins
(coming soon)
ぱっと⾒の外観は
それぞれ個性的
特定の⽬的の上では
どれが良いかという
議論はありうるけど
端的に⾔って愚問である
I. 解題:”因果推論駅”の奥へ|
本⽇の話: ”因果推論駅の奥”へ⾏ってみよう!
⼀⾒異なる因果推論のアプローチが奥の⽅で
繋がっているさまを理解する
その“駅の奥”から「質的」と「量的」の繋が
りがどう⾒えるのか眺める
因果推論駅の奥へ!
“What works” meets “why it works”
I. 解題:”因果推論駅”の奥へ|
Disclaimer: そんなに独⾃性のある話ではないです
今⽇の話のモチーフ⾃体
はその多くを
Morgan & Winship (2014)
に負っています
おそらく語り⼝はかなり
異なりますが
⽇本でももっと
広く読まれるべき
だと思うので
誰か翻訳してほしい
I. 解題:”因果推論駅”の奥へ|
本発表にあたり「社会学との関連もぜひ意識して」
という依頼を受けたので
⼀応この辺りの⽤語法のイメージを念頭に置きました
I. 解題:”因果推論駅”の奥へ|
【講演後の追加補⾜:「質的」の⽤語法について】
本発表における「質的理解」の意味は
基本的にはMorgan & Winship (2014)におけ
る”Mechanism sketch“の意味に近いです
分野によって、「仮説形成」とか、「マッピング」
とか「ブレインストーミング」のような⾔い⽅に
対応するかもしれません
⼀部の議論で、⽣活史的なアプローチを意識して
いる箇所もあります(”⼿触り”の話など)
データサイエンス的には「ドメイン知識」と
ほぼ重なるかなと思います
本講演の全体まとめ
因果推論(潜在反応の差分をとること)と、多様
性やメカニズムについての理解を進めることのあ
いだには、理論的にそんなに⼤きな乖離はない
“因果推論駅の奥”から眺めると、
Preview: 最終的にはスライド147枚⽬でこういう
話に着地します
140枚以上もかかるわりには結局のところ穏当な話です
両者は理論的には「スープの冷めない距離」にある
本⽇の内容
I-1.「対象集団のありよう」を丁寧に省察せよ:
因果推論のはじまりとしての異質性
I-2. 相関と因果がズレるとき:「ふぞろいのリ
ンゴたち」によるバイアス
II-1.「全ての他の要因」を考える必要があるのか
:バックドア基準⼊⾨
II-2. 潜在反応モデルを関数的因果モデルで記述
する --- “What works” meets “why it works”
I. 統計的因果推論と異質性/多様性
II. 統計的因果推論の理論の繋がり
本⽇は以下の三部構成:
本⽇の内容
III. 統計的因果推論と「質的な研究」(議論)
Evidence-Based Policy Makingの”往路”と”復路”
科哲っぽく: 反事実条件⽂による因果定義の特徴
移設可能性/外的妥当性の不適切な議論の例
メカニズム/媒介の重要性(壊⾎病の例)
メカニズム/媒介の重要性(再・マシュマロ実験)
EBPMにおける「RCT最強論」の半可通性
“What works” meets “why it works”
質的な”⼿触り”の重要性:介⼊の⽂脈的な意味
本⽇の内容
I-1.「対象集団のありよう」を丁寧に省察せよ:
因果推論のはじまりとしての異質性
I-2. 相関と因果がズレるとき:「ふぞろいのリ
ンゴたち」によるバイアス
II-1.「全ての他の要因」を考える必要があるのか
:バックドア基準⼊⾨
II-2. 潜在反応モデルを関数的因果モデルで記述
する --- “What works” meets “why it works”
I. 統計的因果推論と異質性/多様性
II. 統計的因果推論の理論の繋がり
本⽇は以下の三部構成:
因果推論のはじまりの場所|
初⼼に戻り「対象のありよう」を丁寧に考える
10個のリンゴがあります
統計の教科書が想定してる「ありよう」は
Exchangeable!
Exchangeable?
因果推論のはじまりの場所|
初⼼に戻り「対象のありよう」を丁寧に考える
10個のリンゴがあります
現実はしばしば「ふぞろいのリンゴ」である
因果推論のはじまりの場所|
因果推論でまず重要なのは「対象集団のありよ
う」について丁寧に省察することである
ある意味、統計的因果推論とは集団内の異質
性/⾮均⼀性を巡る体系である(後述)
「ありよう」の質的な省察は推論の⼟台をなす
Exchangeable?
本⽇の内容
I-1.「対象集団のありよう」を丁寧に省察せよ:
因果推論のはじまりとしての異質性
I-2. 相関と因果がズレるとき:「ふぞろいのリ
ンゴたち」によるバイアス
II-1.「全ての他の要因」を考える必要があるのか
:バックドア基準⼊⾨
II-2. 潜在反応モデルを関数的因果モデルで記述
する --- “What works” meets “why it works”
I. 統計的因果推論と異質性/多様性
II. 統計的因果推論の理論の繋がり
本⽇は以下の三部構成:
相関と因果がズレるとき|
仮想例として「肥料X→リンゴの糖度Y」の因果
効果を考えてみる(まずは均⼀品種バージョン)
肥料Xを与えると糖度Yは単純に+2される
もともとのリンゴの糖度Yの平均は16、
分散は1.0
「肥料X=あり」で育てたリンゴは50個
「肥料X=なし」で育てたリンゴは50個
肥料X=あり/なしの糖度Yをプロットすると
つまり「真の因果効果」は +2.0
3
8
12
16
20
−1 0 1 2 3
8
12
16
20
−1 0 1 2 3
8
12
16
20
相関と因果がズレるとき|
なし あり
肥料X
糖
度
Y
「肥料X→リンゴの糖度Y」の散布図(1品種ver)
+2.1
各処理グループ
平均の差(+2.1)
「真の因果効果(+2)」
≒
散布図上での差を
因果効果として
そのまま解釈可能
=バイアスなし
ここでのバイアスの定義=
「真の因果効果」と「観測された処理
グループ平均の差」の系統的なズレ
相関と因果がズレるとき|
「ぺこ」と「すまいる」の2つのリンゴ
品種がサンプル内に混在している
肥料X=あり/なしの糖度Yをプロットすると
元々の「ぺこ」の糖度Yの平均は16
元々の「すまいる」の糖度Yの平均は12
その他の設定・仮定は先程の例と同一
ひきつづき「肥料X→リンゴの糖度Y」の因果効
果を考えてみる(2品種への拡張バージョン)
3
8
−1 0 1 2 3
3
8
12
16
20
−1 0 1 2 3
相関と因果がズレるとき|
なし あり
肥料X
糖
度
Y
「肥料X→リンゴの糖度Y」の散布図(2品種ver)
+4.4 各処理グループ
平均の差(+4.4)
「真の因果効果(+2)」
≠
(他の設定は同⼀でも)
2種類の品種が
混在するだけで
バイアスが⽣じる
異質性がバイアスを⽣む
相関と因果がズレるとき|
品種が混在するときは必ずバイアスが⽣じる?
8
12
−1 0 1 2 3
8
12
−1 0 1 2 3
8
12
−1 0 1 2 3
8
12
16
20
−1 0 1 2 3
8
12
16
20
−1 0 1 2 3
8
12
16
20
−1 0 1 2 3
16
20
16
20
16
20
+4.4+2.0-0.8
なし あり
肥料X
糖
度
Y
なし あり
肥料X
なし あり
肥料X
40/10 10/40 25/25 25/25 40/1010/40
「品種の⽐率」が処理グループ間で同じとき
にはバイアスが⽣じない
ぺこ/すまいる比(総数ではぺこ50個/すまいる50個)
8
12
−1 0 1 2 3
8
12
−1 0 1 2 3
8
12
−1 0 1 2 3
8
12
16
20
−1 0 1 2 3
8
12
16
20
−1 0 1 2 3
8
12
16
20
−1 0 1 2 3
相関と因果がズレるとき|
品種が混在するときは必ずバイアスが⽣じる?
+3.3+2.2+0.8
なし あり
肥料X
糖
度
Y
なし あり
肥料X
なし あり
肥料X
ぺこ/すまいる比
8/42 2/48 5/45 5/45 8/422/48
「品種の⽐率」が処理グループ間で同じとき
にはバイアスが⽣じない
(総数ではぺこ10個/すまいる90個)
ここ⼤事
相関と因果がズレるとき|
「品種の⽐率」が処理グループ間で同じとき
にはバイアスが⽣じない
「特性(共変量)のありよう」が処理グループ
間で同じときにはバイアスが⽣じない
統計的因果推論の要点:処理と共変量の独⽴性
処理グループ間で「共変量がバランシングしている」みたいな
⾔い⽅もします
この例を⼀般化すると
数式だと P(共変量Z|X=あり)=P(共変量Z|X=なし)
統計的因果推論の主要な企みとは、上記の独⽴性
を実験計画や解析の⼯夫により達成すること
相関と因果がズレるとき|
対処例:層別化による処理と共変量の「独⽴化」
『 』
層別解析
『 』
層別解析
層別化で処理間の共変量を
揃える→バイアスが消える
相関と因果がズレるとき|
IIIの⼩まとめ
サンプルの特性がまったく均⼀のときにはバ
イアスが⽣じない
*ここでのバイアスの定義=「真の因果効果」と「観測された処理グループ平均の差」
の系統的なズレ
処理グループ間で特性(共変量)の分布が同じ
ときにはバイアスが⽣じない
この意味で、因果推論とは「対象集団におけ
る異質性への対処」を巡る体系である
因果推論の主要な企みとは、この状況を実験
計画や解析の⼯夫により達成すること
*また、そもそも異質性(たとえば品種)を⾒分けることができなければバイアスの
存在にも気づけない(→質的な省察が推論の⼟台となる)
*処理Xの割付の確率が結果Yに依存するような
特殊な場合を除く
相関と因果がズレるとき|
ひとくちに「特性の分布が同じ」といっても
無数の「特性」がありうるわけで…
その全ての特性(全ての共変量)を
処理間で揃えなければならないの?
ここで少し考えてみよう
「揃えるべき特性」と「揃えなくてもよい特性」を
判別する理論的基準はあるのか?
*たとえばリンゴの「特性」を考えても、品種、産地、農法、農家、流通形態、
収穫時期、価格、などなどいくらでもありうるわけで…
細かく考えていくときりがない!
本⽇の内容
I-1.「対象集団のありよう」を丁寧に省察せよ:
因果推論のはじまりとしての異質性
I-2. 相関と因果がズレるとき:「ふぞろいのリ
ンゴたち」によるバイアス
II-1.「全ての他の要因」を考える必要があるのか
:バックドア基準⼊⾨
II-2. 潜在反応モデルを関数的因果モデルで記述
する --- “What works” meets “why it works”
I. 統計的因果推論と異質性/多様性
II. 統計的因果推論の理論の繋がり
本⽇は以下の三部構成:
導⼊|相関と因果は違う
散布図上の相関関係からの素朴な予測や期待と
因果効果(介⼊効果)がズレることがある
■
『X→Yの介⼊効果』=
Xを1単位量分だけ介⼊により変化させたときの
Yの平均的な変化量
【本⽇の発表の中での定義】
導⼊|相関と因果は違う
散布図上の相関関係からの素朴な予測や期待と
因果効果(介⼊効果)がズレることがある
■
環境汚染物質の河川中濃度 X
底
生
昆
虫
の
種
数
Y
p < 0.001
導⼊|相関と因果は違う
散布図上の相関関係からの素朴な予測や期待と
因果効果(介⼊効果)がズレることがある
■
環境汚染物質の河川中濃度 X
底
生
昆
虫
の
種
数
Y
p < 0.001
「Xが⼩さいとき、Yは⼤きい」
(=相関関係がある)とほぼ確実に⾔える
導⼊|相関と因果は違う
散布図上の相関関係からの素朴な予測や期待と
因果効果(介⼊効果)がズレることがある
■
環境汚染物質の河川中濃度 X
底
生
昆
虫
の
種
数
Y
p < 0.001
「Xが⼩さいとき、Yは⼤きい」
(=相関関係がある)とほぼ確実に⾔える
「Xを⼩さくすると、Yは⼤きくなる」
(=因果関係がある)と⾔えるか?
導⼊|相関と因果は違う
もしXとYの相関が「Xと関係ない要因」で⽣じ
ているならば、Xを減少させてもYは回復しない
■
環境汚染物質の河川中濃度 X
底
生
昆
虫
の
種
数
Y
下流域
上流域
導⼊|相関と因果は違う
もしYの状態がXにより⽣じているならば、Xを
減少させればYは回復する
■
環境汚染物質の河川中濃度 X
底
生
昆
虫
の
種
数
Y
下流域
上流域
導⼊|相関と因果は違う
もしYの状態がXにより部分的に⽣じているなら
ば、Xを減少させればYは部分的に回復する
■
環境汚染物質の河川中濃度 X
底
生
昆
虫
の
種
数
Y
下流域
上流域
導⼊|相関と因果は違う
もしYの状態がXにより部分的に⽣じているなら
ば、Xを減少させればYは部分的に回復する
■
環境汚染物質の河川中濃度 X
底
生
昆
虫
の
種
数
Y
下流域
上流域
「Xを⼩さくすると、Yは⼤きくなる」かは
Yの状態が何によって⽣じているかに依存する
導⼊| 相関と因果で必要とされる⽅法論が違う
「Xが⼩さいとき、Yは⼤きい」か?
∈「相関関係(association)」についての問い
p(Y|X=⼩さい)
やるべきこと:Xが⼩さいときのYの計算
←所与の数値のみから計算できる
環境汚染物質の河川中濃度 X
底
生
昆
虫
の
種
数
Y
p < 0.001
導⼊|相関と因果で必要とされる⽅法論が違う
「Xを⼩さくすると、Yは⼤きくなる」か?
∈「因果的影響(causal effect)」についての問い
p(Y|X=do(⼩さい))
やるべきこと:Xを⼩さくしたときのYの計算
←計算に因果的情報が必要
環境汚染物質の河川中濃度 X
底
生
昆
虫
の
種
数
Y
下流域
上流域
導⼊|相関と因果で必要とされる⽅法論が違う
p(Y|X=⼩さい)
Xが⼩さいときのYの計算
p(Y|X=do(⼩さい))
Xを⼩さくしたときのYの計算
因果の問題相関の問題
p(Y|X=see(⼩さい))
あるいは、いうなれば
なぜズレるの?交絡のせい! 内⽣性のせい!
⼀歩込み⼊った議論をする際に判断に迷うことがある
本章の
⽬標
「バックドアパスが開いているせい」
「バックドア基準が満たされていないせい」
という説明の仕⽅・概念を理解する
association
前置き|バックドア基準は「何について」の話?
■
例えば、重回帰モデルの場合
モデルに追加された説明変数の組が「X→Y」についてバック
ドア基準を満たすとき、重回帰分析から得られたXの偏回帰係
数をそのまま「X→Yの介⼊効果」のバイアスのない推定量と
みなせる
例えば、「シンプソンのパラドックス」(ここでは、どの変数で層別化す
るかによって推定結果が変るケースの意味で⽤いる)が⽣じている場合
興味の対象となる「処理X→結果Y」についてバックドア基準
を満たす変数で層別化して解析すれば「X→Yの介⼊効果」を
バイアスなく推定できる
具体的には、バックドア基準を満たすと:
*データが適切に測定されており、かつ適切なモデルが適⽤されているという⼤前提での話です
*
*
今⽇の話| バックドア基準とは?(ざっくり)
“バックドア基準が満たされている”■
“バックドアパス”って何?
“開く/閉じる”ってどういうこと?
+ (2) 処理X→結果Yの道がブロックされていない
(1) 開きっぱなしのバックドアパスがない≒
“ブロック”って何?
今⽇の話| バックドア基準とは?(ざっくり)
“バックドア基準が満たされている”■
“バックドアパス”って何?
“開く/閉じる”ってどういうこと?
+ (2) 処理X→結果Yの道がブロックされていない
(1) 開きっぱなしのバックドアパスがない≒
“ブロック”って何?
超ざっくり説明|”バックドアパス”とは?
n 因果構造を丘にある「⼈⼯池」でイメージする
迂遠かもしれませんが、因果の「流れ」のアナロジーと
して有効だと思うので少々お付き合いいただければ・・
X
Y
*降⾬の影響などは考えない本講演を通して
X: 処理
Y: 結果
Z: 共変量
で表記します
*
Y=βX+γ+ε
⼈⼯池
⼈⼯池
⽔路
超ざっくり説明|”バックドアパス”とは?
「バックドアパス」=『処理Xと結果Yの上
流側にある両者に影響を与える流れ』
■
X
Y
Z1
Z2
(X→Yの)
バックドアパス
上流側にある「Z1」に
インクをぶちまけると
XにもYにも到達する
(=両者に影響を与える)
超ざっくり説明|”バックドアパス”とは?
44
「バックドアパス」=『処理Xと結果Yの上
流側にある両者に影響を与える流れ』
■
X
Y
Z1
Z2
(X→Yの)
バックドアパス
ではない!
上流側にある「Z1」に
インクをぶちまけても
Yにしか到達しない
(=両者には影響を与えない)
超ざっくり説明|”バックドアパス”とは?
45
「バックドアパス」=『処理Xと結果Yの上
流側にある両者に影響を与える流れ』
■
X
Y
Z1
Z2
(X→Yの)
バックドアパス
ではない!
上流側にある「Z1」に
インクをぶちまけても
Xにしか到達しない
(=両者には影響を与えない)
超ざっくり説明|”バックドアパス”とは?
46
「バックドアパス」=『処理Xと結果Yの上
流側にある両者に影響を与える流れ』
■
X
Y
Z1
Z2
(X→Yの)
バックドアパス
ではない!
上流側にある「Z1」に
インクをぶちまけても
Xにしか到達しない
(=両者には影響を与えない)
*Xそのものを通してYへ繋がる
流れはノーカウント
(再)超ざっくり説明|”バックドアパス”とは?
47
「バックドアパス」=『処理Xと結果Yの上
流側にある両者に影響を与える流れ』
■
X
Y
Z1
Z2
(X→Yの)
バックドアパス
上流側にある「Z1」に
インクをぶちまけると
XにもYにも到達する
(=両者に影響を与える)
超ざっくり説明|バックドアパスの何が問題?
上流側の変動に伴い”シンクロ”が⽣じる■
X
Y
Z
X
Y
Zの変動によりX-Y間に
"シンクロ"が⽣じる
Zが⼤
Zが⼩
(X→Yの)
バックドアパス
このZの変動によるシンクロが”疑似相関”を⽣み、
X→Yの介⼊効果の推定にバイアスをもたらす
⾮因果的
連関
超ざっくり説明|バックドアパスの何が問題?
参考:バックドアパスがない場合の例■
X
Y
Z
X
Y
Zの変動でX-Y間に
“シンクロ”は⽣じない
Zが⼤
Zが⼩
バックドアパスがないとき、Zの変動はバイアス・
擬似相関の原因とならない
今⽇の話| バックドア基準とは?(ざっくり)
“バックドア基準が満たされている”■
“バックドアパス”って何?
“開く/閉じる”ってどういうこと?
+ (2) 処理X→結果Yの道がブロックされていない
(1) 開きっぱなしのバックドアパスがない≒
“ブロック”って何?
超ざっくり説明|バックドアパスが”閉じる”とは?
バックドアパスが”閉じる”=バックドアパス
上の変数を”固定”する
■
X
Y
Z
Zを“固定”する
バックドアパスが”閉じ”
交絡の影響が消える
シンクロを⽣む流れが
“ブロック”される
Zで層別化して解析
重回帰分析の共変量としてZをモデルに追加
“固定”= 条件付けconditioning の⼿法の例
・
・
超ざっくり説明|バックドアパスが”閉じる”とは?
参考:Zでの層別化(X:汚染濃度, Y:種数, Z:流域)■
「上流」「下流」の層別に
X→Yの効果を計算して集計する
Z:流域
X:汚染
濃度
Y:種数
流域Zを層別化により”固定”し解析することで交絡
の影響が消え、介⼊効果がバイアスなく推定できる
環境汚染物質の河川中濃度 X
底
生
昆
虫
の
種
数
Y
下流域
上流域
超ざっくり説明|パスが”開きっぱなし”とは?
バックドアパスが開きっぱなし=変数が固定
されずパスの流れが”ブロック”されていない
■
X
Y
Z
X
Y
Zの変動によりX-Y間に
"シンクロ"が⽣じる
Zが⼤
Zが⼩
(X→Yの)
バックドアパス
⾮因果的
連関
介⼊効果の推定のバイアスが調整されぬまま残る
超ざっくり追記|固定により”開く”こともある
合流点を固定すると、“親”の間に双⽅向
パスが開く
■
バックドアパスが
“開いた”状態
X
Y
Z
(X→Yの)
バックドアパス
⼦
親
親
バックドアパスの
ない状態
X
Y
Z
Zを“固定
超ざっくり追記|固定により”開く”こともある
参考:合流点となる「合否」を”固定”■
実
技
試
験
Z:合否
Y:実技
試験
美⼤の⼊学試験における仮想例
合否Zで層別化すると、XとYの間に⾮因果的な連関
が⽣じ、X→Yの介⼊効果にバイアスが⽣じる
合格者 Z=1
不合格者 Z=0
X:学⼒
試験
100
100
学⼒試験
合
格
ラ
イ
ン
内容の説明| バックドア基準とは?(概要版)
“バックドア基準が満たされている”■
“バックドアパス”って何?
“開く/閉じる”ってどういうこと?
+ (2) 処理X→結果Yの道がブロックされていない
(1) 開きっぱなしのバックドアパスがない≒
“ブロック”って何?
超ざっくり説明| ”X→Yの道を閉じるな”
中間点をZを固定すると、Xからの「介⼊効
果」の流れ⾃体がブロックされてしまう
("overconditioning")
■
在来種Aを護るための
外来種Bの駆除の効果(仮想例)
Z:外来種B
の根絶
Y:在来種A
の個体数
X:外来種B
の駆除努⼒
外来種Bの駆除努⼒
在
来
種
A
の
個
体
数
種Bの根絶に成功(Z=1)
種Bの根絶に失敗(Z=0)
内容の説明| バックドア基準とは?(概要版)
“バックドア基準が満たされている”■
“バックドアパス”って何?
“開く/閉じる”ってどういうこと?
+ (2) 処理X→結果Yの道がブロックされていない
(1) 開きっぱなしのバックドアパスがない≒
“ブロック”って何?
具体例でおさらい|3変量(X, Y, Z)の場合
3変量で⾒る”ほぼバックドア基準”■
X
Y
Z
)
X
Y
Z
)
X
Z
Y
( )
Zを加えよ Zを加えるな
*3変量の場合では、巷の”rule-of-thumb”的な変数選択
ルール以上のご利益はあまり感じられないかも
具体例でおさらい|4変量の場合
4変量以上だと「道」を考える必要がある■
X
Y
Z1
Z2 もし処理Xと結果Yの「両者の共通
原因」を”交絡変数”と呼ぶ場合
Z2は”交絡変数”かつ分岐点
Z1は”交絡変数”と呼ばれない
必ずモデルに追加すべき?
モデルに追加しなくてよい?
common cause
*Z2は観測不可能、Z1は観測済み
のときどうする?
具体例でおさらい| 4変量の場合
変数ベースではなく”道“の開閉がキモ■
このどの場合もバックドアパスは閉じられている
*どのケースもXとYの"シンクロ"の原因となりうる上流側の流れが遮断されている
X
Y
Z2
Z1 X
Y
X
Y
Z1
Z2 Z2
Z1
4変量以上の場合|本質は”道”にあり
4変量以上の”道”:合流点の例■
Z1
X
Z2
Y
Z3
Z1
X Y
Z3
X
Z2
Y
Z3
X→Y
Z1Z2
X Y
Z3
Z1 Z2
バックドアパスが
"開いている"
バックドアパスは"閉まっている"
バックドアパスの”道”がブロック
されていることが肝要
4変量以上の場合|本質は”道”にあり
4変量以上の”道”:中間点の場合■
X
Y
Z2
Z1
Z1, Z2は中間点
絶対にモデルに追加
したらダメ?
中間点を⼊れるとXからの
因果効果⾃体が
ブロックされてしまうのでダメ!
(これは3変量の場合と同様)
4変量以上の場合|本質は”道”にあり
4変量以上の”道”:中間点の場合■
X
Y
Z1
Z2
全体としてX→Yの因果の"道"がブロックされないことが肝要
X
Y
X
Y
Z2
Z1 Z1
Z2
4変量以上の場合|まとめ
X
Y
Z2
Z1 X
Y
X
Y
Z1
Z2 Z2
Z1
X
Y
Z1
Z2
X
Y
X
Y
Z2
Z1 Z1
Z2
バックドアパス
をブロックしろ
X→Yの道を
ブロックするな
もうほとんどバックドア基準細かい論点をのぞけば
畢竟, 以下2つのメッセージに集約される■
+補⾜| 下流の変数の追加は”partly”に機能する
X Y
Z Z’
Z’の固定により
部分的に
バックドアパスが
閉じる
Surrogate variableしか測定されていないときも
追加しておいたほうがベターな場合も多い
「部分的」の程度はZとZ’の関連の強さに応じて決まる
X Y
Z Z’
Z’の固定により
部分的に
双⽅向パスが開く
X
Y
Z
Z’の固定により
部分的に
因果効果が
ブロックされる
Z’
Zが分岐点 Zが合流点 Zが中間点
ステップ6 | "まとめ"としてのバックドア基準
教科書内の「バックドア基準」を解読してみよう
⿊⽊学(2017)『構造的因果モデルの基礎』 p99より引⽤
■
ステップ6 | "まとめ"としてのバックドア基準
教科書内の「バックドア基準」を解読してみよう
⿊⽊学(2017)『構造的因果モデルの基礎』 p99より引⽤
■
1. XからZの任意の要素に有向道がない
2. GよりXから出る⽮線(X→)を除いたグラフにおいて、
ZがXとYを有向分離する
定義 3-5 バックドア基準(back door criterion)
“逆”のケース(XがYの下流)ではない
⾮巡回的有向グラフGにおいてXはYの⾮⼦孫である。このとき、次
の2条件を満たす頂点集合Zは、(X, Y)についてバックドア基準を
満たすという
例:中間変数や下流の合流点
Xの下流の共変量をモデルに加えてはいけない
バックドアパスがブロックされている
ステップ6 | "まとめ"としてのバックドア基準
「バックドア基準」のカジュアル⾔い換え版
林・⿊⽊(2016)『相関と因果と丸と⽮印の話』 p44より引⽤
■
「相関関係」と「因果関係」は違います。これはよく知られています。ある要
因 X ともうひとつの要因 Y のあいだに高い相関が見られたからといって,それ
らのあいだに因果的な関係があるとは限りません。一方で,そのような高い相関
を「因果関係」として解釈できる場合もたしかにあります。この辺りが難しいと
ころです。もしあなたの同僚やクライアントが,あなたが作成した散布図を見て
「相関関係」と「因果関係」を明らかに混同した発言をしはじめたとしましょう。
このとき,「この場合はこれこれこうだからこの相関関係は因果関係として解釈
できるんですよ/できないんですよ」と相手に向かって理路整然と説明するのは,
それほど簡単なことではありません。こと因果関係の話になると,自分の頭の中
でその内容を整理するのも,その内容を相手に伝わるように説明するのも,なか
なか難しいものです。
私たちの経験上,そんなときにとても役に立つのは,データの背後に想定して
いる「因果構造(データ生成のメカニズム)」についての(分かる範囲での)簡単な
ポンチ絵を丸と矢印で描いてみせることです[本稿ではそんなポンチ絵の例がたくさん
出てきます]。そして,そのようなポンチ絵を描いたあとに,その描かれた因果構
造が「あ
・
る
・
特
・
定
・
の
・
条
・
件
・
群
・
」を満たしているかどうかを相手と共同で検討していき
ます。多くの場合,その検討を通して「この相関関係は因果関係を示していると
解釈してよいのか?」や「相関関係を因果関係として解釈するためには本来はど
のようなデータが必要なのか?」といった本質的な問いについて,より明確かつ
端的な議論ができるようになります。
相関と因果と丸と矢印のはなし
はじめてのバックドア基準
林岳彦(国立環境研究所)・黒木学(統計数理研究所)
[特集]因果推論 現実の課題に答える統計学
ステップ6 | "まとめ"としてのバックドア基準
「バックドア基準」のカジュアル⾔い換え版
林・⿊⽊(2016)『相関と因果と丸と⽮印の話』 p44より引⽤
■
丸と⽮印で書かれた因果構造において、Xから下流側に⽮印をた
どったときにYにつながる経路があるとする。X→Yの介⼊効果の推
定において、次の2つの条件を満たす「モデルに追加した説明変数
の組」は、バックドア基準を満たすという。
(1) 追加した説明変数はXの下流側にない
(2) Xから出る⽮印を除いたときの因果構造において、追加し
た「説明変数の組」により、(XとYの)上流側の共通要因からの
XとYの両⽅に影響を与える流れがすべて遮断されている
バックドアパスがブロックされている
例題その1|どの変数を加えれば良い?
X
Y
Z1
Z2
Z3
例題その1|どの変数を加えれば良い?
X
Y
Z1
Z2
Z3
バックドアパスの⾒極めに迷ったら、もし「その⼈⼯池にインクを
ぶちまけたらどうなるか」を考えてみよう!
例題その1|どの変数を加えれば良い?
X
Y
Z1
Z2
Z3
Z1にインクをぶちまけると
XとYの両⽅にインクは到達する
バックドアパスの⾒極めに迷ったら、もし「その⼈⼯池にインクを
ぶちまけたらどうなるか」を考えてみよう!
例題その1|どの変数を加えれば良い?
バックドアパスの⾒極めに迷ったら、もし「その⼈⼯池にインクを
ぶちまけたらどうなるか」を考えてみよう!
X
Y
Z1
Z2
Z3
Z2にインクを
ぶちまけると
XとYの両⽅に
インクは到達する
例題その1|どの変数を加えれば良い?
バックドアパスの⾒極めに迷ったら、もし「その⼈⼯池にインクを
ぶちまけたらどうなるか」を考えてみよう!
X
Y
Z1
Z2
Z3
Z2からは
こういう
経路もある
例題その1|どの変数を加えれば良い?
X
Y
Z1
Z2
Z3
バックドアパスの⾒極めに迷ったら、もし「その⼈⼯池にインクを
ぶちまけたらどうなるか」を考えてみよう!
全部で3つの
バックドアパス
がある
例題その1|どの変数を加えれば良い?
X
Y
Z3
Z2
Z1
Z1, Z2をブロックすると3つの
バックドアパスが全て遮断される
バックドア基準を満たす最⼩の変数セットは「Z1, Z2」
*「Z1, Z2, Z3」もバックドア基準を満たします
例題その2|どの変数を加えれば良い?
X
Y
Z1
Z4
Z3
Z2
Z5
Z6
例題その2|どの変数を加えれば良い?
X
Y
Z1
Z4
Z3
Z2
Z5
Z6
例題その2|どの変数を加えれば良い?
X
Y
Z1
Z4
Z3
Z2
Z5
Z6
例題その2|どの変数を加えれば良い?
X
Y
Z4
Z3
Z2
Z5
Z6
Z1
Z1をブロックすると2つの
バックドアパスが全て遮断される
例題その2|どの変数を加えれば良い?
X
Y
Z4
Z3
Z2
Z5
Z6
Z1
*ここでZ5, Z6を⼊れると
新たなバックドアパスが
開いてしまう
Z1をブロックすると2つの
バックドアパスが全て遮断される
例題その2|どの変数を加えれば良い?
X
Y
Z4
Z3
Z2
Z5
Z6
Z1
*ここでZ5, Z6を⼊れると
新たなバックドアパスが
開いてしまう
*Z4はそもそも
中間点なので⼊れてはダメ
Z1をブロックすると2つの
バックドアパスが全て遮断される
例題その2|どの変数を加えれば良い?
X
Y
Z4
Z3
Z2
Z5
Z6
Z1
バックドア基準
を満たす最⼩の
変数セットは
「Z1」
*ここでZ5, Z6を⼊れると
新たなバックドアパスが
開いてしまう
*Z4はそもそも
中間点なので⼊れてはダメ
Z1をブロックすると2つの
バックドアパスが全て遮断される
⼀部が不明な場合|どの変数を加えれば良い?
X
Y
Z1
Z2
この部分の
因果構造は不明
⼀部が不明な場合|どの変数を加えれば良い?
X
Y
Z1
Z2
この部分の
因果構造は不明
バックドアパスが
ある場合、必ず
Z1, Z2のどちらかを通る
⼀部が不明な場合|どの変数を加えれば良い?
X
Z1
Z2
この部分の
因果構造は不明
Y
Z1, Z2をブロックすれば
バックドアパスは
遮断される
⼀部が不明な場合|どの変数を加えれば良い?
X
Z1
Z2
この部分の
因果構造は不明
Y
「Z1, Z2」を加えればバックドア基準を満たす
Z1, Z2をブロックすれば
バックドアパスは
遮断される
ポイントとなる部分の適切な粒度の背景知識があればよい
ただし「何がXの”親”でありうるか」
については正確な
知識が必要
補⾜|実験における無作為化との関係
X Y
Z1Z3 Z2Z5Z6 Z4
So many
バックドアパス
実験はランダム⽣成機によりバックドアパスを閉じる■
補⾜|実験における無作為化との関係
X Y
Z1Z3 Z2Z5Z6 Z4
コイントス
実験は”ランダム⽣成機”によりバックドアパスを閉じる■
補⾜|傾向スコアとの関係
X Y
Z1Z3 Z2Z5Z6 Z4
So many
バックドアパス
傾向スコアはバックドアパスをブロックする"合成変数"■
補⾜ |傾向スコアとの関係
X Y
Z1Z3 Z2Z5Z6 Z4
e
傾向スコアで
まとめてブロック
傾向スコアはバックドアパスをブロックする"合成変数"■
うまく適⽤できれば超強⼒な⼿法!
補⾜|Morgan and Winship (2015)での因果推論⼿法の説明
[第III章]
観測された変数で条件付けして
バックドアパスをブロックでき
るときの因果効果の推定法
[第IV章]
バックドアパスの条件付けが
ineffectiveなときの因果効果の
推定法
マッチング
回帰による推定
重み付け回帰による推定
バックドアパスを条件付けするとは
どういうことか(バックドア基準)
バックドアパスの条件付けが
ineffectiveとはどういうことか
操作変数法
メカニズムと因果的説明
繰り返し観測
観測済変数でバックドアパスを閉められるか否かで
介⼊効果推定における⼿法選択の⼤⽅針が決まる
III.1
III.2
III.3
III.4
IV.1
IV.2
IV.3
IV.4
傾向スコア
Doubly-Robust
フロントドア基準
回帰分断デザイン
IV
バックドア基準のまとめ
“バックドア基準が満たされている”■
+ (2) 処理Xの下流の変数が追加されていない
(1) 開きっぱなしのバックドアパスがない≒
変数ベースではなく”道”の開閉がキモ■
・たとえ森羅万象が因果関係で繋がっていても、因
果効果を識別可能とするために考えるべき局所的
な因果構造と変数の範囲を理論的に限定できる
・傾向スコアもバックドアパスを閉じるための強⼒
な⼿法(バックドア基準は理論的条件)
介⼊効果がバイアスなく推定できる
*データが適切に測定されており、かつ適切なモデルが適⽤されているという⼤前提での話です
(再掲)|バックドア基準は「何について」の話?
■
例えば、重回帰モデルの場合
モデルに追加された説明変数の組が「X→Y」についてバック
ドア基準を満たすとき、重回帰分析から得られたXの偏回帰係
数をそのまま「X→Yの介⼊効果」のバイアスのない推定量と
みなせる
例えば、「シンプソンのパラドックス」(ここでは、どの変数で層別化す
るかによって推定結果が変るケースの意味で⽤いる)が⽣じている場合
興味の対象となる「処理X→結果Y」についてバックドア基準
を満たす変数で層別化して解析すれば「X→Yの介⼊効果」を
バイアスなく推定できる
具体的には、バックドア基準を満たすと:
*データが適切に測定されており、かつ適切なモデルが適⽤されているという⼤前提での話です
*
*
(再掲)|バックドア基準は「何について」の話?
介⼊効果推定におけるバックドア基準とは■
バックドア基準は上式が成り⽴つ際に含まれる
べき共変量Zのセット(上式の成⽴条件)を⽰す
・処置Xについてexchangeability/ignorabilityが成⽴し
ているとき、交絡の影響なく介⼊効果推定が可能
共変量結果変数の
潜在反応 処置
Hernan and Robins (2017)
『Causal Inference』 より
介⼊効果推定における変数選択の基準を与える
Conditional exchangeability:
補⾜|バックドア基準は「何について」の話?
つまり、共変量セットZがバックドア基準を
満たすとき:
■
⽐較したい要因以外の要因(共変量)が
“全て揃っている"とみなせる!
共変量の違いによる影響が調整された状態で
の処理間の⽐較が可能となる
p(Y|X=⼩さい, Z) = p(Y|X=do(⼩さい))
共変量Zを含んだモデルからのXの条件付き確率が
Xへの介⼊時の確率と等しくなる
do()の表現で書くと:
補⾜ |実務におけるご利益 (*分野と対象による)
バックドア基準/因果モデル検討のご利益の例■
・ 調整すべき変数についての論理が得られる
・量的(統計的)研究と質的研究の橋渡しとなりうる
・ 調整すべき変数を絞り込むことができる
・ 感度分析・媒介効果分析への橋渡しとなりうる
・ 調整すべき変数の抜け漏れを防げる
・因果の図解⾃体が関係者とのやりとりに役⽴つ
・ ⼀般化可能性についての議論も深まりやすくなる
(⼀般化可能性は⽣成メカニズムの安定性や類似性にも⼤きく依存するため)
補⾜ |実務におけるご利益 (*分野と対象による)
■
因果
モデル
介⼊効果
推定
深化
“量的”
研究
“質的”
研究
“概念”の吟味と
⾼解像度化
“繋がり”の吟味と
⾼解像度化
X
バイアスの
減少
介⼊効果推定の
⾼解像度化
(例; 集団内不均⼀性の考慮,
媒介分析)
量的(統計的)研究と質的研究の理想イメージ
介⼊効果がいかに/どの程度⽣じるかについての
“Sufficiently deep explanation”を社会に提供できる
Morgan and Winship (2014)
II-1.のまとめ
全ての特性(全ての共変量)を
処理間で揃えなければならないのか?
データ⽣成における因果構造のモデルから
バックドア基準により
「揃えるべき特性」「揃えなくてもよい特性」
「揃えるべきでない特性」および、
「考慮すべき局所的な因果構造の範囲」を
判別できる
⼀般に、因果構造(要因間の繋がり)のモデルは質的な省察に多くを依存
している。つまり、因果効果の量的な識別可能性の前提となる
理論的条件の検証には質的な省察がほんらい必要となる
林岳彦・⿊⽊学(2016)
「相関関係」と「因果関係」は違います。これはよく知られています。ある要
因 X ともうひとつの要因 Y のあいだに高い相関が見られたからといって,それ
らのあいだに因果的な関係があるとは限りません。一方で,そのような高い相関
を「因果関係」として解釈できる場合もたしかにあります。この辺りが難しいと
ころです。もしあなたの同僚やクライアントが,あなたが作成した散布図を見て
「相関関係」と「因果関係」を明らかに混同した発言をしはじめたとしましょう。
このとき,「この場合はこれこれこうだからこの相関関係は因果関係として解釈
できるんですよ/できないんですよ」と相手に向かって理路整然と説明するのは,
それほど簡単なことではありません。こと因果関係の話になると,自分の頭の中
でその内容を整理するのも,その内容を相手に伝わるように説明するのも,なか
なか難しいものです。
私たちの経験上,そんなときにとても役に立つのは,データの背後に想定して
いる「因果構造(データ生成のメカニズム)」についての(分かる範囲での)簡単な
ポンチ絵を丸と矢印で描いてみせることです[本稿ではそんなポンチ絵の例がたくさん
出てきます]。そして,そのようなポンチ絵を描いたあとに,その描かれた因果構
造が「あ
・
る
・
特
・
定
・
の
・
条
・
件
・
群
・
」を満たしているかどうかを相手と共同で検討していき
ます。多くの場合,その検討を通して「この相関関係は因果関係を示していると
解釈してよいのか?」や「相関関係を因果関係として解釈するためには本来はど
のようなデータが必要なのか?」といった本質的な問いについて,より明確かつ
端的な議論ができるようになります。
相関と因果と丸と矢印のはなし
はじめてのバックドア基準
林岳彦(国立環境研究所)・黒木学(統計数理研究所)
[特集]因果推論 現実の課題に答える統計学
参考⽂献 | バックドア基準の解説原稿 (本⽇の元ネタ)
2016年6⽉発売「岩波データサイエンスvol. 3」因果推論特集号
参考⽂献 | バックドア基準の解説 (ガチ勢向け)
参考⽂献 | Pearlのやさしい本(昨年でた)
Pearlが、⼀般向けに、
やさしく書いている!
(やさしく書かれているが
けっこう深い/新しい
内容まで書いてある)
本⽇の内容
I-1.「対象集団のありよう」を丁寧に省察せよ:
因果推論のはじまりとしての異質性
I-2. 相関と因果がズレるとき:「ふぞろいのリ
ンゴたち」によるバイアス
II-1.「全ての他の要因」を考える必要があるのか
:バックドア基準⼊⾨
II-2. 潜在反応モデルを関数的因果モデルで記述
する --- “What works” meets “why it works”
I. 統計的因果推論と異質性/多様性
II. 統計的因果推論の理論の繋がり
本⽇は以下の三部構成:
潜在反応モデルと関数的因果モデル|
Neiman-Rubinの潜在反応モデルの考え⽅
処理𝑿 = 𝒙に対して、各個体𝒊は⼀意な(決定論
的に定まる)潜在反応𝒀 𝒙 𝒊 をもつ
𝒀 𝟏 ぴかそ
ねこの健康状態Yに対する栄養補助食Xの影響の例
ぴかそ
だり
𝒀 𝟎 だり
X=0を「補助食なし」、X=1を「補助食あり」とする
もし「ぴかそ」が
「補助⾷あり」のときの
「ぴかそ」の健康状態
もし「だり」が
「補助⾷なし」のときの
「だり」の健康状態
潜在反応モデルと関数的因果モデル|
Neiman-Rubinの潜在反応モデルの考え⽅
因果効果を「処理間での潜在反応の差」として
定義する
X=0を「補助食なし」、X=1を「補助食あり」とする
𝒀 𝟏 ぴかそ − 𝒀 𝟎 ぴかそ
「ぴかそ」へのX→Yの因果効果=
通常、この両者をともには観測できない
“因果推論の根本問題”「しゅれーでぃんがー」
の場合には別途検討
同じ個体に同時に異なる処理はできない
ねこの健康状態Yに対する栄養補助食Xの影響の例
潜在反応モデルと関数的因果モデル|
Neiman-Rubinの潜在反応モデルの考え⽅
潜在反応の枠組みをもとに「観測できるもの」
と「観測できないもの」を整理する
𝒀 𝒐𝒃𝒔 ぴかそ =
𝑿 𝒀 𝟏 ぴかそ + (𝟏 − 𝑿)𝒀 𝟎 ぴかそ
Xが2値のとき、観測値 𝒀 𝒐𝒃𝒔と潜在反応の関係は:
𝒀 𝒐𝒃𝒔(ぴかそ) = 𝒀 𝟏(ぴかそ)
X=1のときはY1のみ観測可能 X=0のときはY0のみ観測可能
𝒀 𝒐𝒃𝒔(ぴかそ) = 𝒀 𝟎(ぴかそ)
実際の処理と異なる潜在反応は”⽋測”となる
ねこの健康状態Yに対する栄養補助食Xの影響の例
潜在反応モデルと関数的因果モデル|
Neiman-Rubinの潜在反応モデルの考え⽅
「集団への効果」を考えればこの「根本問題」を
バイパスできる?
X=0を「補助食なし」、X=1を「補助食あり」とする
𝑬(𝒀 𝟏 ねこ集団𝑨 ) − 𝑬(𝒀 𝟎 ねこ集団𝑨 )
「ねこ集団A」へのX→Yの平均因果効果=
実は依然、この両者をともには観測できない
同じ集団に同時に異なる処理はできない
ねこの健康状態Yに対する栄養補助食Xの影響の例
潜在反応モデルと関数的因果モデル|
Neiman-Rubinの潜在反応モデルの考え⽅
同じ集団から「処理X=あり」と「処理X=なし」
を分けて考えれば良い?
X=0を「補助食なし」、X=1を「補助食あり」とする
𝑬(𝒀 ねこ集団𝑨 |𝑿 = 𝟏) − 𝑬(𝒀 ねこ集団𝑨 |𝑿 = 𝟎)
「ねこ集団A」へのX→Yの平均因果効果?
異なる処理Xを受けた集団は質的に異なりうるの
でバイアスが⽣じうる 例:体調が良くない個体がより補助⾷を処⽅さ
れやすいと、「補助⾷あり」の⽅のねこ集団の
⽅がもともとの健康状態が悪くなりがち
ねこの健康状態Yに対する栄養補助食Xの影響の例
潜在反応モデルと関数的因果モデル|
Neiman-Rubinの潜在反応モデルの考え⽅
X=0のときの潜在反応 X=1のときの潜在反応
実際は
X=0
𝑬(𝒀 𝟎 ねこ集団𝑨 |𝑿 = 𝟎) 𝑬(𝒀 𝟏 ねこ集団𝑨 |𝑿 = 𝟎)
実際は
X=1
𝑬(𝒀 𝟎 ねこ集団𝑨 |𝑿 = 𝟏) 𝑬(𝒀 𝟏 ねこ集団𝑨 |𝑿 = 𝟏)
X=0を「補助食なし」、X=1を「補助食あり」とする
そもそも観測不能(反事実)
そもそも観測不能(反事実)観測可能
観測可能
(i) (ii)
(iii) (iv)
計算したいのは(たとえば)因果効果 (iv) – (iii)
Average Treatment Effect of the Treated
ねこの健康状態Yに対する栄養補助食Xの影響の例
集団への処理に対して「観測できるもの」と
「観測できないもの」の状況を整理してみる
潜在反応モデルと関数的因果モデル|
Neiman-Rubinの潜在反応モデルの考え⽅
処理Xを集団内の個体に無作為に割り付ければ
反事実の項を観測可能な項で代替できる
無作為割付→潜在反応と処理Xが独⽴→ 𝑌4 𝑋⊥⊥
𝑬 𝒀 𝟎 ねこ集団𝑨 𝑿 = 𝟎 = 𝑬 𝒀 𝟎 ねこ集団𝑨 𝑿 = 𝟏
X=0のときの潜在反応 X=1のときの潜在反応
実際は
X=0
𝑬(𝒀 𝟎 ねこ集団𝑨 |𝑿 = 𝟎) 𝑬(𝒀 𝟏 ねこ集団𝑨 |𝑿 = 𝟎)
実際は
X=1
𝑬(𝒀 𝟎 ねこ集団𝑨 |𝑿 = 𝟏) 𝑬(𝒀 𝟏 ねこ集団𝑨 |𝑿 = 𝟏)
そもそも観測不能(反事実)
そもそも観測不能(反事実)観測可能
観測可能
=
因果効果 (iv) – (iii) を (iv) – (i) として計算可能
(i) (ii)
(iii) (iv)
Average Treatment Effect of the Treated
→
“on average”で ignorability
(再掲+α)|バックドア基準は「何について」の話?
介⼊効果推定におけるバックドア基準とは■
バックドア基準は上式が成り⽴つ際に含まれる
べき共変量Zのセット(上式の成⽴条件)を⽰す
・処置Xについてexchangeability/ignorabilityが成⽴し
ているとき、交絡の影響なく介⼊効果推定が可能
Conditional exchangeability/Ignorability:
𝑌4 𝑋|𝑍⊥⊥ for all X=x
コイントスの結果ZによりXを決定すると「RCT」
ランダム⽣成機
上式を満たすZを合成変数として構成したものが
「傾向スコア」
潜在反応モデルと関数的因果モデル|
Neiman-Rubinの潜在反応モデルの特徴(まとめ)
因果効果を「異なる処理に対する潜在反応の差
分」として定義する
定義により推定量には「反事実」が含まれる
𝑌4 𝑋|𝑍⊥⊥ の条件を満たすことで観察値に
基づき「反事実」の項を計算可能
(尚、バックドア基準を満たせば上記条件は満たされる)
潜在反応の中⾝(”why it works”)はブラック
ボックスでも構わない
*潜在反応がブラックボックスであるのは理論的
な必然というわけではない(次の話につづく)
尚、処理Xが連続量のときの
表現が苦⼿という側⾯もある
「推定プロトコル」への⾒通しがよい
たとえばRCTとか傾向スコアなどで
本⽇の内容
I-1.「対象集団のありよう」を丁寧に省察せよ:
因果推論のはじまりとしての異質性
I-2. 相関と因果がズレるとき:「ふぞろいのリ
ンゴたち」によるバイアス
II-1.「全ての他の要因」を考える必要があるのか
:バックドア基準⼊⾨
II-2. 潜在反応モデルを関数的因果モデルで記述
する --- “What works” meets “why it works”
I. 統計的因果推論と異質性/多様性
II. 統計的因果推論の理論の繋がり
本⽇は以下の三部構成:
参考⽂献|⿊⽊(2017)
ここからの話はこの本の
第六章が元ネタです
本⽇の説明は
やや「超訳」的に
なりますので
正確な議論については
ぜひ本書を
ご参照ください
潜在反応モデルと関数的因果モデル|
関数的因果モデルとは
因果ダイアグラムは関数的因果モデルの視覚的表
現といえる(後者の⽅が表現できるものの幅は広い)
因果構造を関数の形で記述したもの
GUIとCUIのようなイメージ
Y
XZ1
Z2 Z3
特定の関数型を特に念頭に置く話ではない
𝑌 = 𝑔9 (𝑋, 𝑍1)
𝑋 = 𝑔<(𝑍2, 𝑍3)
𝑍1 = 𝑔?@(𝑍2)
𝑌 = ℎ9 (𝑍2, 𝑍3)
GUIの⽅が直感的であるが
CUIの⽅がフレキシブル
こうも書けるし
こうも書ける
*「構造的因果モデル」という呼び⽅のほうが⼀般的かも
潜在反応モデルと関数的因果モデル|
潜在反応モデルを関数的因果モデルで構成する
𝑌<(ぴかそ) = 𝑓(𝑋, 𝑍1, 𝑍2, 𝑍3, . . , 𝑍𝑛)
「ぴかそ」の特性を表す全変数
𝑌E(ぴかそ) = 𝑓(𝑋 = 0, 𝑍1, 𝑍2, 𝑍3, . . , 𝑍𝑛)
𝑌@(ぴかそ) = 𝑓(𝑋 = 1, 𝑍1, 𝑍2, 𝑍3, . . , 𝑍𝑛)
処理X
潜在反応の”中⾝”を関数𝑓と
変数𝑍で表現している
ぴかそ
潜在反応モデルと関数的因果モデル|
例えば全特性が近似的に等しい個体がいれば…
𝑌4(たつや) = 𝑓(𝑋 = 𝑥, 𝑍1, 𝑍2, 𝑍3, . . , 𝑍𝑛)
𝑌4(かずや) = 𝑓(𝑋 = 𝑥, 𝑍1, 𝑍2, 𝑍3, . . , 𝑍𝑛)
もし「たつや」「かずや」という双⼦がいて
もし関数𝑓および変数𝑍が近似的に等しければ
𝑌@ たつや − 𝑌E たつや ≒ 𝑌@ たつや − 𝑌E かずや
これは観測可能!
「関数と特性」で潜在反応の”中⾝”を語りうる
観測不可能な因果効果
潜在反応の脱ブラックボックス化
潜在反応モデルと関数的因果モデル|
ねこ集団Aへの平均因果効果を考える
𝐸[𝑌<(ねこ集団𝐴)] = 𝐸[𝑓(𝑋, 𝑍1, 𝑍2, . . . , 𝑍𝑛]
集団因果効果=𝑌@ ねこ集団𝐴 − 𝑌E ねこ集団𝐴
= 𝐸[𝑌@ ねこ集団𝐴|𝑋 = 1 ] − 𝐸[𝑌E ねこ集団𝐴|𝑋 = 0 ]
𝐸[𝑌@ ねこ集団𝐴|𝑋 = 1 ] = 𝐸[𝑓 𝑋, 𝑍1, 𝑍2, . . , 𝑍𝑛 𝑋 = 1 ]
𝐸[𝑌E ねこ集団𝐴|𝑋 = 0 ] = 𝐸[𝑓(𝑋, 𝑍1, 𝑍2, . . , 𝑍𝑛|𝑋 = 0)]
もしバックドア基準を満たす変数セットZ
においてこれらの分布が揃っている場合
潜在反応と因果構造の話はあっさり繋がっている
観測値から因果効果を推定可能!
潜在反応モデルと関数的因果モデル|
II-2. のまとめ(結論)
「因果効果(=異なる処理の潜在反応におけ
る差分)」に興味があることと、
「現象を構成する変数の多様性や繋がり(=
潜在反応の”中⾝” )」に興味があることは、
”因果推論駅の奥”からみると元々それほど乖
離しているわけではない
潜在反応の話と因果構造の話は普通に(徒歩で
⾏き来できるくらいのレベル感で)繋がっている
(A)
(B)
潜在反応モデルと関数的因果モデル|
講演後追加余談:反事実計算としての気候変動
シミュレーション
𝑌<(地球) = 𝑓(𝑋 = 𝑥, 𝑍1, 𝑍2, 𝑍3, . . , 𝑍𝑛)
「もし⼆酸化炭素濃度が 𝑋 = 𝑥であったときの
気温 𝑌< 」についての計算機シミュレーション
は、概念的には以下のような潜在反応の関数
的表現として表現できる
フロントドア基準はある意味「シミュレーションによる推定」の
プロトタイプっぽいとこがあるように思う
帰納的推論のみならず、反事実計算⼀般を考え
る上でも⾒通しのよい枠組みといえる
本⽇の内容
III. 統計的因果推論と「質的な研究」(議論)
Evidence-Based Policy Makingの”往路”と”復路”
科哲っぽく: 反事実条件⽂による因果定義の特徴
移設可能性/外的妥当性の不適切な議論の例
メカニズム/媒介の重要性(壊⾎病の例)
メカニズム/媒介の重要性(再・マシュマロ実験)
EBPMにおける「RCT最強論」の半可通性
“What works” meets “why it works”
質的な”⼿触り”の重要性:介⼊の⽂脈的な意味
本⽇の内容
III. 統計的因果推論と「質的な研究」(議論)
Evidence-Based Policy Makingの”往路”と”復路”
科哲っぽく: 反事実条件⽂による因果定義の特徴
移設可能性/外的妥当性の不適切な議論の例
メカニズム/媒介の重要性(壊⾎病の例)
メカニズム/媒介の重要性(再・マシュマロ実験)
EBPMにおける「RCT最強論」の半可通性
“What works” meets “why it works”
質的な”⼿触り”の重要性:介⼊の⽂脈的な意味
因果推論と「質的な研究」|
Evidence-Based Policy Makingの”往路”と”復路”
個人
集団A 集団A’ 集団Σ
集団因果効果の
推定量
法則的(タイプ的)
個別的(トークン的)
“往路”
“復路”
論⽂を書くことを⽣業とする「研究者」
という⼈種はしばしば”往路”までのこと
しか真剣に考えていない
𝛼, 𝛽, 𝛾 …
エビデンス
の⽣産
個人個人
エビデンス
の利⽤
𝑎, 𝑏, 𝑐 … 𝑠, 𝑡, 𝑢 …
トークンto
タイプ
タイプto
トークン
研究者は”丘の上”で論⽂を書く
復路では移設可能性/外的
妥当性が問題となる
本⽇の内容
III. 統計的因果推論と「質的な研究」(議論)
Evidence-Based Policy Makingの”往路”と”復路”
科哲っぽく: 反事実条件⽂による因果定義の特徴
移設可能性/外的妥当性の不適切な議論の例
メカニズム/媒介の重要性(壊⾎病の例)
メカニズム/媒介の重要性(再・マシュマロ実験)
EBPMにおける「RCT最強論」の半可通性
“What works” meets “why it works”
質的な”⼿触り”の重要性:介⼊の⽂脈的な意味
因果推論と「質的な研究」|
科哲っぽく: 反事実条件⽂による因果定義の特徴
“⽔がからからになり、林の居室の花は枯れた”
もし林が⽔をあげていたら、居室の花は枯れ
なかっただろう
もしドナルド・トランプが⽔をあげていたら、
居室の花は枯れなかっただろう
林が⽔をあげなかったことが原因
トランプが⽔をあげなかったことが原因
(A)
(B)
反事実条件⽂の内部には仮想的状況間の”距離”
についての情報が皆無(どちらが現実に近いかを考えるために
は⽣成メカニズムと特性の分布(=関数𝑓と変数𝑍)に関する情報が必要)
←この⽂も真!
←この⽂は真
本⽇の内容
III. 統計的因果推論と「質的な研究」(議論)
Evidence-Based Policy Makingの”往路”と”復路”
科哲っぽく: 反事実条件⽂による因果定義の特徴
移設可能性/外的妥当性の不適切な議論の例
メカニズム/媒介の重要性(壊⾎病の例)
メカニズム/媒介の重要性(再・マシュマロ実験)
EBPMにおける「RCT最強論」の半可通性
“What works” meets “why it works”
質的な”⼿触り”の重要性:介⼊の⽂脈的な意味
因果推論と「質的な研究」|
移設可能性/外的妥当性の不適切な議論の例
1948-52年のアメリカにおける幼少期のテレビ視聴
の有無の解析(テレビの所有の有無が操作変数)
テレビ視聴が⼩学校⼊学後の学⼒テストの偏差
値を0.02点向上させていた
現代⽇本においても「テレビを⾒ると偏差値
が上がる」と⾔える?
移設元-先の因果構造𝑓と特性𝑍の類似性をデフォ
ルトで想定可能とはとても考えられない
そもそも”処理”の概念的同⼀性からして疑問
(概念の質的な吟味が極度に軽視されている)
本⽇の内容
III. 統計的因果推論と「質的な研究」(議論)
Evidence-Based Policy Makingの”往路”と”復路”
科哲っぽく: 反事実条件⽂による因果定義の特徴
移設可能性/外的妥当性の不適切な議論の例
メカニズム/媒介の重要性(壊⾎病の例)
メカニズム/媒介の重要性(再・マシュマロ実験)
EBPMにおける「RCT最強論」の半可通性
“What works” meets “why it works”
質的な”⼿触り”の重要性:介⼊の⽂脈的な意味
因果推論と「質的な研究」|
メカニズム/媒介の重要性(壊⾎病の例)
1747年 対照実験によりシトラスが船員の壊⾎病を防ぐ
効果が確認
シトラス→”酸味”→壊⾎病(の防⽌)
Pearl and Mackenzie (2018)の記述に基づく
1800’s 英国海軍ではシトラス積載により壊⾎病は過去
のものに
しかしmediatorの取り違えにより悲劇が・・・
シトラス→レモン→ライム→加熱濃縮ライムジュース
へと代替されていった(代替のたびにビタミンが減っていく・・)
1900年前後の極地探検にて壊⾎病による死者が多発
本当のmediatorはビタミンC
柑橘の効果⾃体が疑問視され無視されるように・・
因果推論と「質的な研究」|
メカニズム/媒介の重要性(壊⾎病の例)
Pearl and Mackenzie (2018)の記述に基づく
シトラス→”酸味”→壊⾎病(の防⽌)
しかしmediatorの取り違えにより悲劇が・・・
シトラス→レモン→ライム→加熱濃縮ライムジュース
へと代替されていった(代替のたびにビタミンが減っていく・・)
状況が多様な“復路”の現場において”処理”の同⼀
性の担保は必ずしも簡単な話ではない
e.g., RCTのパイロットスタディが⾏われた”意識の⾼い”
学校と同⼀の”処理”を普通の学校で実現できるのか?
異なる対象/⽂脈における“処理”の同⼀性の担保
は質的な理解度(”why it works”)に依存する
因果推論と「質的な研究」|
メカニズム/媒介の重要性(”Algebra for all”の例)
Pearl and Mackenzie (2018)の記述に基づく
Algebra for all Learning
Environment
1997年からシカゴで教育改⾰として”Algebra for
all”というプログラムが導⼊された
因果効果の計算からは効果が⾒られなかったが・・
質的な省察に基づきmediatorを考慮すると
直接効果と間接効果が打ち消し合っていた
カリキュラム⾃体の効果はあり、クラス編成の改
善で効果が上がる(”Why it works”の考慮による改善策の発⾒)
クラス編成の変化により成績下位者の意欲低下
+2.7pt
-2.3pt
本⽇の内容
III. 統計的因果推論と「質的な研究」(議論)
Evidence-Based Policy Makingの”往路”と”復路”
科哲っぽく: 反事実条件⽂による因果定義の特徴
移設可能性/外的妥当性の不適切な議論の例
メカニズム/媒介の重要性(壊⾎病の例)
メカニズム/媒介の重要性(再・マシュマロ実験)
EBPMにおける「RCT最強論」の半可通性
“What works” meets “why it works”
質的な”⼿触り”の重要性:介⼊の⽂脈的な意味
因果推論と「質的な研究」|
メカニズム/媒介の重要性(マシュマロ実験の再試験)
Shoda et al. (1990) マシュマロ実験
Watts et al. (2018)マシュマロ実験の再試験
「マシュマロを⾷べるのを我慢できた⼦/できな
かった⼦」の⻑期追跡により、⼦供の”delay of
gratification”の能⼒が、その後の学業や社会⾏動に
おける成功において重要であることを⽰唆した
より⼤きくかつ多様なsample of childrenを調査
より洗練された統計モデルを使⽤
”delay of gratification”と後のachievementの関係は
⼦供の背景要因と認知能⼒で調整すると⼤幅に減
少し、統計的に有意な関係もほぼ消えた
因果推論と「質的な研究」|
メカニズム/媒介の重要性(マシュマロ実験の再試験)
再試験では”最初の20秒”でほぼ決まっていた
「測定しているのものは”何か”」「媒介しているも
のは”何か” 」を質的に吟味しないと解釈を誤りうる
The relationship between delay of gratification and
academic achievement might be driven by the ability to
generate useful metacognitive strategies that will influence
self-regulation throughout one’s life.
Shoda et al. (1990)での「15分待てること」の解釈
+ 認知能⼒で調整すると効果量は⼤幅減
測定されていたのは”そもそも何だった“のか?
因果推論と「質的な研究」|
メカニズム/媒介の重要性(マシュマロ実験の再試験)
マシュマロ実験の真の教訓は「われわれ研究者に
は”エビデンス”の安易な⼀般化への⾃制⼼がしば
しば著しく⽋けている」という事実である
個⼈的にはアカデミシャン
として忸怩たる思いである
社会経済的・家庭的要
因の重要性を後景化し、
⾃⼰責任論を強化しう
る⽅向への解釈に陥っ
た感は否めない
本⽇の内容
III. 統計的因果推論と「質的な研究」(議論)
Evidence-Based Policy Makingの”往路”と”復路”
科哲っぽく: 反事実条件⽂による因果定義の特徴
移設可能性/外的妥当性の不適切な議論の例
メカニズム/媒介の重要性(壊⾎病の例)
メカニズム/媒介の重要性(再・マシュマロ実験)
EBPMにおける「RCT最強論」の半可通性
“What works” meets “why it works”
質的な”⼿触り”の重要性:介⼊の⽂脈的な意味
因果推論と「質的な研究」|
個人
集団A 集団A’ 集団Σ
集団因果効果の
推定量
“往路”
“復路”
𝛼, 𝛽, 𝛾 …
エビデンス
の⽣産
個人個人
エビデンス
の利⽤
𝑎, 𝑏, 𝑐 … 𝑠, 𝑡, 𝑢 …
トークンto
タイプ
EBPMにおける「RCT最強論」の半可通性
元ネタのEBMedicineは⼀定の
⽣物学的⻫⼀性を想定しうる
点で、EBPMと⼤きく異なる
「往路最強」かもだが、その強みのモデルフリー性
⾃体が”復路”での⼤きな脆弱性を⽣む(過信は禁物)
* Cf., Deaton and Cartwright 2017
⼀般にRCTの内部には異なる状況
間の”距離”に対する情報が皆無
? ? ? ?
?
本⽇の内容
III. 統計的因果推論と「質的な研究」(議論)
Evidence-Based Policy Makingの”往路”と”復路”
科哲っぽく: 反事実条件⽂による因果定義の特徴
移設可能性/外的妥当性の不適切な議論の例
メカニズム/媒介の重要性(壊⾎病の例)
メカニズム/媒介の重要性(再・マシュマロ実験)
EBPMにおける「RCT最強論」の半可通性
“What works” meets “why it works”
質的な”⼿触り”の重要性:介⼊の⽂脈的な意味
因果推論と「質的な研究」|
質的な”⼿触り”の重要性:介⼊の⽂脈的な意味
𝑌<(ぴかそ)
= 𝑓(𝑋, 観測可能&数量化可能なもの,
数量化不可能なもの, 観測不可能なもの,
固有なもの, ⾮固有なもの … )
そもそもを⾔えば、個体の潜在反応は観測可能な
もの/不可能なもの、数量化可能なもの/不可能
なもの/、固有なもの/⾮固有なものの全てに
よって規定されている
観測可能&数量化可能なもの以外の個体の諸々は
”往路”にて”誤差”として⽚付けられてしまう
本当の「ぴかそ」
の全て
半可通にとっての「ぴかそ」の全て
因果推論と「質的な研究」|
個人
集団A 集団A’ 集団Σ
集団因果効果の
推定量
“往路” “復路”
𝛼, 𝛽, 𝛾 …
エビデンス
の⽣産
個人個人
エビデンス
の利⽤
𝑎, 𝑏, 𝑐 … 𝑠, 𝑡, 𝑢 …
トークンto
タイプ
タイプto
トークン
質的な”⼿触り”の重要性:介⼊の⽂脈的な意味
例えばリスク・コミュニケーションの
現場では「数値」のナラティブ内での
位置づけまでの考慮が必要となる
往路で”誤差”として⽚付けた「断⽚的なもの」に
”復路”でふたたび向き合うべきときがある
こういう感覚が分からない⼈をコミュニケーター役にすると⼤抵ろくなことにならない
本⽇の内容
III. 統計的因果推論と「質的な研究」(議論)
Evidence-Based Policy Makingの”往路”と”復路”
科哲っぽく: 反事実条件⽂による因果定義の特徴
移設可能性/外的妥当性の不適切な議論の例
メカニズム/媒介の重要性(壊⾎病の例)
メカニズム/媒介の重要性(再・マシュマロ実験)
EBPMにおける「RCT最強論」の半可通性
“What works” meets “why it works”
質的な”⼿触り”の重要性:介⼊の⽂脈的な意味
因果推論と「質的な研究」|
III.のまとめ:“What works” meets “why it works”
概念と媒介(因果構造)を質的に吟味することは
因果推論のためにも重要(あたりまえだけど)
因果推論(what works)の解析プロトコルを適⽤
すると因果効果の推定量を算出できる(ありがたい)
解釈可能性の話が後景化して解析プロトコルの話
だけが独り歩きするのは本当によくない(実害がでる)
その推定量の内的and/or外挿的な解釈可能性は
”why it works”に本質的に依存する(ここも⼤事)
“往路”でトークンの”感触”が重要となる場合あり
因果推論と「質的な研究」|
解釈可能性の話が後景化して解析プロトコルの話
だけが独り歩きするのは本当によくない
関連⽂献として
この辺りも
オススメ
本書の内容を理解しない⼈が
EBPMを担うとおそらく
ろくなことにならない
本講演の全体まとめ
因果推論とは「対象集団における異質性への
対処」を巡る体系である
バックドア基準により、たとえ森羅万象が因
果関係で繋がっていても、因果効果を識別可
能とするために考えるべき局所的な因果構造
と変数の範囲を理論的に限定できる
潜在反応の話と因果構造の話は普通に(徒歩で⾏
き来できるくらいのレベル感で)繋がっている
I.
II-1.
II-2.
概念と媒介(因果構造)を質的に吟味すること
は因果推論のためにも重要(あたりまえだけど)
III.
本発表全体のまとめ
再掲|実務におけるご利益 (*分野と対象による)
■
因果モデル
(Mechanism
sketch)
介⼊効果
推定
深化
“量的”
研究
“質的”
研究
“概念”の吟味と
⾼解像度化
“繋がり”の吟味と
⾼解像度化
X
バイアスの
減少
介⼊効果推定の
⾼解像度化
(例; 集団内不均⼀性の考慮,
媒介分析)
量的(統計的)研究と質的研究の理想イメージ
介⼊効果がいかに/どの程度⽣じるかについての
“Sufficiently deep explanation”を社会に提供できる
Morgan and Winship (2014)
Why it
works What works
本講演の全体まとめ
因果推論(潜在反応の差分をとること)と、多様
性やメカニズムについての理解を進めることのあ
いだには、理論的にそんなに⼤きな乖離はない
“因果推論駅の奥”から眺めると、
両者は理論的には「スープの冷めない距離」にある
⼤きな研究プロジェクトのリーダー/デザインを担う⼈ほど
こういう感覚をもっていてほしいと思うところである
たとえば媒介分析では
質的な理解が
しばしば不可⽋
因果推論駅の奥へ!
Enjoy!

More Related Content

What's hot

スペクトラルグラフ理論入門
スペクトラルグラフ理論入門スペクトラルグラフ理論入門
スペクトラルグラフ理論入門
irrrrr
 
統計的因果推論 勉強用 isseing333
統計的因果推論 勉強用 isseing333統計的因果推論 勉強用 isseing333
統計的因果推論 勉強用 isseing333
Issei Kurahashi
 

What's hot (20)

相互情報量を用いた独立性の検定
相互情報量を用いた独立性の検定相互情報量を用いた独立性の検定
相互情報量を用いた独立性の検定
 
ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定
 
関数データ解析の概要とその方法
関数データ解析の概要とその方法関数データ解析の概要とその方法
関数データ解析の概要とその方法
 
統計的学習理論チュートリアル: 基礎から応用まで (Ibis2012)
統計的学習理論チュートリアル: 基礎から応用まで (Ibis2012)統計的学習理論チュートリアル: 基礎から応用まで (Ibis2012)
統計的学習理論チュートリアル: 基礎から応用まで (Ibis2012)
 
Rによるやさしい統計学第20章「検定力分析によるサンプルサイズの決定」
Rによるやさしい統計学第20章「検定力分析によるサンプルサイズの決定」Rによるやさしい統計学第20章「検定力分析によるサンプルサイズの決定」
Rによるやさしい統計学第20章「検定力分析によるサンプルサイズの決定」
 
スペクトラルグラフ理論入門
スペクトラルグラフ理論入門スペクトラルグラフ理論入門
スペクトラルグラフ理論入門
 
「生態学における統計的因果推論」という大ネタへの挑戦:その理論的背景と適用事例
「生態学における統計的因果推論」という大ネタへの挑戦:その理論的背景と適用事例「生態学における統計的因果推論」という大ネタへの挑戦:その理論的背景と適用事例
「生態学における統計的因果推論」という大ネタへの挑戦:その理論的背景と適用事例
 
機械学習モデルの判断根拠の説明(Ver.2)
機械学習モデルの判断根拠の説明(Ver.2)機械学習モデルの判断根拠の説明(Ver.2)
機械学習モデルの判断根拠の説明(Ver.2)
 
機械学習による統計的実験計画(ベイズ最適化を中心に)
機械学習による統計的実験計画(ベイズ最適化を中心に)機械学習による統計的実験計画(ベイズ最適化を中心に)
機械学習による統計的実験計画(ベイズ最適化を中心に)
 
Bayes Independence Test - HSIC と性能を比較する-
Bayes Independence Test - HSIC と性能を比較する-Bayes Independence Test - HSIC と性能を比較する-
Bayes Independence Test - HSIC と性能を比較する-
 
ノンパラベイズ入門の入門
ノンパラベイズ入門の入門ノンパラベイズ入門の入門
ノンパラベイズ入門の入門
 
計量経済学と 機械学習の交差点入り口 (公開用)
計量経済学と 機械学習の交差点入り口 (公開用)計量経済学と 機械学習の交差点入り口 (公開用)
計量経済学と 機械学習の交差点入り口 (公開用)
 
統計的因果推論 勉強用 isseing333
統計的因果推論 勉強用 isseing333統計的因果推論 勉強用 isseing333
統計的因果推論 勉強用 isseing333
 
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
 
ベイズ統計学の概論的紹介
ベイズ統計学の概論的紹介ベイズ統計学の概論的紹介
ベイズ統計学の概論的紹介
 
傾向スコアの概念とその実践
傾向スコアの概念とその実践傾向スコアの概念とその実践
傾向スコアの概念とその実践
 
深層学習の数理
深層学習の数理深層学習の数理
深層学習の数理
 
深層学習の不確実性 - Uncertainty in Deep Neural Networks -
深層学習の不確実性 - Uncertainty in Deep Neural Networks -深層学習の不確実性 - Uncertainty in Deep Neural Networks -
深層学習の不確実性 - Uncertainty in Deep Neural Networks -
 
データサイエンス概論第一 5 時系列データの解析
データサイエンス概論第一 5 時系列データの解析データサイエンス概論第一 5 時系列データの解析
データサイエンス概論第一 5 時系列データの解析
 
最適輸送の解き方
最適輸送の解き方最適輸送の解き方
最適輸送の解き方
 

More from takehikoihayashi

世界における疾病および死亡リスク要因の定量化(GBD Study 2010 in Lancetの論文紹介)
世界における疾病および死亡リスク要因の定量化(GBD Study 2010 in Lancetの論文紹介)世界における疾病および死亡リスク要因の定量化(GBD Study 2010 in Lancetの論文紹介)
世界における疾病および死亡リスク要因の定量化(GBD Study 2010 in Lancetの論文紹介)
takehikoihayashi
 
比例ハザードモデルはとってもtricky!
比例ハザードモデルはとってもtricky!比例ハザードモデルはとってもtricky!
比例ハザードモデルはとってもtricky!
takehikoihayashi
 
連続的なリスクのどこに「線」を引くのか:米国EPAのPM2.5基準値改訂、その"正当化ロジック"を読む
連続的なリスクのどこに「線」を引くのか:米国EPAのPM2.5基準値改訂、その"正当化ロジック"を読む連続的なリスクのどこに「線」を引くのか:米国EPAのPM2.5基準値改訂、その"正当化ロジック"を読む
連続的なリスクのどこに「線」を引くのか:米国EPAのPM2.5基準値改訂、その"正当化ロジック"を読む
takehikoihayashi
 
傾向スコア:その概念とRによる実装
傾向スコア:その概念とRによる実装傾向スコア:その概念とRによる実装
傾向スコア:その概念とRによる実装
takehikoihayashi
 
A Bayesian Approach to probabilistic ecological risk assessment
A Bayesian Approach to probabilistic ecological risk assessmentA Bayesian Approach to probabilistic ecological risk assessment
A Bayesian Approach to probabilistic ecological risk assessment
takehikoihayashi
 
なぜベイズ統計はリスク分析に向いているのか? その哲学上および実用上の理由
なぜベイズ統計はリスク分析に向いているのか? その哲学上および実用上の理由なぜベイズ統計はリスク分析に向いているのか? その哲学上および実用上の理由
なぜベイズ統計はリスク分析に向いているのか? その哲学上および実用上の理由
takehikoihayashi
 

More from takehikoihayashi (10)

EBPM, “E”から見るか? “PM”から見るか?
EBPM, “E”から見るか? “PM”から見るか?EBPM, “E”から見るか? “PM”から見るか?
EBPM, “E”から見るか? “PM”から見るか?
 
環境分野における"EBPM"の可能性と危うさ:他山の石として
環境分野における"EBPM"の可能性と危うさ:他山の石として環境分野における"EBPM"の可能性と危うさ:他山の石として
環境分野における"EBPM"の可能性と危うさ:他山の石として
 
応用哲学会2018『リスク分析と予防原則』
応用哲学会2018『リスク分析と予防原則』応用哲学会2018『リスク分析と予防原則』
応用哲学会2018『リスク分析と予防原則』
 
生態学会自由集会での講演のプレビュー
生態学会自由集会での講演のプレビュー生態学会自由集会での講演のプレビュー
生態学会自由集会での講演のプレビュー
 
世界における疾病および死亡リスク要因の定量化(GBD Study 2010 in Lancetの論文紹介)
世界における疾病および死亡リスク要因の定量化(GBD Study 2010 in Lancetの論文紹介)世界における疾病および死亡リスク要因の定量化(GBD Study 2010 in Lancetの論文紹介)
世界における疾病および死亡リスク要因の定量化(GBD Study 2010 in Lancetの論文紹介)
 
比例ハザードモデルはとってもtricky!
比例ハザードモデルはとってもtricky!比例ハザードモデルはとってもtricky!
比例ハザードモデルはとってもtricky!
 
連続的なリスクのどこに「線」を引くのか:米国EPAのPM2.5基準値改訂、その"正当化ロジック"を読む
連続的なリスクのどこに「線」を引くのか:米国EPAのPM2.5基準値改訂、その"正当化ロジック"を読む連続的なリスクのどこに「線」を引くのか:米国EPAのPM2.5基準値改訂、その"正当化ロジック"を読む
連続的なリスクのどこに「線」を引くのか:米国EPAのPM2.5基準値改訂、その"正当化ロジック"を読む
 
傾向スコア:その概念とRによる実装
傾向スコア:その概念とRによる実装傾向スコア:その概念とRによる実装
傾向スコア:その概念とRによる実装
 
A Bayesian Approach to probabilistic ecological risk assessment
A Bayesian Approach to probabilistic ecological risk assessmentA Bayesian Approach to probabilistic ecological risk assessment
A Bayesian Approach to probabilistic ecological risk assessment
 
なぜベイズ統計はリスク分析に向いているのか? その哲学上および実用上の理由
なぜベイズ統計はリスク分析に向いているのか? その哲学上および実用上の理由なぜベイズ統計はリスク分析に向いているのか? その哲学上および実用上の理由
なぜベイズ統計はリスク分析に向いているのか? その哲学上および実用上の理由
 

因果推論の奥へ: "What works" meets "why it works"