Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
Submit search
EN
Uploaded by
Koichiro Gibo
PDF, PPTX
7,418 views
Rubinの論文(の行間)を読んでみる-傾向スコアの理論-
有名な1983年のRubin&Rosenbaumの論文をナナメ読みしていきます
Science
◦
Read more
14
Save
Share
Embed
Embed presentation
Download
Download as PDF, PPTX
1
/ 26
2
/ 26
3
/ 26
4
/ 26
5
/ 26
6
/ 26
7
/ 26
8
/ 26
9
/ 26
10
/ 26
11
/ 26
12
/ 26
13
/ 26
14
/ 26
15
/ 26
16
/ 26
17
/ 26
18
/ 26
Most read
19
/ 26
20
/ 26
Most read
21
/ 26
Most read
22
/ 26
23
/ 26
24
/ 26
25
/ 26
26
/ 26
More Related Content
PDF
星野「調査観察データの統計科学」第3章
by
Shuyo Nakatani
PPTX
GEE(一般化推定方程式)の理論
by
Koichiro Gibo
PDF
効果測定入門 Rによる傾向スコア解析
by
aa_aa_aa
PDF
傾向スコア:その概念とRによる実装
by
takehikoihayashi
PDF
傾向スコアの概念とその実践
by
Yasuyuki Okumura
PDF
なぜベイズ統計はリスク分析に向いているのか? その哲学上および実用上の理由
by
takehikoihayashi
PDF
相関と因果について考える:統計的因果推論、その(不)可能性の中心
by
takehikoihayashi
PPTX
ベイズファクターとモデル選択
by
kazutantan
星野「調査観察データの統計科学」第3章
by
Shuyo Nakatani
GEE(一般化推定方程式)の理論
by
Koichiro Gibo
効果測定入門 Rによる傾向スコア解析
by
aa_aa_aa
傾向スコア:その概念とRによる実装
by
takehikoihayashi
傾向スコアの概念とその実践
by
Yasuyuki Okumura
なぜベイズ統計はリスク分析に向いているのか? その哲学上および実用上の理由
by
takehikoihayashi
相関と因果について考える:統計的因果推論、その(不)可能性の中心
by
takehikoihayashi
ベイズファクターとモデル選択
by
kazutantan
What's hot
PDF
第4回DARM勉強会 (構造方程式モデリング)
by
Yoshitake Takebayashi
PPTX
社会心理学者のための時系列分析入門_小森
by
Masashi Komori
PDF
関数データ解析の概要とその方法
by
Hidetoshi Matsui
PDF
因果探索: 基本から最近の発展までを概説
by
Shiga University, RIKEN
PDF
統計的因果推論 勉強用 isseing333
by
Issei Kurahashi
PPT
ロジスティック回帰分析の入門 -予測モデル構築-
by
Koichiro Gibo
PPTX
ようやく分かった!最尤推定とベイズ推定
by
Akira Masuda
PDF
因果推論の奥へ: "What works" meets "why it works"
by
takehikoihayashi
PDF
一般化線形モデル (GLM) & 一般化加法モデル(GAM)
by
Deep Learning Lab(ディープラーニング・ラボ)
PDF
[DL輪読会]Shaping Belief States with Generative Environment Models for RL
by
Deep Learning JP
PPTX
Dimensionality reduction with t-SNE(Rtsne) and UMAP(uwot) using R packages.
by
Satoshi Kato
PPTX
統計的因果推論からCausalMLまで走り抜けるスライド
by
fusha
PDF
時系列解析の使い方 - TokyoWebMining #17
by
horihorio
PDF
「生態学における統計的因果推論」という大ネタへの挑戦:その理論的背景と適用事例
by
takehikoihayashi
PDF
正準相関分析
by
Akisato Kimura
PDF
質的変数の相関・因子分析
by
Mitsuo Shimohata
PPTX
Rによるベイジアンネットワーク入門
by
Okamoto Laboratory, The University of Electro-Communications
PDF
EMアルゴリズム
by
Sotetsu KOYAMADA(小山田創哲)
PDF
2 6.ゼロ切断・過剰モデル
by
logics-of-blue
PDF
数式を使わずイメージで理解するEMアルゴリズム
by
裕樹 奥田
第4回DARM勉強会 (構造方程式モデリング)
by
Yoshitake Takebayashi
社会心理学者のための時系列分析入門_小森
by
Masashi Komori
関数データ解析の概要とその方法
by
Hidetoshi Matsui
因果探索: 基本から最近の発展までを概説
by
Shiga University, RIKEN
統計的因果推論 勉強用 isseing333
by
Issei Kurahashi
ロジスティック回帰分析の入門 -予測モデル構築-
by
Koichiro Gibo
ようやく分かった!最尤推定とベイズ推定
by
Akira Masuda
因果推論の奥へ: "What works" meets "why it works"
by
takehikoihayashi
一般化線形モデル (GLM) & 一般化加法モデル(GAM)
by
Deep Learning Lab(ディープラーニング・ラボ)
[DL輪読会]Shaping Belief States with Generative Environment Models for RL
by
Deep Learning JP
Dimensionality reduction with t-SNE(Rtsne) and UMAP(uwot) using R packages.
by
Satoshi Kato
統計的因果推論からCausalMLまで走り抜けるスライド
by
fusha
時系列解析の使い方 - TokyoWebMining #17
by
horihorio
「生態学における統計的因果推論」という大ネタへの挑戦:その理論的背景と適用事例
by
takehikoihayashi
正準相関分析
by
Akisato Kimura
質的変数の相関・因子分析
by
Mitsuo Shimohata
Rによるベイジアンネットワーク入門
by
Okamoto Laboratory, The University of Electro-Communications
EMアルゴリズム
by
Sotetsu KOYAMADA(小山田創哲)
2 6.ゼロ切断・過剰モデル
by
logics-of-blue
数式を使わずイメージで理解するEMアルゴリズム
by
裕樹 奥田
Similar to Rubinの論文(の行間)を読んでみる-傾向スコアの理論-
PDF
統計的因果推論への招待 -因果構造探索を中心に-
by
Shiga University, RIKEN
PDF
R Study Tokyo03
by
Yohei Sato
PDF
星野「調査観察データの統計科学」第1&2章
by
Shuyo Nakatani
PDF
構造方程式モデルによる因果探索と非ガウス性
by
Shiga University, RIKEN
PDF
統計学における相関分析と仮説検定の基本的な考え方とその実践
by
id774
PDF
実験計画法入門 Part 1
by
haji mizu
PPTX
Tokyo r #37 Rubin's Rule
by
Hiroki Matsui
PPTX
Risk based portfolio with large dynamic covariance matrices
by
Kei Nakagawa
PDF
第8章 ガウス過程回帰による異常検知
by
Chika Inoshita
PDF
一般化線形混合モデル isseing333
by
Issei Kurahashi
PDF
傾向スコアでみる ソーシャルネットワーク分析
by
Hiroko Onari
PPTX
生物系研究者のための統計講座
by
RIKEN, Medical Sciences Innovation Hub Program (MIH)
PDF
20140727_第1回スポーツデータアナリティクス基礎講座
by
Tomoshige Nakamura
PDF
NL20161222invited
by
Tetsuya Sakai
PDF
統計的因果推論の理論と実践10章.pdf
by
YasutoTerasawa
PDF
第3回スキル養成講座 講義スライド
by
keiodig
PDF
IR集中講習会 20180130
by
Shintaro TAJIRI
PPTX
An introduction to statistical learning 4 logistic regression manu
by
Hideyuki Takahashi
PDF
ma99992010id512
by
matsushimalab
PDF
Nonparametric Factor Analysis with Beta Process Priors の式解説
by
Tomonari Masada
統計的因果推論への招待 -因果構造探索を中心に-
by
Shiga University, RIKEN
R Study Tokyo03
by
Yohei Sato
星野「調査観察データの統計科学」第1&2章
by
Shuyo Nakatani
構造方程式モデルによる因果探索と非ガウス性
by
Shiga University, RIKEN
統計学における相関分析と仮説検定の基本的な考え方とその実践
by
id774
実験計画法入門 Part 1
by
haji mizu
Tokyo r #37 Rubin's Rule
by
Hiroki Matsui
Risk based portfolio with large dynamic covariance matrices
by
Kei Nakagawa
第8章 ガウス過程回帰による異常検知
by
Chika Inoshita
一般化線形混合モデル isseing333
by
Issei Kurahashi
傾向スコアでみる ソーシャルネットワーク分析
by
Hiroko Onari
生物系研究者のための統計講座
by
RIKEN, Medical Sciences Innovation Hub Program (MIH)
20140727_第1回スポーツデータアナリティクス基礎講座
by
Tomoshige Nakamura
NL20161222invited
by
Tetsuya Sakai
統計的因果推論の理論と実践10章.pdf
by
YasutoTerasawa
第3回スキル養成講座 講義スライド
by
keiodig
IR集中講習会 20180130
by
Shintaro TAJIRI
An introduction to statistical learning 4 logistic regression manu
by
Hideyuki Takahashi
ma99992010id512
by
matsushimalab
Nonparametric Factor Analysis with Beta Process Priors の式解説
by
Tomonari Masada
More from Koichiro Gibo
PPTX
マルコフ連鎖モンテカルロ法と多重代入法
by
Koichiro Gibo
PDF
生存時間分析数理の基礎
by
Koichiro Gibo
PPTX
分割時系列解析(ITS)の入門
by
Koichiro Gibo
PDF
多重代入法の書き方 公開用
by
Koichiro Gibo
PPTX
データベース時代の疫学研究デザイン
by
Koichiro Gibo
PDF
Covid19対策本部の作り方と走らせ方公開用
by
Koichiro Gibo
マルコフ連鎖モンテカルロ法と多重代入法
by
Koichiro Gibo
生存時間分析数理の基礎
by
Koichiro Gibo
分割時系列解析(ITS)の入門
by
Koichiro Gibo
多重代入法の書き方 公開用
by
Koichiro Gibo
データベース時代の疫学研究デザイン
by
Koichiro Gibo
Covid19対策本部の作り方と走らせ方公開用
by
Koichiro Gibo
Rubinの論文(の行間)を読んでみる-傾向スコアの理論-
1.
Rubinの論文 (の行間)を読んでみる 傾向スコア解析の理論 2015/06/15 学生セミナー バイオ統計センターM1 宜保光一郎
2.
http://faculty.smu.edu/Millimet/classes/eco7377/papers/rosenbaum%20rubin%2083a.pdf http://www. stat.harvard .edu/DonRu bin70/
3.
Introduction • 1983年の論文を意訳していきます • 重要な「large
sampleで傾向スコアがなぜ機能 するか」の証明まで。 • 証明は元論文ではわかりにくいので、前述した2 015年出版の書籍での証明をさらに噛み砕くこ とを狙う(一部?のところはあるが..) • 条件付き期待値のもろもろの定理を駆使して証 明していくので、以下のURLなどを参照。 • http://math.arizona.edu/~tgk/464_07/cond_exp.pdf • 実践的な話はナシです。
4.
Notation • i: ユニットの番号 •
r: アウトカム • z: 割り付けの指標。z={1,0} • r1i: 1の割り付けをされたユニットiの周辺アウト カム→後述 • xi: ユニットiの観察された共変量(ベクトル)
5.
Causal Inference • ある割り付けをされたとき(e.g.
treatment V.S . control)に、その割り付けによる効果について の推定をしたい • その効果を因果効果(causal effect)とよぶ。 • 効果の推定を以下の式で表すときに • これをAverage treatment effect(ATE) と呼ぶ E(r1)−E(r0)
6.
Motivation • ATEはRCTにおいては直接測定できる。 • なぜなら、割り付けはランダムに行われおり、 両群の背景は同一と考えられるから。 •
(後述するが、割り付けはランダムなので、アウ トカムと独立しているから) • しかし、非RCTにおいてはATEを直接推定する ことは困難。 • なぜか? E(r1∣z=1)−E(r0∣z=0)
7.
Motivation • ATEはRCTにおいては直接測定できる。 • なぜなら、割り付けはランダムに行われおり、 両群の背景は同一と考えられるから。 •
(後述するが、割り付けはランダムなので、アウ トカムと独立しているから) • しかし、非RCTにおいてはATEを直接推定する ことは困難。 • なぜか? E(r1∣z=1)−E(r0∣z=0)
8.
Rubin’s potential outcome E[r1 |
z=1] i=1 2 3 4 5 6 7 8 1 2 3 4 5 6 7 8 ATE E[r0 | z=0]
9.
Rubin’s potential outcome E[r1 |
z=1] i=1 2 3 4 5 6 7 8 1 2 3 4 5 6 7 8 ATE E[ r0 | z=1 ] E[ r1 | z=0 ] E[r0 | z=0]
10.
Rubin’s potential outcome z=1
z=0 E[ r1 ] E[ r1 | z=1 ] E[ r1 | z=0 ] E[ r0 ] E[ r0 | z=1 ] E[ r0 | z=0 ]
11.
Rubin’s potential outcome z=1
z=0 E[ r1 ] E[ r1 | z=1 ] E[ r1 | z=0 ] E[ r0 ] E[ r0 | z=1 ] E[ r0 | z=0 ] この周辺和の差がATE 現実では欠測している(反事実)
12.
Rubin’s potential outcome z=1
z=0 E[ r1 ] E[ r1 | z=1 ] E[ r1 | z=0 ] E[ r0 ] E[ r0 | z=1 ] E[ r0 | z=0 ] この周辺和の差がATE 現実では欠測している(反事実) 現実はこの両者しか直接推定で きない(因果推論の根本問題)
13.
RCT z=1 z=0 E[ r1
] E[ r1 | z=1 ] E[ r0 ] E[ r0 | z=0 ] ランダム割り付け = = (r1 ,r0)⊥z
14.
Strongly ignorable treatment
assignment z=1 z=0 E[ r1 ] E[ r1 | z=1 ] E[ r0 ] E[ r0 | z=0 ] (観測された)共変量 x (r1 ,r0)⊥z∣x 目標はこれを利用することだが 、xはベクトルなので使いづらい。 よってxを簡易にしたものを探 すことにする
15.
Strongly ignorable treatment
assignment • 観測された共変量xで条件づけると、アウトカム と割り付けの確率は独立になる=RCTのように 比較ができるという、仮定 • かなり強い仮定のように思えるが、この仮定が 傾向スコア解析の肝 • この仮定が本当に成り立っているかは、非常に 重要なのだが直接確かめる方法は存在しないた め、間接的な確認を行う。
16.
Balancing score • 定義:バランシングスコアb(x)とは、共変量xか ら成る関数で、それで条件付けると割り付けzと 共変量xが独立になるようなものである •
条件つき独立の性質からb(x)=xとなり得るのは 自明である • 一番関心があるのはb(x)がスカラーとなる場合 →これが後の傾向スコアとなる z ⊥ x∣b(x)
17.
Propensity score • 定義:傾向スコアe(x)は共変量xから成る関 数で、z=1に割り付けされる確率である。 •
(前述のバランシングスコアとの関係は定義 上では明らかでないことに注意) • i={1,2,..,n}の同時確率は、独立なベルヌー イ分布を考え、次のように表すことができる e(x)= pr(z=1∣x) Pr(z1 ,..., zn∣x1 ,..., xn)=∏ n e(xi) xi [1−e(xi)] 1−xi
18.
定理 • これからいくつかの定理を証明する。示したい ことは • 1.
傾向スコアはバランシングスコアである • 2. 全てのバランシングスコアに適当な関数をと れば、傾向スコアと等しくなる(最も”粗い”もの が傾向スコア) • 3. もし、共変量xのもとでstorngly ignorableで あれば、バランシングスコアで条件付けてもそ うである
19.
Theorem 1 • を証明できれば、z
⊥x∣e(x) Pr(z=1∣x ,e(x))=E(z∣x ,e(x)) =E(z∣x) =e(x) Pr(z=1∣e(x))=E(z∣e(x)) =E[E(z∣x ,e(x))∣e(x)] =E[e(x)∣e(x)] =e(x) Pr(z=1∣x ,e(x))=Pr(z=1∣e(x))⇔ z⊥x∣e(x)∴ ∵ Definition of Conditional Independence E[ A∣B , g (B)]=E[A∣B]∵ E[E(A∣B ,C)∣B]=E[A∣B]∵ E[g (A)∣A]=g (A) e(x)⊆b(x)
20.
Theorem 2 バランシングスコアの定義からe(x)=f{b(x)}であることを 背理法で証明する。 全てのb(x)に対しe(x)≠f{b(x)}とすると、e(x1)≠e(x2)かつ b(x1)=b(x2)となる2つの異なるx1, x2が存在する。よって、 e(x1)=E(z∣x1)=E(z∣b(x1),
x1)=E(z∣b(x1))=E(z∣b(x2))=E(z∣x2) E[ A∣B , g (B)]=E[A∣B] Definition of balancing score e(x1)=e(x2)となり矛盾。ゆえに、バランシングスコアが定義され れば、e(x)=f{b(x)}が言える。(逆も言える。証明可能。)
21.
Theorem 3 • 目標は •
同様に、b(x)をe(x)としても成り立つ。 E[E(A∣B ,C)∣B]=E[A∣B] Strongly ignorable treatment assignment Definition of balancing score Tower property of conditional expectation (r1 ,r0)⊥ z∣b(x) Pr(z=1∣r1 ,r0 ,b(x))=E[z∣r1 ,r0 ,b(x)] =E[E(z∣r1 , r0 , x ,b(x))∣r1 ,r0 ,b(x)] =E[E(z∣x ,b(x))∣r1 ,r0 ,b(x)] =E[E(z∣b(x))∣r1 ,r0 ,b(x)] =E(z∣b(x)) =Pr(z=1∣b(x))
22.
z=1 z=0 E[ r1
] E[ r1 | z=1 ] E[ r0 ] E[ r0 | z=0 ] バランシングスコアb(x) E[r1 | z=1, b(x)] E[r0 | z=0, b(x)]
23.
Theorem 4 E(r1∣z=1,b(x))−E(r0∣z=0,b(x)) =E(r1∣b(x))−E(r0∣b(x)) =E(r1−r0∣b(x)) Theorem 3 さらに期待値をとると、 E[E(r1−r0∣b(x))]=E(r1−r0)
Law of iterative expectations よって、E(r1 -r0 |b(x))を推定量と考えると E(r1 -r0 )=ATEの不偏推定量となる (ちなみに条件付き確率の期待値は確率変数)
24.
Summary •バランシングスコア(傾向スコアはその一 部)で条件付けると、割り付けz=1,0の両群の アウトカムの平均値の差は、ATEの不偏推定量 となる。つまりATEの推定が可能となる。 •バランシングスコアの中でも傾向スコアは 最も粗く、1次元のスカラーなので、今後はこ の傾向スコアを使用する
25.
傾向スコアによる条件付け ① マッチング ② 層別化 ③
傾向スコアを共変量としての回帰モデル調 整 ④ 傾向スコアによる重み付け推定法(IPW法) それぞれに長所と短所がある。 ここまでで、とりあえず終了
26.
Remarks •論文はこの後”small sample theory”,”some applications”と続いていく •“strongly
ignorable assumption”は最近は ”unconfoundness”と記述されることも多い •実践的な適応については多くの資料が出回 っているので今回はパス
Download