分位点処置効果推定と
qteパッケージの紹介
自己紹介
● Yusuke Kaneko
● 新卒1年目
● 東大経研統計コース → サイバーエージェント
● twitter:@coldstart_p
● github:https://github.com/ykaneko1992
● 趣味 : kaggle(半年前から始めた)
○ santander 12 / 4484(Gold)
○ Home credit 145 / 7198(silver)
○ plasticcコンペ参加中(今は16/867)
kaggleのアイコン
今日の話
職業訓練が賃金不平等に効果はあるのか?
という問題を分位点処置効果(QTE)推定で
明らかにする話
スライドの内容について
● 内容は主に以下の論文を参照しています
○ LaLonde, Robert J. "Evaluating the econometric evaluations of training programs with experimental data." The American
economic review (1986): 604-620.: データについて
○ Callaway, Brantly M. "Quantile Treatment Effects in R: The QTE Package." (2015). : qteパッケージについて
○ Firpo, Sergio. "Efficient semiparametric estimation of quantile treatment effects." Econometrica 75.1 (2007): 259-276.: 推定
手法について
● QTEの推論手法とそのための Rパッケージの紹介が目的です
RCT & ATE
● 職業訓練をランダムに割り当てて賃金への効果を見るという実験を考える ( = RCT)
● 職業訓練の効果の測り方として一般的なのは平均的な処置の効果を考えるというもの
○ つまり,受けたグループの平均賃金と受けなかったグループの平均賃金の差を取る
○ このような職業訓練などの処置の平均的な効果を平均処置効果 (ATE)と呼ぶ
job training
賃金
賃金
差 = 効果ランダムに
割当
ATE is best?
● 職業訓練の効果は当然受けた人によって異なる
● 問題は,元から優秀な人にのみ効果がある 場合
○ 職業訓練は平均的に賃金を押し上げることが期待される政策
○ 訓練の効果が著しくバラつく場合,職業訓練が格差を増大させることになる
○ しかし,平均効果だけ見てもそのバラツキは分からない
● このようなバラツキを上手く掴める処置効果の測り方はないのか ?
↑ 0円 ↑ 100万円 ↑ 2000万円
↑700万
↑100万
600万 = ATE
↑ 0円 ↑ 0円 ↑ 300万円
受ける(T = 1)
受けない
(T = 0)
QTE
● 職業訓練を受けたグループとそうでないグループの賃金の分布には差があるはず
○ 両者の分布の同じ分位点同士の差を取るのが Quantile Treatment Effect(QTE)
● 注意したいのはQTEは個々人の処置効果を表したものではないということ
○ 分布の差なので,どれだけ分布の下 or 上を押し上げたかを図るもの
賃金
密度
QTE
● 職業訓練は実はランダムアサインの仮定は (おそらく)満たしていない
○ 割り当てられても拒否をする人がいる
○ 拒否がランダムなら良いが,元からやる気のない人間が拒否していると考えるのが妥当
○ よってこれを考慮しないと QTEはより強く処置効果があるようなバイアスを受ける
● これを考慮するために 共変量を条件付けた時に 処置はランダムに割り当てられると仮定
○ Firpo(2007)のPropensity Scoreを用いたアプローチで正しく QTEを推定可能
○ 反実分布を直接求める手法もあるが今回は触れない (Counterfactual Package)
ランダムに
割当
拒否
T = 1
T = 0
T = 0
qte package
● 今回はqteパッケージを用いる(CRANからインストール可能 )
○ Firpo(2007)の傾向スコアを用いたアプローチでの QTE推定が実装
○ 他にもDID推定やDIDにおけるqteの推定関数などが実装されている
○ 職業訓練のデータセットが lalondeデータセットとして入っている
Lalonde Dataset
● National Supported Work Program(NSW)という70年代に実施された職業訓練データを用いる
○ 黒人や中退者を対象とした 9 ~ 18ヶ月の職業訓練プログラム
○ RCTが実施された
○ 被説明変数は1978年時点での賃金
○ 共変量は人種,年齢,既婚かなど
QTE estimation
● ci.qte関数で推定可能
● xformulaで共変量を追加可能
● 分位点の区切り方は probsで指定可能
● (今回は指定していないが )coresで使用コア数も指定可能
● ATEも推定可能
QTE estimation
● 下2割については殆ど押し上げがない
● 中央値の押上が約1060ドルという推定
● 特に上位約10%に強い押し上げ効果が
働いた
● 優秀な人はより優秀に,ダメな人には意味
はないという解釈が可能
QTE estimation
● plot関数で推定を可視化したもの
● 右上がりの傾向が分かる
QTET
● 処置を受けた人の「処置を受けた場合と受けなかった場合の差」を推定することも可能
○ Quantile Treatment Effect on Treated(QTET)と呼ばれる
● これも共変量による条件付をする
T = 0
T = 1
観測不可能
QTET Estimation
● ci.qtet関数で推定可能
● あとはci.qte関数とだいたい同じ
QTET Estimation
● 傾向自体はqte推定のときと変わらない
● ATEはci.qteの時より大幅に低い
QTET Estimation
● やはり右上がりの傾向が分かる
まとめ
● QTEによる職業効果推定を紹介
● 下位層には職業訓練の賃金押し上げ効果がほぼないという結果
○ むしろ貧富差を拡大させているような傾向がある
○ 類似研究として補習の成績への効果などもあるが同様の傾向
● 大事なのは施策がなんのためのものか ,というのを意識して効果分析を行うこと
● qteパッケージを紹介
● counterfactual packageの紹介が次はしたい ...(できれば)

JapanR 2018(分位点処置効果とその推定のためのR package"qte"の解説)