Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

TokyoR 20180421

459 views

Published on

TokyoRでのLT資料

Published in: Data & Analytics
  • Be the first to comment

  • Be the first to like this

TokyoR 20180421

  1. 1. 御近所圧力効果の推定 2018/04/21 Tokyo.R @housecat442
  2. 2. スライドの内容に関して ● American Economic Association Annual Meeting 2018でSusan AtheyとGuido Imbensが行ったtutorialを参照としています。 ● 利用したデータとコードの大部分はこちらが本元です。 ● 機械学習を利用した平均的な因果効果の推定方法の紹介が目的です。
  3. 3. Social Pressureの影響を知りたい とある投票日の行動選択 ● 投票に行っても良いし ● 野球に行っても良い ● 以下の要因から行動を決定していると考える ○ 個人の投票結果から得られる利得 ○ 外的なプレッシャー
  4. 4. Social Pressureの影響を知りたい とある投票日の行動選択 ● 何もしなければ野球する人が居る ● アクションを取った場合には投票するかも 圧力を加える 御近所の投票参加履歴を送る 「介入する/しない」どちらかしか観測できない
  5. 5. Social Pressureの影響を知りたい who treatment outcome ● ランダムに人を選んで圧力を与えた場合 ○ A/Bテスト, RCTの状況 ○ 圧力の有無の平均差が圧力の効果になる。 ● 何かしらのルールを持って圧力をかける人を選んだ場合 ○ 単純に平均差を取ると、ルールによる差が含まれる。 ○ 「圧力の効果+ルールによる差」を得てしまう →この状況でどうするか?という話
  6. 6. データについて ● オリジナルのデータ はRCTのデータ ○ 履歴はランダムに選んだ人に与えている ○ このデータからATEが解っている状態 ● このデータに手を加えて sampling biasを作り出す ○ treatment群は投票行きそうな人を減らす ○ control群は投票行かなそうな人を減らす →投票しなさそうな人に履歴を送るというシナリオ control treatment control treatment ATE_RCT ATE_est 比 較 miss
  7. 7. 平均比較 ● 全データでの W=1 と W=0 の平均の比較が履歴(圧力)Wの効果。 →効果の値が0と有意差があるかを検定する必要がある。 W=1の時のYの平均 W=0の時のYの平均 W=0の数 W=1の数 W=0の時のYの分散 W=1の時のYの分散
  8. 8. 平均比較 ● 縦軸がATE推定値 ● oracle = データを削る前の結果 ● naive = データを削ったあとの結果 oracleが一番正しい値なので、 naivenの結果は散々な事が分かる。 →sampling biasのあるデータで集計で意思決定 するのはいくらかリスクがある。
  9. 9. 重回帰 ● 重回帰で推定 ● 関係性しそうな変数を突っ込んでWの係数を見る。 ○ 過去の投票履歴とか ○ 性別・年齢・収入・人種 etc... ● 検定はβ_1の標準誤差を見れば良い
  10. 10. 重回帰の結果を追加 ● 重回帰による推定 ● 青は大分oracleに近い事が分かる。 ● 投入した変数Xの効果がちゃんとコントロー ルされていると考えられる。
  11. 11. single-equation LASSO ● 圧力のパラメーター以外に正則化を使う ● 変数の選択を正則化に任せるという設計 ● Wの係数がATEを表す
  12. 12. Single Equation Lasso ● seの出し方が不明だったので省略 ● Direct Methodよりも悪そう ● 全部正則化させたUsual LASSOも表示 ● 正則化によるバイアスの影響を受けている のが分かる。
  13. 13. Belloni-Chernozhukov-Hansen(2013) 1. Wを予測する為のLASSO Logistic Regressionを解く 2. 1で係数が0にならなかった特徴量だけ取り出す 3. 2で選択した特徴量と WでYを説明するOLSを解く 4. Wの係数を解釈する ● 変数選択を自分でしなくてよい。 ● ドメイン知識が変数の選択に対して無力な時に良いとされる ● k>nでも使える
  14. 14. Belloni et.alの結果 ● 推定値もoracleに近いし、seも良い感じ。 ● 変数選択を挟んでいる分 Direct methodよりも改 善している。 めでたしめでたし?
  15. 15. まとめ ● 御近所圧力で投票率が8%上がってた ● LASSOで変数選択をして、OLSというBelloni et.alの方法がよかった。 ● データの特長によって、別の方法の方が良いことは大いにある。 ● とりあえず集計だけで判断せず重回帰か傾向スコアで良いので使おう。
  16. 16. Enjoy!

×