計量経済学の知見をより深めるべく
を基に因果推論と計量経済学を学んでいく。
- 1. 因果推定とは
- 2. 選択バイアスを認識する重要性
- 3. 回帰分析を用いた効果測定方法
- 4. 傾向スコアを用いた効果測定方法(1)
- 5. 傾向スコアを用いた効果測定方法(2)
- 6. 傾向スコアを用いた効果測定方法(3)
- 7. DID,CausalImpactを用いた効果測定方法
- 8. 回帰不連続デザインによる効果測定方法
1. 因果推定とは
- 以降では「どのようにすればバイアスを除いたフェアな比較ができ、因果関係を示す正しい効果を得ることができるか」を学んでいく。
- 何らかのアクションが目標値に与えた影響を効果と呼ぶ。このアクションを介入もしくは処置という。
- 「データから得られた分析結果と真の効果との乖離」をバイアスと呼ぶ。更に「比較している集団の潜在的な傾向が相違することで生じるバイアス」を選択バイアスという。
- 「効果を知りたい施策をランダムに割り振り、その結果として得られたデータを分析して比較すること」を無作為化比較試験(RCT)といい、介入が行われるサンプルと行われなかったサンプルにおけるその他の要因も平均的には同一になることが期待できる。
- ポテンシャルアウトカムフレームワークの下で介入の効果はと平均処置効果(ATE)で考える。
2. 選択バイアスを認識する重要性
- 介入効果の有無は統計的仮説検定で検知し得る。しかし選択バイアスがあればその精度を歪めることになるため、安易な利用は厳に慎むべきである。
- を行うにはコストが高すぎるため、可能な限りその場合の結果を近似する計量経済学および因果推定論の知見を活用することになる。
3. 回帰分析を用いた効果測定方法
4. 傾向スコアを用いた効果測定方法(1)
- 目的変数がどのような仕組みで決定されているかについて不充分な情報しか得られない場合、傾向スコアを用いた分析が有用である
- 傾向スコアは介入が割り振られる確率である
- 傾向スコアを用いた分析方法として、①得た傾向スコアを利用して標本同士をマッチングさせる傾向スコアマッチング、②傾向スコアを標本の重みとして利用する逆確率重み付き推定などがある
- 傾向スコアマッチングと逆確率重み付き推定、回帰分析とでは推定対象が相違するから、推定結果が相違する点に注意が必要である
5. 傾向スコアを用いた効果測定方法(2)
- 機械学習を用いて施策を行うべき対象を選んだ場合、そもそも施策に対してより強く影響を受けやすい(選択バイアスが発生する)対象を選定しており、推定結果がゆがむ可能性がある。
6. 傾向スコアを用いた効果測定方法(3)
- のデータを用いて実証分析を行った。
- 分析方法次第で結果は大きく変化し得る。データセット自体およびその生成過程が分かっていない限り、そのモデルの結果がより信頼性の高いものなのかを判断することは非常に困難である。そのため、そうしたものに興味を払うことが絶対的に必要である。
7. DID,CausalImpactを用いた効果測定方法
- 差分の差分法()とは非介入グループのデータ変化と介入グループが仮に介入を受けなかった場合の変化が一致するという「平行トレンド仮定」を前提として介入前後の差分を介入されたグループと介入されなかったグループとでそれぞれ算出し、さらにそれらのグループで差を取るという2つの差分を取ることで選択バイアスを勘案する。
- はの欠点を補うべく、さまざまな種類の変数を利用して目的変数を上手く予想できるようなモデルを介入が行われる前の期間のみで作成する。
8. 回帰不連続デザインによる効果測定方法
- ルールで介入が割り振られる場合、介入発生の有無はのみに依存することになる。変数のように介入を決定する変数を割当変数 (running variable; forcing variable)という。介入の決定に用いる閾値をカットオフという。
- 介入が明確なルールによって決まっている状況での分析手法が回帰不連続デザインである。