統計的因果推論について、学生とかが「手元にどんなデータがあるか」に応じて使える手法を大雑把に判断するためのチートシートのようなものを作っているのですが、正直私自身もあまり理解してなくて、正確性を気にしていたらキリがないと思い、いったん現行版を掲載しておきます。
間違いに気づいたら随時修正します。無理やり一枚にまとめようとした感じなので、分類の切り口を含めて、もっといい整理法がありましたら教えてください。
まず、一番大雑把な表がこちらです。【オリジナル画質で見る場合はコチラ】

情報をいろいろ補ったものがこちらです。【オリジナル画質で見る場合はコチラ】

「こういうデータにはこの手法しか使えない」という意味ではないです。工夫すればいろいろなタイプのデータに適用可能な手法も多いので、あくまで「こういうデータを持っているときに、とりあえず検討してみるのはこの手法かな」と見当をつけるための早見表です。
上の段と下の段の分け方は、理論的にはあまりスッキリしてないとは思います。2SLSや固定効果モデルを、Rubin的な介入効果の分析にも使えるわけなので。
何というか、ぶっちゃけて言うと私が属している分野(都市計画周辺の工学)の空気感としては、
- 上の段は「最近耳にするようになった統計的因果推論の話題に、意識的についていこうとしないと、よく分からないままになる手法」
- 下の段は「伝統的な統計分析の教育を受けてふつうに生きていれば、どこかで触れることがありそうな手法」
という感じになりまして(笑)、理論的な正確さや明快さより、そういう日常的感覚みたいなもので分けておきたかったというのが大きいです。あまり統計分析の手法について突き詰めて考える人は多くない分野なので、私を含めて認識は雑だと思います。
ちなみに私自身、実際に回したことがあるのはSCM・DID・PSM・2SLS・GMMぐらいで、論文で使ったことあるのはたぶんSCM・GMMだけだなので、とても正確に理解してるとは言えません。自分が今後勉強するための、頭の整理という感じでもあります。
画像だけというのもイマイチなので、以下にテキストでも書いておきます。
Rubin型
処置=介入の概念が明確で、「反実仮想との差」を評価することを強く意識した手法です。最近流行りの「統計的因果推論」というと、これらをイメージすることが多いと思います。
| 処置群と対照群 | 時系列データ | 割当ルール | 反実仮想の構成方法 | 手法 |
| 別個体 | あり | ― | 並行トレンドを仮定し対照群との差を評価 | 差分の差分法(DID) |
| 別個体 | あり | ― | 対照群の加重平均や共変量との関係から合成反実仮想を構成 | 合成コントロール法(SCM) |
| 別個体 | なし | 明示的ルールなし | 1次元化した指標で個体同士をペア比較 | 傾向スコアマッチング(PSM) |
| 別個体 | なし | 明示的ルールなし | 交絡因子ごとに層別し比較後に統合 | 層別解析 |
| 別個体 | なし | 量的変数による閾値ルール | 閾値近傍の局所比較 | 回帰不連続デザイン(RDD) |
| 同一個体 | あり(前後のみ) | ― | 切片や傾きの変化を評価 | 中断(分割)時系列解析(ITSA) |
| 同一個体 | あり(前後のみ) | ― | ベイズ構造時系列で柔軟に反実仮想を構成 | Causal Impact |
構造推定型
伝統的な経済モデルとかで使われているもので、理論モデルを前提として、内生性を統制して構造パラメータの推定を行うものです。反実仮想を明示的には構成せず、介入の概念が明確でないケースも扱いますが、反実仮想との差を評価していると解釈することができるケースもあると思います。
| データ構造 | ラグ項の利用 | 推定アプローチ | 手法 |
| クロスセクションデータ(複数個体・1時点) | なし | 外生的な操作変数を用いる | 2段階最小二乗法(2SLS) |
| 1個体の時系列データ | あり | ラグ項を操作変数として利用 | ラグ項を用いた2段階最小二乗法 |
| パネルデータ(複数個体の時系列) | あり | ラグの外生性を仮定しGMM推定 | 動学的パネルデータ分析(GMM) |
| パネルデータ(複数個体の時系列) | なし | 個体固定効果により時間不変の未観測要因を除去 | 固定効果モデル |
各手法のイメージ
表に載せている各手法のイメージに関するメモも、テキストで書いておきます。
代表的な文献の引用は、AIにチェックさせたら「それはワーキングペーパー版であって、査読論文は年号がXXXXになる」という指摘が3つぐらいありましたが、面倒なのでそのままにしています。
| 手法 | 特徴・本質的ポイント | 代表例 |
| 差分の差分法(DID) | トレンドの平行性をチェックする手続きが本質的に重要(介入前に複数時点がないとチェックできない) | ニュージャージー州の最低賃金引き上げはファストフード店の雇用に影響を与えたか(Card & Krueger, 1993) |
| 合成コントロール法(SCM) | 万能ではないが反実仮想の構成の手法としては最もシステマティック | テロの発生はバスク地方の1人あたりGDPに影響を与えたか(Abadie & Gardeazabal, 2003) 阪神淡路大震災は兵庫県・神戸市の1人あたりGRP等に影響を与えたか(duPont & Noy, 2015) |
| 傾向スコアマッチング(PSM) | 比較対象の適切なマッチングによって交絡を統制する(確率的なモデリングを行う) | 失業者、受刑者、若者などへの就業支援のための試用プログラムの効果の再分析(Dehejia & Wahba, 1999) |
| 層別解析 | 比較対象の適切なマッチングによって交絡を統制する(記述統計的なグループ分けを行う) | 喫煙が肺がんの原因であることを主張(Cornfield et al., 1959) |
| 回帰不連続デザイン(RDD) | 閾値近傍の局所ランダム化の仮定により、PSMや層別解析より強力に因果を識別 | アメリカの高校卒業資格試験取得(試験の点数が強制変数)が市民的行動(投票参加や新聞購読)に与える影響(Dee, 2004) |
| 中断(分割)時系列解析(ITSA) | 伝統的な回帰モデルを用いて、トレンドや季節性を考慮し、介入前のデータの外挿を反実仮想とする | シチリア島での禁煙政策が急性冠動脈の発生に与えた効果(Bernal et al., 2017) |
| Causal Impact | ベイズ構造時系列モデルを用いることで、トレンド、季節性、共変量との関係から反実仮想を柔軟かつ不確実性を含めて構成 | オンライン広告がサイトのアクセス数に与える影響(Brodersen et al., 2015) |
| 2段階最小二乗法(2SLS) | 外生性を主張できるよう適切な操作変数を探す(操作変数の妥当性は理論依存) | 教育年数が収入に与える影響を推定するために、州ごとの義務教育年数と個人の生まれ月を操作変数とした(Angrist & Krueger, 1991) |
| ラグ項を用いた2段階最小二乗法 | 操作変数にラグ項を用いることも可能だがマイナー(ラグの活用はむしろ動学パネルの手法というイメージ) | 一応やっている研究者もいる程度 |
| 動学的パネルデータ分析(GMM) | ラグの外生性(強い仮定である点に注意)を利用し操作変数としてGMM推定量を求める | 企業の賃金水準、生産高、資本金が雇用数に与える影響(Arellano & Bond, 1990) |
| 固定効果モデル | 時間不変・個体不変の未観測交絡因子は考慮できるが同時性は統制できない | 社会的移動性が何に影響されるかを分析(アメリカの741地域×17年のパネルデータ)(Chetty et al., 2014) |
注記
表の下に言い訳のようにダラダラ書いてるメモもコピペしておきます。
- この表は、どんな性質のデータを持っているかを前提として、左から右にみていく想定で作ったもの。たとえばCausal Impactは、対照系列を用いて識別力を高めることもできるので、「同一個体の処置前後のデータしかない場合」以外にも使える。
- 一般的に統計的因果推論と呼ばれるのはRubin型のものだが、ここでは未観測の交絡因子(原因と結果の双方に影響する因子)や同時性等からくる内生性を統制する戦略、つまり原因変数の外生性を確保するための明示的な戦略を持った方法で構造パラメータを推定する手続きも因果推論とみなした(行動モデルや経済モデルなどで、介入の概念が明確でないケースでも因果の議論が可能という利点がある)。
- 単にOLS回帰(に基づくSEM、ケインズ型マクロモデル、一般均衡モデル等)で効果を求めるだけだと、観測可能な共変量についてしか統制できないので、理論依存が強く、因果関係を主張できる度合いは、識別のための仮定を吟味するこれらの手法より劣る。(計算の手続き自体はDIDもOLSの一種ではある。問題は、因果の識別のための条件を意識しているかどうか。)
- Rubin型のうち、PSMと層別解析、ITSAとCausal Impactは、観測された交絡しか統制できない(Causal Impactは共変量の工夫で一部統制可能)が、反実仮想を構成する明示的な枠組みを持ち、その妥当性を確認する手続きがあることが、単なるOLS回帰にない利点だと言える。
- 因果の識別(モデルの識別とは別概念なので注意)能力は結局程度の問題で、どれも完璧ではなく、一概にどの手法が優れているとは言えない。
- 構造推定型は、反実仮想との対照を明示的には行わず、「理論を信じてパラメータを推定」という感じだが、2SLSで適切な操作変数が存在するケースでは、強力に因果を識別できるといえる。操作変数法は、潜在アウトカムとの比較として定式化すれば、介入効果(局所平均処置効果)を見ていることになる。
- 構造推定と言っても、ケインズ型の同時方程式モデルでは内生性の統制が中心課題だが、CGEやDSGEにおいては原因の外生性は理論的に仮定する場合が多く、内生性の統制はあまり問題にしないらしい。
- 2SLSやGMMは操作変数(GMMのラグ操作変数はかなり強い仮定だが)を使って原因変数の外生性を確保するのに対し、固定効果モデルにはそれがないのだが、時間不変・個体不変の未観測の交絡因子を統制するのも立派な因果識別戦略だと思う。
(参考:このブログのおすすめ記事一覧はコチラ)