このページの翻訳:
  • ja

因果効果 causal effect

因果効果とは

  • 因果効果 causal effect は,潜在アウトカムモデル(Potential Outcome model)に基づいて定義される.
    • 曝露因子 $A$ に曝露した場合のアウトカム $Y^{a=1}$
    • 曝露因子 $A$ に曝露しなかった場合のアウトカム $Y^{a=0}$
  • 個人レベルで $Y^{a=1}$ と $Y^{a=0}$ を比較する(=個体レベルでの因果効果 ICE;Individual causal effect を調べる)ことは,タイムマシンでもない限り困難.
    • 現実世界においては $Y^{a=1}$ か $Y^{a=0}$かのどちらかしか観測されず,もう片方は必ず欠測になる1)
  • しかし一定の条件下で,集団の平均として「平均因果効果 ACE」を推定することはできる

平均因果効果 ACE

  • 平均因果効果 ACE;Average causal effect2) は以下のように定義される

$$ E\left[ Y^{a=1}\right] -E\left[ Y^{a=0}\right] $$

  • $E\left[ Y^{a=1}\right]$: 曝露因子 $A$ (たとえば投薬)があった場合のアウトカム $Y$ の期待値(集団平均)
  • $E\left[ Y^{a=0}\right]$: 曝露因子 $A$ (たとえば投薬)がなかった場合のアウトカム $Y$ の期待値(集団平均)

どう推定するか

  1. $E\left[ Y^{a=1}\right] -E\left[ Y^{a=0}\right]$ は〈因果効果〉を表す.
    • しかし反事実の世界(全員が $A$ に曝露した場合と全員が $A$ に曝露しなかった場合を比較したもの)であり,手元にある観察データからは原理上わからない.
  2. $E\left[ Y|A=1\right] -E\left[ Y|A=0\right]$ は〈統計的関連〉を表す.
    • これであれば,現実世界のデータそのもの(実際に曝露 $A$ を受けている人の平均とそうでない人の平均)であり算出可能.
  • 上記の 2. から 1. をうまく推定したいが,大抵の場合は背景因子が揃っていないこと(=交絡)が問題になる(健康意識の違い,医療アクセス,併存疾患,etc…)
  • いくつかの仮定をおく場合には,上の2つを近づけて考えることができる(=Identification)

Marginal Effect

  • 母集団の “全員” が因子 $A$ に曝露した ($A=1$) 場合と,“全員” が因子 $A$ に曝露しなかった場合 ($A=0$) の比較

$$ E\left[ Y^{a=1}\right] -E\left[ Y^{a=0}\right] $$

Conditional Effect

  • 母集団のうち “共変量 $L$ の層の中で” 全員が因子 $A$ に曝露した ($A=1$) 場合と,全員が因子 $A$ に曝露しなかった場合 ($A=0$) の比較 e.g. 女性のみ

$$ E\left[ Y^{a=1}|L\right] -E\left[ Y^{a=0}|L\right] $$

Marginal Effect ≠ Conditional Effect

  • 人種によって効果修飾 Effect Modification
    • たとえば教育効果で得られる恩恵が white > black であったり
    • 人種の分布が異なる母集団では Marginal Effect が変わる可能性がある

潜在アウトカムから条件付き期待値へ

求めたい条件付き Potential Outcome($L$ が同じ人たちにおける全体での潜在アウトカムの期待値)は $$ E\left[ Y^{a=1}|L\right]$$

ここで Conditional Exchangeability が仮に成立する($L$ が同じ人たちの中では曝露因子 $A$ はランダムになっていると捉える)とすると,

$$E\left[ Y^{a}|A=1,L\right] = E\left[ Y^{a}|A=0,L\right] $$

であるから,全体での期待値は治療を受けているの期待値とも同じになる.すなわち

$$ E\left[ Y^{a=1}|L\right] \Longrightarrow E\left[ Y^{a=1}|A=1,L\right] \cdots \ \left( 1\right) $$

と近似できる.さらに Consistency が成立するとき

$$ E\left[ Y^{a}|A=a\right] = E\left[ Y|A=a\right] $$

であるから,

$$ E\left[ Y^{a=1}|A=1,L\right] \Longrightarrow E\left[ Y|A=1,L\right] \cdots \ \left( 2\right) $$

1)
通称 “因果推論の根本的問題” Fundamental Problem of Causal Inference
2)
= ATE;Average Treatment Effect