因果効果 causal effect
因果効果とは
- 因果効果 causal effect は,潜在アウトカムモデル(Potential Outcome model)に基づいて定義される.
- 曝露因子 $A$ に曝露した場合のアウトカム $Y^{a=1}$
- 曝露因子 $A$ に曝露しなかった場合のアウトカム $Y^{a=0}$
- 個人レベルで $Y^{a=1}$ と $Y^{a=0}$ を比較する(=個体レベルでの因果効果 ICE;Individual causal effect を調べる)ことは,タイムマシンでもない限り困難.
- 現実世界においては $Y^{a=1}$ か $Y^{a=0}$かのどちらかしか観測されず,もう片方は必ず欠測になる1)
- しかし一定の条件下で,集団の平均として「平均因果効果 ACE」を推定することはできる
平均因果効果 ACE
- 平均因果効果 ACE;Average causal effect2) は以下のように定義される
$$ E\left[ Y^{a=1}\right] -E\left[ Y^{a=0}\right] $$
- $E\left[ Y^{a=1}\right]$: 曝露因子 $A$ (たとえば投薬)があった場合のアウトカム $Y$ の期待値(集団平均)
- $E\left[ Y^{a=0}\right]$: 曝露因子 $A$ (たとえば投薬)がなかった場合のアウトカム $Y$ の期待値(集団平均)
どう推定するか
- $E\left[ Y^{a=1}\right] -E\left[ Y^{a=0}\right]$ は〈因果効果〉を表す.
- しかし反事実の世界(全員が $A$ に曝露した場合と全員が $A$ に曝露しなかった場合を比較したもの)であり,手元にある観察データからは原理上わからない.
- $E\left[ Y|A=1\right] -E\left[ Y|A=0\right]$ は〈統計的関連〉を表す.
- これであれば,現実世界のデータそのもの(実際に曝露 $A$ を受けている人の平均とそうでない人の平均)であり算出可能.
- 上記の 2. から 1. をうまく推定したいが,大抵の場合は背景因子が揃っていないこと(=交絡)が問題になる(健康意識の違い,医療アクセス,併存疾患,etc…)
- いくつかの仮定をおく場合には,上の2つを近づけて考えることができる(=Identification)
Marginal Effect
- 母集団の “全員” が因子 $A$ に曝露した ($A=1$) 場合と,“全員” が因子 $A$ に曝露しなかった場合 ($A=0$) の比較
$$ E\left[ Y^{a=1}\right] -E\left[ Y^{a=0}\right] $$
Conditional Effect
- 母集団のうち “共変量 $L$ の層の中で” 全員が因子 $A$ に曝露した ($A=1$) 場合と,全員が因子 $A$ に曝露しなかった場合 ($A=0$) の比較 e.g. 女性のみ
$$ E\left[ Y^{a=1}|L\right] -E\left[ Y^{a=0}|L\right] $$
Marginal Effect ≠ Conditional Effect
- 人種によって効果修飾 Effect Modification
- たとえば教育効果で得られる恩恵が white > black であったり
- 人種の分布が異なる母集団では Marginal Effect が変わる可能性がある
潜在アウトカムから条件付き期待値へ
求めたい条件付き Potential Outcome($L$ が同じ人たちにおける全体での潜在アウトカムの期待値)は $$ E\left[ Y^{a=1}|L\right]$$
ここで Conditional Exchangeability が仮に成立する($L$ が同じ人たちの中では曝露因子 $A$ はランダムになっていると捉える)とすると,
$$E\left[ Y^{a}|A=1,L\right] = E\left[ Y^{a}|A=0,L\right] $$
であるから,全体での期待値は治療を受けているの期待値とも同じになる.すなわち
$$ E\left[ Y^{a=1}|L\right] \Longrightarrow E\left[ Y^{a=1}|A=1,L\right] \cdots \ \left( 1\right) $$
と近似できる.さらに Consistency が成立するとき
$$ E\left[ Y^{a}|A=a\right] = E\left[ Y|A=a\right] $$
であるから,
$$ E\left[ Y^{a=1}|A=1,L\right] \Longrightarrow E\left[ Y|A=1,L\right] \cdots \ \left( 2\right) $$