目次

因果推論

因果推論とは

用語の整理

アウトカム:連続値 $Y$Outcome ≒ Endpoint ≒ Dependent Variable
曝露因子:二値変数 $A$ Exposure ≒ Treatment ≒ Explanatory Variable/Independent Variable
共変量 $L$Covariates ≒ Adjustment variables
期待値 $E\left[ Y\right] $母集団全体における $Y$ の期待値.
e.g. $E\left[ \text{BP} \right]$ は,母集団全体における血圧の期待値 Estimand.
これをサンプル全体の血圧の平均 (=Estimator) で推定したい
条件付き期待値 $E\left[ Y|L\right] $共変量 $L$ が同じ値の人における $Y$ の期待値
e.g. $E\left[ \text{BP} |A=1,\text{sex} =0\right]$ は,母集団のうち曝露因子Aに曝露した女性における血圧の期待値.これも「サンプルの中での曝露あり女性」での平均血圧 (=Estimator)から推定したい

因果推論もどき

変数名回帰係数 β 95%CI P-value
A2.22.1-2.30.01
B1.10.9-1.30.13
C2.11.7-2.30.02
D0.70.3-1.20.08

$$ E\left[ Y|A,B,C,D\right] =\beta_{0} +\beta_{1} A+\beta_{2} B+\beta_{3} C+\beta_{4} D $$

$$ \beta_{1} = E\left[ Y|A=1,B,C,D\right] -E\left[ Y|A=0,B,C,D\right] $$

調整変数の推定結果

Causal Roadmap

Step1Set the “Causal Estimand”どんな効果を知りたいのか定義する
Step2Identificationデータから効果を知るための条件を考える(効果の識別)
Exchangeability, Consistency, Positivity の3条件.
それらの条件が満たされない場合,満たす条件を考えた上で(“調整“して)比較する.
Step3Estimation実際にデータから求めたい値を計算する(推定)
  1. $E\left[ Y^{a=1}|L\right] -E\left[ Y^{a=0}|L\right]$(causal estimand の設定)
  2. $E\left[ Y|A=1,L\right] -E\left[ Y|A=0,L\right] $ (効果の識別,identification)
  3. $E\left[ Y|A=a,L\right]$ を estimation:
    • 純粋に計算する.$L$ が同じかつ $A=a$の人における $Y$ の平均をみる
    • 回帰モデルに当てはめる

1. Causal Estimand

  1. 母集団は何を見ているか
  2. 母集団のなかで,Marginal effectを見ているのか,Conditional effectを見ているのか
/曖昧に定義された母集団2)サンプリングに基づく母集団への推論
Conditional/重回帰分析,傾向スコア層化・調整
MarginalRCT,傾向スコアマッチング,自然実験IPTW,標準化,g-formula

2. Identification

Exchangeability

/ExchangeabilityConditional Exchangeability
仮定の実証が不可能自然実験重回帰分析,傾向スコア,IPTW,標準化
仮定の成立が確率的に期待できるRCT/

Positivity & Consistency

/Positivity (+) Positivity (-)
Consistency(+)RCT/
Consistency(-)傾向スコアマッチング重回帰分析,傾向スコア層化・調整,IPTW,標準化

3. Estimation

/アウトカムモデル曝露モデル
RCTなしなし
重回帰分析ありなし
傾向スコア層化なしあり
傾向スコア調整単純(PSのみの調整)あり
傾向スコアマッチなし(モデルに組み入れてもよい)あり(誤設定確認がしやすい)
IPTW単純4)あり
標準化ありなし

Null result の解釈

因果効果を明確に定義しよう

観察データで見ている介入は「治療の開始」ではない

Causal contrast

1)
Westreich D, Greenland S. The table 2 fallacy: presenting and interpreting confounder and modifier coefficients. Am J Epidemiol. 2013;177(4):292-298. DOI, Pubmed, PMC3626058
2)
誰に対する効果なのかいまいちハッキリしない.対象が準母集団化している.
3)
Kurth T, Walker AM, Glynn RJ, et al. Results of multivariable logistic regression, propensity matching, propensity adjustment, and propensity-based weighting under conditions of nonuniform effect. Am J Epidemiol. 2006;163(3):262-270. DOI, pubmed
4)
marginal structural model
5)
Hernán MA, Taubman SL. Does obesity shorten life? The importance of well-defined interventions to answer causal questions. Int J Obes (Lond). 2008;32 Suppl 3:S8-S14. DOI, pubmed