アウトカム:連続値 $Y$ | Outcome ≒ Endpoint ≒ Dependent Variable |
曝露因子:二値変数 $A$ | Exposure ≒ Treatment ≒ Explanatory Variable/Independent Variable |
共変量 $L$ | Covariates ≒ Adjustment variables |
期待値 $E\left[ Y\right] $ | 母集団全体における $Y$ の期待値. e.g. $E\left[ \text{BP} \right]$ は,母集団全体における血圧の期待値 Estimand. これをサンプル全体の血圧の平均 (=Estimator) で推定したい |
条件付き期待値 $E\left[ Y|L\right] $ | 共変量 $L$ が同じ値の人における $Y$ の期待値 e.g. $E\left[ \text{BP} |A=1,\text{sex} =0\right]$ は,母集団のうち曝露因子Aに曝露した女性における血圧の期待値.これも「サンプルの中での曝露あり女性」での平均血圧 (=Estimator)から推定したい |
変数名 | 回帰係数 β | 95%CI | P-value |
A | 2.2 | 2.1-2.3 | 0.01 |
B | 1.1 | 0.9-1.3 | 0.13 |
C | 2.1 | 1.7-2.3 | 0.02 |
D | 0.7 | 0.3-1.2 | 0.08 |
$$ E\left[ Y|A,B,C,D\right] =\beta_{0} +\beta_{1} A+\beta_{2} B+\beta_{3} C+\beta_{4} D $$
$$ \beta_{1} = E\left[ Y|A=1,B,C,D\right] -E\left[ Y|A=0,B,C,D\right] $$
Step1 | Set the “Causal Estimand” | どんな効果を知りたいのか定義する |
Step2 | Identification | データから効果を知るための条件を考える(効果の識別) Exchangeability, Consistency, Positivity の3条件. それらの条件が満たされない場合,満たす条件を考えた上で(“調整“して)比較する. |
Step3 | Estimation | 実際にデータから求めたい値を計算する(推定) |
/ | 曖昧に定義された母集団2) | サンプリングに基づく母集団への推論 |
---|---|---|
Conditional | / | 重回帰分析,傾向スコア層化・調整 |
Marginal | RCT,傾向スコアマッチング,自然実験 | IPTW,標準化,g-formula |
/ | Exchangeability | Conditional Exchangeability |
---|---|---|
仮定の実証が不可能 | 自然実験 | 重回帰分析,傾向スコア,IPTW,標準化 |
仮定の成立が確率的に期待できる | RCT | / |
/ | Positivity (+) | Positivity (-) |
---|---|---|
Consistency(+) | RCT | / |
Consistency(-) | 傾向スコアマッチング | 重回帰分析,傾向スコア層化・調整,IPTW,標準化 |
/ | アウトカムモデル | 曝露モデル |
---|---|---|
RCT | なし | なし |
重回帰分析 | あり | なし |
傾向スコア層化 | なし | あり |
傾向スコア調整 | 単純(PSのみの調整) | あり |
傾向スコアマッチ | なし(モデルに組み入れてもよい) | あり(誤設定確認がしやすい) |
IPTW | 単純4) | あり |
標準化 | あり | なし |