このページの翻訳:
  • ja

傾向スコア

  • propensity score

$$ PS = Pr\left[ A=1|L\right] $$

  • ある $L$ の組み合わせの人が曝露(治療など)を受ける $A=1$ 確率を傾向スコアと呼ぶ
  • あらゆる因子 $L$ を全て条件付けて conditional Exchangeability を担保しなくても, PSの条件付けだけで同じことができる
    • PS が同じ集団では $L$ の分布が等しくなる
  • 前提として「これら全ての $L$ を条件づけると conditinal exchangeability が得られます」ということを示していなければならない
    • どのような変数を選ぶか,DAGの想起などは普通の回帰分析と同じように考える必要はある
  • アウトカムに仮定をおく回帰分析のモデルと違い,曝露側に過程をおくモデリング
    • それによって,アウトカムモデルをシンプルにすることができる

傾向スコアの推定法

  • 曝露に対するロジスティック回帰など,曝露モデルに対する過程をおく

どのように同一 PS 同士で比較するか

  1. 層別化する Stratification
    • PS が似たような値を取る層の中でアウトカムを群間比較する
  2. アウトカムモデルで条件付けする(あまりメジャーではない)
    • つまり,$L$ のかわりに直接 PS を条件付け他回帰分析を行う
    • $E\left[ Y|A,PS\right] =\beta_{0} +\beta_{1} A+\beta_{2} PS$
  3. マッチングする
  4. 逆確率重みづけをする

傾向スコアマッチング

  • PSが同じような曝露・非曝露の個人のペアを作る
  • マッチされたサンプルでは,PSの分布が治療群間で同じになる
  • マッチされたサンプルが代表する集団における,ある種の marginal effect が推定できる
    • それは一体どんな集団なのか?」という解釈性の問題が生じる
  • PS = 0 に近い人たちや PS=1 に近い人たちは当然,マッチする相方が得られにくくなる(off-support)
    • 両端を切り落としているため,推論の対象が当初のものから変わっていることに注意

傾向スコア逆確率重みづけ IPTW

  • IPTW; inverse probability of treatment weighted
  • 傾向スコア(らしきもの)を使った重みづけ
    • $Pr\left[ A=a|L\right] $
    • 傾向スコアが 0,5 であれば,そのウェイトは逆数の 2 になる(コピー人間を増やして pesudo-population を作るイメージ)
  • 重みづけをしたあとの集団(pseudo-population)においては,変数 $L$ の $A$ への DAG上の矢印(L→A)が消える
    • つまり曝露因子が調整変数から完全に独立する.交絡が存在しなくなる.
  • Pseudo-population でアウトカムモデル(回帰モデル)を普通に作れば,非常にシンプルなモデルになる

$$ E_{PS}\left[ Y|A\right] =\beta_{0} +\beta_{1} A $$

  • ここにおいて,Lの条件付けはもはや不要になっており,曝露があったかなかったかの2値変数であれば,モデルの誤設定が起きようがない
    • Marginal Structural Modelのパラメータ推定を重みづけされた outcome regression
  • 重みづけしているため,標準誤差を調整しなければならない(実際よりも SE や 95%CI が過小推定になる)
    • ロバスト分散やブートストラップなどの手法で調整
  • 集団全体における効果 marginal effect を推定できるのが利点(マッチングでは両端を削除するのでそうはならない)
  • アウトカムモデルはシンプルになるが,傾向スコアを作る時点で曝露モデルを作成しているので,結局どこに仮定を置いているかの違い

アウトカムモデル vs 傾向スコア

  • 参考:傾向スコアを因果推論で用いる時の tips1)

1. モデルの設定

  • アウトカムに過程を置くか vs 曝露に過程を置くかの違い
    • PSは共変量のバランスが直感的に評価しやすいのが魅力(その PSマッチングや重みづけで背景因子が本当にバランスできているか一眼でわかる)
    • 重回帰分析でも「条件付け」で同じようなことはしているが,「背景因子ほら揃っているでしょ」と一目で提示できるのはコミュニケーションの点で PS が優れている

2. Positivity 違反の予防

  • マッチングではペアがないような極端なケース(off-support)を除外できる(ex.男性の子宮摘出は PS=0 である)
  • 逆確率重みづけの際は,重みづけが極端に大きくなっているケースなどを拾うことで Positivity 違反のケースをスクリーニングできる
    • アウトカムモデルでは気付きにくい

3. レアアウトカム

  • たくさん共変量を調整するさい,重回帰に突っ込むと不安定な推定になりやすいが,PSは安定性が保たれやすい

4. 誠実な解析

  • 全てのモデルづくりの意思決定が終わった後にアウトカムを確認
  • p-hackingの予防になる

感度分析

  • 上述のように PSのマッチングと PSのIPTWでは異なる causal estimand になるので,感度分析として両者を比較することは本来あまり適切ではない
1)
Koichiro Shiba, Takuya Kawahara, Using Propensity Scores for Causal Inference: Pitfalls and Tips, Journal of Epidemiology, 2021, 31 巻, 8 号, p. 457-463, DOI, CC-BY