内科のメモ帳

ずぼらな覚え書き

ユーザ用ツール

サイト用ツール


stats:causal:adjust

調整 adjust

  • 条件付きの交換可能性; Conditional Exchangeability を成立させるのが「調整」
    • 「調整済み」の患者属性を考慮すればバイアスがない状況にする.傾向スコアもその手法の1つ.
  • 十分な患者属性の測定・調整が必須となる
    • そこで DAG が必要になる.
  • No association after adjustment ≠ No effect
    • 交絡因子ではなく間違って中間因子を調整していることがある
  • 重要なのは「未調整交絡なし」という実現不可能を目指すのではなく,結論・意思決定が変わる程度にバイアスが残っているのかどうか
    • バイアスの大きさ(E-valueやバイアスパラメーターなど),バイアスの方向性を考えることが必要
    • falsification も一つの手段(「大きな未調整交絡があれば生じるはずの差」がないことを示す)

統計解析による交絡の adjust

  • 主な方法は以下の2通り
  1. 患者属性の分布をそろえる
    • 「マッチング」や「重み付け」を行う
      • イメージとして男女比が交絡していた場合に「男女の割合を揃える」手法
  2. 患者属性が同じ集団に注目する(条件付け:conditioning)
    • 層別化,限定,一般的な回帰分析
      • イメージとして男女比が交絡していた場合に「男だけ,女だけに注目する」手法

変数のタイミングは重要

  • 曝露とアウトカムが同じ時点の場合(横断研究),逆因果の可能性あり
  • 曝露と調整変数が同じ時点にある場合,中間因子になってしまっている可能性があり,過調整による過小推定の可能性がある
    • 前後関係が明確でないと効果の正しい推定ができなくなる
  • 理想的には,調整変数,曝露,アウトカムそれぞれの測定タイミングをずらす縦断研究が望ましい
    • ただし計測時点が離れすぎるとその間に残余交絡を生じる
    • 特にベースライン前の曝露・アウトカム値は特に重要な調整因子となる

ベースライン前調整の利点

$$\left[ U\rightarrow X_{0}\rightarrow Y_{0}\right] \longrightarrow \left[ X_{1}\right] \longrightarrow \left[ Y_{2}\right] $$

  • 3つの時点で測定する1)
    1. ベースライン前の時点($U$,$X_{0}$,$Y_{0}$の測定時点)
    2. ベースライン時点($X_{1}$の測定時点)
    3. フォローアップ時点($Y_{2}$の測定時点)
  • ベースライン前アウトカム $Y_{0}$ を調整する利点:
    1. 最も強い交絡(逆因果)を除外できる
      • いわゆる逆因果があるとき,上の DAG のように,$Y_{0}$ から $X_{1}$に矢印が伸びてしまう
      • $Y_{0}$は$Y_{2}$を強く予測する上,非常に強い交絡因子になる
  • ベースライン前 $X_{0}$を調整する利点:
    1. 逆因果をさらに除外する
    2. 未測定交絡因子 $U$ の影響を除外できる
    3. $X_{0}$から$X_{1}$に「曝露が変化したとき」のアウトカムとして解釈可能になる(解釈可能性が高まる)
    4. Prevalent-user bias を除外できる
      • 一種の選択バイアスだが,たとえば長期の喫煙曝露がベースライン前にあった(=$X_{0}$)とき,今回ベースライン時点での曝露(=$X_{1}$)を観測している時点で「生存できていること」はバイアスになる.本来はすでに亡くなっている人が相当いるはず.

ベースライン前調整の注意点

  • いつでも使える手法ではない
  1. 曝露が時点間でほとんど変化していない場合は,ベースライン前の調整はできない(多重共線性が生じてしまう)
  2. 適切な問いなのか?
    • 特に変動していない曝露(=人種,性別など)は介入できないものである

実践的な変数選択アプローチ

  • DAGに完全に則るのは難しい部分もある
  • 実践的には,交絡因子選択の原則について述べた “Principles of confounder selection” (VanderWeele, 2019) が詳しい2)

Disjunctive Cause Criterion

  • 曝露またはアウトカムの決定要因に限っては,もれなく調整する
    • 操作変数は調整しない
    • 未測定交絡のプロキシは調整する

操作変数を調整しない

未測定交絡のプロキシは調整する

調整変数の候補が大量にある時

  • それぞれの測定時点の確認する
  • あきらかな collider,操作変数は除外する
  • ある程度条件づけていけば,バイアスを減らせる幅はどんどん小さくなる
    • 20個の変数で条件づけたとき,21個目の調整でバイアスが減る幅はおそらく小さい

サンプルサイズが小さいとき

  • 過剰な調整が問題になることがある
    • 最初の調整変数候補はドメイン知識で収集しておき,そこからデータドリブンに変数を減らして行うことは実践手段としてあり
    • いきなりデータドリブンにp値が云々だからという手法や stepwise 法は最悪
  • 曝露が稀でないのであれば,傾向スコアで縮約する方法も一手
1)
Tyler J. VanderWeele, Maya B. Mathur and Ying Chen. “Outcome-Wide Longitudinal Designs for Causal Inference: A New Template for Empirical Studies”DOI
2)
VanderWeele TJ. Principles of confounder selection. Eur J Epidemiol. 2019;34(3):211-219. DOI, PMID:30840181, PMC6447501
stats/causal/adjust.txt · 最終更新: 2023/10/08 by admin

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki