このページの翻訳:
  • ja

S値

  • S-value, Shannon information

$$ \log_{\frac{1}{2} } \left( \text{P-value} \right) $$


  • P値は手元のデータと統計モデルの適合性の良さ compatiblity の程度を示す指標
    • P値が低いことは,手元のデータがP値計算に用いた「統計モデル」と相性が悪いことを意味する
      • P=1.00であれば perfect compatibility,P=0.00であれば perfect incompatibility
  • P値は 0〜1 に収まる「確率」であるが,なかなかこの compatibility が「どのくらいモデルに適合しているか」という直感的解釈に落とし込むのは難しい
  • たとえばP値がある統計モデルでは 0.05 になるが別の統計モデルでは 0.005 になるとき,この「変化の大きさ」を直感的に解釈することは難しい
    • そこで,P値を 1/2 の何乗か?という数値に落とし込む「S値」が提案されている1)

具体的なP値との対応

  • P=0.5 のとき S=1.0 となるが,これは1回のコイントスでオモテが出る確率と解釈できる
  • P=0.05 のとき S=4.3 となるが,これはコイントスでオモテが連続4回ほど出る確率と解釈できる
  • P=0.005 のとき S=7.6 となるが,これはコイントスでオモテが連続8回ほど出る確率と解釈できる

S値の解釈

  • S=5.0 以内かどうか(だいたい 97%信頼区間で解釈するのに等しい)が compatibility の指標によいかもしれないと提案されている
  • S=0 が最低値(このとき P=1.00)

利点と限界

  • 利点:P値を「だいたい1/2 の何乗なのか?」で判断できるため,その変化度を「直線的」に解釈できる
  • 欠点:S値は「P値を直感的に解釈しやすくするために計算し直したもの」に過ぎない
    • 認知的な歪みを小さくするだけである

Greenlandらの論文より抜粋

At best, a 95% confidence interval roughly indicates an entire region of high compatibility between the data and possible parameter values within a given model, as judged for example by having less than 4.3 bits of information against the values inside the interval (Using S-values, a simpler and arguably better range for claiming “high compatibility” would be a 5-bit interval (≈ 97% “confidence”.).

95%信頼区間は,せいぜいデータとモデル内のパラメータ値の適合性が高い領域全体を大まかに示すものである.例えば,区間内の値に対する情報が4.3ビット以下であることで判断される.S値を使えば「適合性が高い」と主張するより単純で良さそうな範囲は,5ビット区間(≒97%「信頼」区間に該当)であろう

1)
Sander Greenland (2019) Valid P-Values Behave Exactly as They Should: Some Misleading Criticisms of P-Values and Their Resolution With S-Values, The American Statistician, 73:sup1, 106-114 DOI