Inferences should be scientific, and that goes far beyond the merely statistical. Factors such as background evidence, study design, data quality and understanding of underlying mechanisms are often more important than statistical measures such as P values or intervals.「推論は科学的であるべきであり,それは単に統計的なものをはるかに超えるものである.背景となるエビデンス,研究デザイン,データの質,背景メカニズムの理解といった要素は,P値や区間といった統計的尺度よりも重要であることが多い」
検定や P 値といった頻度論的手法は,ランダム化臨床試験やランダムサンプリングをともなった標本調査では非常に有効なツールである.しかし,通常疫学的な観察研究では要因のランダム化も,対象者のランダムサンプリングもなされておらず,データ生成のメカニズムは不明である.ASA 声明にも述べられているように,ランダム化もランダムサンプリングもなされていないデータに検定や P 値を用いてどのような結果がえられても,そもそもの仮定が満たされていないので意味がない(Greenland, 1990).(中略)信頼区間の計算には検定の考え方が使われていることから(Rothman et al., 2008),観察研究では信頼区間を報告すれば検定や P 値の誤用から免れるというわけでもないことに注意してほしい(Greenland et al., 2016)