有病率が1%以下の疾患では、感度99%の検査が陽性でも事後確率は50%を下回ることがあります。
事後確率とは、ある検査結果や臨床情報を得た「後」に、その疾患が存在する確率のことです。これは直感的に理解しやすい概念ですが、正確に計算するにはベイズ定理(Bayes' theorem)の理解が不可欠です。
ベイズ定理の基本形は以下のとおりです。
P(疾患|検査陽性) = P(検査陽性|疾患あり) × P(疾患) ÷ P(検査陽性)
言葉で整理すると、「検査が陽性だったときに本当に疾患がある確率」は、「疾患があるときに検査が陽性になる確率(感度)」×「そもそもその疾患がある確率(事前確率=有病率)」を、「検査全体が陽性になる確率」で割ったものです。これが基本です。
分母の「P(検査陽性)」は、真陽性と偽陽性の合計であり、次のように展開できます。
P(検査陽性) = 感度 × 有病率 + (1−特異度) × (1−有病率)
したがって事後確率の完全な計算式は以下になります。
事後確率 = (感度 × 有病率) ÷ (感度 × 有病率) + (1−特異度) × (1−有病率)
つまり事前確率・感度・特異度の3つが条件です。
具体例で確認しましょう。ある疾患の有病率(事前確率)が10%、検査の感度が90%、特異度が85%の場合、陽性的中率(検査陽性時の事後確率)は以下のように計算します。
= (0.90 × 0.10) ÷ (0.90 × 0.10) + (1−0.85) × (1−0.10)
= 0.09 ÷ 0.09 + 0.15 × 0.90
= 0.09 ÷ 0.09 + 0.135
= 0.09 ÷ 0.225
≈ 0.40(40%)
感度90%・特異度85%の検査でも、有病率が10%の集団では陽性的中率は40%程度に留まります。意外ですね。検査の性能が高くても、事前確率次第で事後確率は大きく変わるということです。
この計算式は教科書では「陽性的中率(PPV:Positive Predictive Value)」として紹介されることも多く、実質的に同じ概念を指しています。ただし厳密には、PPVは集団レベルの統計値であり、ベイズ理論に基づく事後確率は個別患者への適用を念頭に置いた概念である点に注意が必要です。
毎回ベイズ定理の完全な計算式を展開するのは、臨床の現場では現実的ではありません。そこで活用されるのが尤度比(Likelihood Ratio:LR)です。これは使えそうです。
尤度比とは、検査結果が「疾患あり群」と「疾患なし群」でどれだけ出やすいかの比率であり、陽性尤度比(LR+)と陰性尤度比(LR−)の2種類があります。
陽性尤度比(LR+)= 感度 ÷ (1−特異度)
陰性尤度比(LR−)= (1−感度) ÷ 特異度
尤度比を用いた計算では、まず事前確率(有病率)を「オッズ」形式に変換します。
事前オッズ = 事前確率 ÷ (1−事前確率)
事後オッズ = 事前オッズ × LR
事後確率 = 事後オッズ ÷ (1 + 事後オッズ)
先ほどの例(有病率10%、LR+=0.90÷0.15=6.0)で確認します。
事前オッズ = 0.10 ÷ 0.90 ≈ 0.111
事後オッズ = 0.111 × 6.0 ≈ 0.667
事後確率 = 0.667 ÷ 1.667 ≈ 0.40(40%)
同じ結果になります。これが尤度比の強みです。複数の独立した検査や所見を組み合わせる場合、各LRを順次掛け合わせていくことで事後確率を段階的に更新できます。これは複数の検査を組み合わせるシーンで非常に有用です。
LR+が10以上であれば、事前確率を中程度(30〜50%)と想定した場合でも、検査陽性によって事後確率が80〜90%以上に上昇する可能性があります。一方、LR−が0.1以下であれば、検査陰性で疾患をほぼ除外できます。LR+≧10またはLR−≦0.1が臨床判断の目安です。
さらに現場での即時推定にはFagan nomogram(フェイガン・ノモグラム)が有用です。左軸に事前確率、中央軸にLRを置き、直線を引くと右軸から事後確率が読み取れる図表であり、計算なしで視覚的に確認できます。スマートフォンアプリでも無料で利用できるものがあり、ベッドサイドでの活用に適しています。
Mindsガイドラインライブラリ「診断的検査の評価指標」- 感度・特異度・尤度比・事後確率の定義と相互関係について整理されています
事後確率の計算精度を最も左右するのは、感度や特異度ではなく事前確率の設定です。ここが原則です。
事前確率は「検査前確率(pre-test probability)」とも呼ばれ、検査を実施する前に臨床的に推定される疾患の存在確率です。一般的には「有病率」と同義に扱われることも多いですが、実臨床では患者個別の背景(年齢、性別、症状の組み合わせ、リスク因子)を加味した推定値を用いるのが正確です。
問題になるのは、集団レベルの有病率をそのまま個々の患者の事前確率として使ってしまうケースです。たとえば、日本における肺塞栓症の院内有病率は1〜3%程度ですが、「突然発症の呼吸困難と下肢腫脹がある中年男性」という臨床像では事前確率が30〜40%以上に跳ね上がります。有病率と事前確率は別物と考えてください。
Wells scoreやGeneva scoreのような臨床的確率スコア(clinical prediction rule)は、この事前確率をより客観的に推定するためのツールです。肺塞栓症のWells scoreでは点数に応じて事前確率が「低リスク(3%)、中リスク(28%)、高リスク(78%)」と分類され、これをベイズ計算の起点として使います。
事前確率の設定精度が低いと、どれだけ正確な計算式を使っても結果は歪みます。これは痛いですね。
また「基準率の無視(base rate neglect)」と呼ばれる認知バイアスも存在します。これは検査の感度・特異度ばかりに注目し、事前確率(基準率)を過小評価してしまう現象です。研究では、医師でもこのバイアスに陥ることが示されており、EBM教育の重要なテーマの一つとなっています。
これはあまり知られていない視点ですが、ベイズ定理は「1回だけ使うもの」ではありません。複数の検査や臨床所見が得られるたびに、事後確率を繰り返し更新していくことができます。これが「逐次ベイズ更新(sequential Bayesian updating)」の考え方です。
具体的な流れは以下のとおりです。
この方法の前提として、各検査結果が統計的に独立していることが必要です。相互に相関する検査同士でこの方法を使うと、事後確率が過大評価されるリスクがあります。
実臨床での例として、肺塞栓症の診断を考えます。Wells score中リスク(事前確率28%)→D-ダイマー高値(LR+=約1.5〜2.0)→事後確率約40〜45%→CT肺動脈造影陽性(LR+=約10〜25)→事後確率80〜90%超、という流れで診断確率を段階的に高めていきます。各ステップで検査の追加必要性を評価できるのが、逐次更新の大きな強みです。
この手法は「therapeutic threshold(治療閾値)」と「testing threshold(検査閾値)」の概念と組み合わせることで、最も効率よく機能します。事後確率が治療閾値を超えれば治療開始、検査閾値を下回れば疾患除外という判断基準を設けておくことで、不必要な検査を省くことができます。これは医療資源の適正利用にも直結します。
複数の検査を組み合わせてベイズ更新を行う際、最も頻繁に見落とされるのが「検査間の依存性(test dependency)」の問題です。これが条件です。
たとえば、白血球増多・CRP上昇・発熱という3つの所見を「独立した3つの尤度比」として掛け合わせた場合、事後確率が実際よりも大きく押し上げられます。これら3つの所見は感染・炎症という同一の病態生理を反映しているため、情報の重複が生じているからです。
この問題を回避するためのアプローチとして以下が挙げられます。
また、検査の「参照基準(reference standard)」の設定もバイアスの原因になります。スペクトラムバイアスとは、検査の感度・特異度が「特定の重症度や病期」の患者集団で測定されており、自分の担当患者とは異なる集団を参照している可能性があることを指します。たとえば、軽症患者を多く診る一般外来と、重症患者が集まる三次救急とでは、同じ検査でも有効なLR値が異なることがあります。LRはあくまで参考値と理解することが重要です。
事後確率の計算式はベイズ定理という強固な数学的基盤を持っています。しかし、その出力の精度は「どれほど正確な事前確率を入力できるか」「どれほど依存性を考慮した検査を組み合わせるか」という実践的判断に大きく依存します。計算式を正確に覚えることと同等以上に、事前確率の質的な評価と検査間の独立性への意識が、臨床判断の精度を高める鍵になります。数式は道具に過ぎません。それをいつ・どのように使うかという臨床的文脈の理解こそが、ベイズ思考を真に役立てるための本質です。