オッズ比を相対リスク比として患者に伝えると、リスクを最大4倍以上過大に報告してしまう可能性があります。
相対リスク比(Relative Risk:RR)とオッズ比(Odds Ratio:OR)は、どちらも「介入や曝露がアウトカムに与える影響の大きさ」を数値で示す指標です。見た目は似ていますが、計算の出発点がまったく異なります。
相対リスク比は、「曝露群のリスク(発生率)÷ 非曝露群のリスク(発生率)」で求められます。例えば、ある薬を投与したグループで心筋梗塞が10人中2人(20%)、投与しないグループで10人中4人(40%)に発生したとします。RR=0.20÷0.40=0.5となり、「薬を飲むと心筋梗塞リスクが半分になる」と直感的に解釈できます。つまり、相対リスク比は「比率の比」です。
一方、オッズ比は「曝露群のオッズ÷非曝露群のオッズ」で計算します。オッズとは「起こる確率 ÷ 起こらない確率」を指します。同じ例でいえば、投与群のオッズは 2/8=0.25、非投与群のオッズは 4/6≒0.667 となり、OR=0.25÷0.667≒0.375 です。
RR=0.5 に対して OR≒0.375 と、数値が異なる点に注目してください。これは単純な計算の差ではなく、異なる「リスクの語り方」によるものです。
ここが基本です。
アウトカムの発生率が低い場合(概ね10%未満)、オッズ比とリスク比はほぼ一致します。これを「希少疾患の仮定(Rare Disease Assumption)」と呼び、ケースコントロール研究でオッズ比を代用リスク指標として使える根拠となっています。しかし発生率が高くなるほど、オッズ比はリスク比より大きく乖離し、リスクを誇張して見せてしまう方向に働きます。
2×2分割表で考えると整理しやすくなります。
| | アウトカムあり (a) | アウトカムなし (b) |
|---|---|---|
| 曝露あり | a | b |
| 曝露なし | c | d |
$$RR = \frac{a/(a+b)}{c/(c+d)}$$
$$OR = \frac{a/b}{c/d} = \frac{ad}{bc}$$
これを覚えておけばOKです。
「アウトカムが稀なら両者は近似できる」という原則は知られていますが、では「どのくらい稀なら大丈夫か」という具体的な数値を把握している医療従事者は多くありません。これは意外に重要な知識です。
一般的な基準として、アウトカム発生率が10%未満であればオッズ比はリスク比の良い近似として使えます。発生率が20〜30%を超えると乖離が顕著になり、オッズ比がリスク比を1.5〜2倍以上上回ることがあります。発生率が50%に近づくと、その差はさらに広がります。
具体的に確認してみましょう。
- アウトカム発生率 5%:OR≒RR(乖離は軽微)
- アウトカム発生率 20%:ORがRRより約1.3倍大きくなりやすい
- アウトカム発生率 40%:ORがRRより約1.6〜2倍大きくなりやすい
- アウトカム発生率 50%:ORはRRの最大2〜4倍以上になりうる
これは数字の話ですね。
例えば、「手術後の合併症発生率30%の患者群」に対して「ある介入でOR=0.5(合併症リスクが半分)」と報告された場合、実際のRRを計算すると 0.6〜0.65 程度になる可能性があります。「半分」と「6割」では臨床的意義が大きく違います。患者への説明で「この治療でリスクが半分になりますよ」と伝えていたとすれば、それは誇張された情報を届けていたことになります。
厳しいところですね。
研究論文でオッズ比が報告されている場合、発生率が高い文脈ではZhang and Yuの変換式を使ってリスク比に近似変換できます。
$$RR \approx \frac{OR}{(1 - P_0) + (P_0 \times OR)}$$
この式の$$P_0$$はコントロール群のアウトカム発生率です。論文を読む際に発生率が高い場合はこの変換を一度行う習慣をつけると、エビデンスの解釈精度が上がります。
どの指標を使うべきかは、研究デザインによって決まります。これが原則です。
ランダム化比較試験(RCT)とコホート研究では、追跡を通じてアウトカムの発生率を直接把握できるため、リスク比(RR)を計算できます。発生率の絶対値が手に入るため、リスク比のほうが直感的でわかりやすく、NNT(治療必要数)への変換もしやすいという利点があります。
ケースコントロール研究(症例対照研究)では、アウトカムの発生率を直接計算できません。なぜなら、研究の設計上「ケース(アウトカムあり)」と「コントロール(アウトカムなし)」を最初から別々にサンプリングするからです。この構造上の理由で、リスク比ではなくオッズ比を使うことになります。
研究デザインと指標の対応をまとめます。
| 研究デザイン | 使える指標 | 補足 |
|---|---|---|
| RCT | RR・OR・ハザード比 | RRが最も解釈しやすい |
| コホート研究 | RR・OR・ハザード比 | RRが基本 |
| ケースコントロール研究 | OR のみ | RRは計算不可 |
| 横断研究 | 有病率比・OR | 状況による |
ここを誤解している医療従事者は少なくありません。
「ケースコントロール研究なのにRRが報告されている」という論文を見かけることがあります。これは研究デザインと指標の不一致であり、その数値は本来の定義では成立しない誤りです。論文のMethodsセクションで研究デザインを確認し、Resultsで報告されている指標の種類と照合する習慣が、エビデンスの批判的読解には欠かせません。
これは使えそうです。
また、ロジスティック回帰分析の出力はデフォルトでオッズ比を返します。多変量解析の結果を「リスク比」として解釈・報告しているケースも見受けられますが、これは誤りです。ロジスティック回帰からリスク比を直接求めたい場合は、ポアソン回帰(ロバスト標準誤差付き)や修正ポアソン回帰を使う方法が推奨されており、近年の疫学・生物統計の分野では標準的な手法として認識されています。
参考:日本疫学会による研究デザインと統計指標の解説(日本疫学会公式サイト)
日本疫学会公式サイト|研究デザインと疫学指標の基礎知識
臨床論文を読む場面で「ハザード比(Hazard Ratio:HR)」という指標も頻繁に登場します。意外ですね。
ハザード比は、生存時間解析(Cox比例ハザードモデル)から算出されるもので、「ある時点における単位時間あたりのイベント発生率の比」を意味します。表面上は相対リスク比に似ていますが、時間の概念が組み込まれている点で根本的に異なります。
3つの指標の特徴を整理します。
- 相対リスク比(RR):観察期間全体でのリスクの比。「Aグループは Bグループの○倍、イベントが起きやすい」
- オッズ比(OR):オッズの比。発生率が低い場合はRRに近似。ロジスティック回帰の出力。
- ハザード比(HR):各時点でのイベント発生速度の比。打ち切りデータを扱うRCT・コホートで多用。
例えばある抗がん剤の臨床試験で「HR=0.70(95%CI:0.55–0.89)」と報告されていた場合、「死亡リスクが30%低い」と言えるかどうかは単純ではありません。ハザード比は瞬間的なリスク比の平均的な推定値であり、観察期間全体を通じた累積リスク比とは異なります。追跡期間の長さや打ち切りの多さによって解釈が変わるため、「HRをそのままRRとして患者に説明する」ことは、厳密には不適切です。
ただし、イベント発生率が低くフォローアップ期間が短い研究では、HR≒RRが成り立つことが多く、実用上はほぼ同じ解釈で問題ない場面も多いです。どの程度の近似かを文脈で判断することが大切です。
これを踏まえてまとめると、「OR≒RR(発生率低い場合)」「HR≒RR(追跡短い・発生率低い場合)」という近似条件の理解が、論文読解の実践的な出発点になります。
参考:国立がん研究センター「がん情報サービス」における臨床試験指標の説明
国立がん研究センター がん情報サービス|臨床試験の読み方・ハザード比の解説
医療統計の教科書には載っていない、現場でよく起きる「落とし穴」があります。それは「数値を正しく計算しているのに、患者への伝え方で誤解を生む」というケースです。
オッズ比を相対リスク比として患者に説明する場面を想像してください。「この薬を飲むと、飲まない人に比べて心臓病のリスクが60%下がります(OR=0.4より)」という説明は、アウトカム発生率が高ければ事実より大幅に誇張されたメッセージになります。患者の意思決定に影響する可能性があり、インフォームドコンセントの質という観点からも問題をはらんでいます。
これは見落としがちです。
英国で行われた一連の研究(Gigerenzerらの「Natural Frequency」研究)では、医師・患者ともに相対リスク表現よりも絶対リスク表現(ARR:絶対リスク差)やNNT(治療必要数)のほうが正確に解釈できることが明らかになっています。
$$ARR = リスク_{非曝露群} - リスク_{曝露群}$$
$$NNT = \frac{1}{ARR}$$
例えばARR=0.02(2%の差)であれば、NNT=50、つまり「50人に投薬して、1人の発症を防ぐ」というイメージを与えられます。相対リスク比「50%低下」と聞くより、患者も医師も現実的な便益を想像しやすくなります。
「どちらの指標を使って説明するか」は、統計的正確性だけでなく倫理的なコミュニケーションの問題でもあるということですね。
医師や薬剤師向けのリスクコミュニケーション研修では、近年「どの指標で説明するかを患者ごとに選択する」ことが推奨される方向性になっています。健康リテラシーが高い患者にはRRやNNTを使った詳細な説明、そうでない場合は「100人に投薬すると○人が助かる」という自然頻度(Natural Frequency)表現が有効とされています。
論文を読む際と患者に説明する際とでは、指標の使い方の目的が異なります。この二つを分けて考えることが、医療従事者としての統計リテラシーの核心です。
参考:Minds(医療情報サービス)診療ガイドラインにおけるエビデンスの強さと指標の読み方
Minds 医療情報サービス|診療ガイドラインとエビデンスの読み方
参考:臨床統計家・森田智視氏による「臨床研究のための統計学」シリーズ(京都大学大学院)
京都大学大学院医学研究科|臨床統計・バイオスタティスティクス関連情報