「交絡を調整すれば大丈夫」と思っている研究が、実は20%以上の確率で誤った結論を導いています。
交絡因子(confounder)とは、曝露変数とアウトカム変数の両方に影響を与える第3の変数であり、見かけ上の因果関係を作り出す原因になります。つまり、本来は直接関係のない2つの事象が「関連している」と誤って観察されてしまう状況を引き起こす因子のことです。
日本疫学会の定義では、ある変数が交絡因子と認定されるためには以下の3条件を同時に満たす必要があります。
| 条件 | 内容 | 確認の問い |
|---|---|---|
| 条件① | アウトカムに影響を与える | その因子は結果を変化させるか? |
| 条件② | 曝露(要因)と関連がある | その因子は原因と結びついているか? |
| 条件③ | 曝露とアウトカムの中間因子でない | 原因→因子→結果 という一方向の流れになっていないか? |
この3条件のうち、特に理解が難しいのが条件③の「中間因子ではない」です。
中間因子(mediator)とは、曝露がアウトカムに影響する経路の途中に位置する変数のことです。たとえば「肥満→糖尿病→脳梗塞」という経路において、糖尿病は肥満と脳梗塞の中間因子です。この場合、糖尿病は交絡因子ではありません。中間因子を誤って交絡因子として統計モデルに投入してしまうと、本来見たい因果効果が消えてしまうという深刻な問題が起きます。つまり中間因子です。
交絡因子と中間因子は「データの相関だけ」では判断できません。必ず医学的・生物学的な因果構造の仮定に基づいて識別する必要があります。これが原則です。
日本疫学会:交絡バイアス・交絡因子の定義(疫学用語の基礎知識)
実際の臨床研究や疫学調査では、さまざまな交絡因子が問題になります。代表的な5つの事例を通じて、どのように「見せかけの関連」が生まれるかを確認しましょう。
例①:飲酒と肺がん(交絡因子=喫煙)
ある調査で「飲酒量が多い人ほど肺がんの発症率が高い」という結果が得られたとします。しかし、飲酒者には喫煙者が多い傾向があり、喫煙が肺がんの直接原因です。喫煙は①肺がん発症に影響し、②飲酒と関連し、③飲酒と肺がんの中間因子ではないため、交絡因子の3条件を完全に満たしています。飲酒が直接肺がんを引き起こしていたわけではなく、喫煙という交絡因子がなければ、この関連は観察されなかったでしょう。
例②:高血圧と高収入(交絡因子=年齢)
統計データを単純に集計すると「高血圧の人は高収入である」という一見奇妙な関連が観察されます。これは年齢という交絡因子によるものです。年齢が上がると血圧も上がりやすく(男性の60代平均収縮期血圧は約138 mmHg、20代は約120 mmHg)、同時に年功序列が残る日本では年齢が高いほど収入も高くなりやすい。年齢を調整して分析すると、高血圧と高収入の関連は消失します。年齢が条件です。
例③:コーヒー摂取と心筋梗塞(交絡因子=喫煙)
「コーヒーをよく飲む人は心筋梗塞になりやすい」という研究結果も、交絡因子の古典的な例です。喫煙者にはコーヒーを好む人が多く、喫煙自体が心筋梗塞リスクを直接高めます。喫煙という交絡因子を調整した後の研究では、コーヒーの適度な摂取がむしろ心血管リスクを下げる可能性すら示されており、結論が逆転した事例です。意外ですね。
例④:ホルモン補充療法と心血管疾患(交絡因子=社会経済的地位)
医療現場への影響という観点で最も重要な例です。複数のコホート研究において「ホルモン補充療法(HRT)は心血管疾患を予防する」と報告され、欧米では2000年頃まで広く実施されていました。しかし実際には、HRTを受ける女性は社会経済的地位が高く、もともと心疾患リスクが低い層に偏っていました。その後、ランダム化比較試験(RCT)によって、HRTはむしろ静脈血栓塞栓症リスクを高めることが明らかになりました。社会経済的地位という交絡因子が見落とされた結果、数百万人規模の患者に誤った治療が行われた可能性があります。これは深刻な事例ですね。
例⑤:朝食と学力(交絡因子=親の教育意識)
「毎日朝食を食べる子どもは学力が高い」というデータも交絡の代表例です。親の教育意識が高ければ子どもに朝食を食べさせる習慣も整い、学習サポートも手厚くなります。「朝食→学力向上」という単純な因果連鎖ではなく、「親の教育意識」という第3の変数が背後に存在します。医療・保健指導の現場でも、食習慣と健康指標の研究において同様の構造が繰り返し登場します。
Best Biostatistics:交絡因子とは?中間因子など統計的な意味を事例でわかりやすく解説
交絡因子を正しく特定するためには、データの統計的相関だけを見ていては不十分です。これが基本です。
現代の疫学では、DAG(Directed Acyclic Graph:有向非巡回グラフ)という因果ダイアグラムを使って、変数間の因果構造を可視化することが標準的なアプローチになっています。DAGとは、変数をノード(丸や四角)、因果関係を矢印で表した図で、複雑な因果構造を「地図」のように整理できるツールです。
DAGを描くことで、以下の3種類の変数を明確に区別できます。
コライダーへの調整は避けなければなりません。たとえば、「入院」という変数は、感染症(曝露)と骨折(アウトカム)の両方から矢印が向かうコライダーになりえます。「入院患者のみ」でデータを解析すると、感染症と骨折に見かけ上の逆相関が生じる、という現象が起きます。これを「バークソンバイアス」と呼びます。
DAGの描き方は「文献や専門家知識に基づいて因果の方向を仮定し、矢印を描く」という作業です。dagitty(https://www.dagitty.net/)というオンラインツールを使うと、ブラウザ上でDAGを作成し、調整すべき変数を自動的に提案させることができます。無料です。
mMEDICI Library(疫学専門家監修):DAGを徹底解説 基礎編 - 因果推論の必須ツールで交絡因子を可視化する
交絡への対処法は、大きく「研究デザイン段階」と「統計解析段階」の2つに分かれます。デザイン段階での排除が最優先です。
研究デザイン段階での対処法
最も強力な方法はランダム化(無作為割り付け)です。ランダム化を行えば、既知の交絡因子も未知の交絡因子も、理論上すべての群で平均的に均等化されます。これがRCT(ランダム化比較試験)がエビデンスの最上位に位置する理由です。
ランダム化以外のデザイン段階での手法には、以下のものがあります。
統計解析段階での対処法
デザイン段階で排除しきれなかった交絡因子には、解析段階での調整が必要です。ただし、あくまで最終手段というポジションです。
解析段階の調整には限界もあります。多変量解析が有効に機能するには、投入する交絡因子変数が正確に測定されていることが前提です。たとえば、自己申告による体重データは実測値より平均で女性約2.5kg、男性約1.8kg軽く記録されることがあり、測定誤差が残存交絡(residual confounding)を生じさせます。データ収集の精度も交絡対策の一部です。
交絡因子を見落とした研究が医療現場にどれだけの問題をもたらすか、改めて整理しておく価値があります。
論文を批判的に読む際、交絡因子の観点から確認すべき項目は次のとおりです。
研究報告ガイドラインのSTROBE(観察研究の透明性向上のためのガイドライン)では、「なぜその交絡因子を選択し、どのように調整したか」「どのようなバイアスの可能性があるか」を論文中に明確に記述することが求められています。投稿論文や研究プロトコルを作成する際には、このSTROBEチェックリストを参照することで、交絡の扱いが適切かどうかを体系的に確認できます。これは使えそうです。
臨床研究を読む際には、単に「p値が0.05未満だった」という表面的な結果だけでなく、「どのような交絡因子が存在し、それは適切に対処されているか」という視点を持つことが、エビデンスを正しく評価するために不可欠です。研究の信頼性を見抜く目を養うことが、医療従事者として質の高い診療につながります。
佐賀大学医学部整形外科:「因果か、交絡か」臨床研究の落とし穴 - 疫学研究における交絡の実例と問題点
バイオスタティスティクスコンサルタント:傾向スコアを使った観察研究の交絡調整3種の解説