交絡因子の例と臨床研究で使う正しい対処法

交絡因子とは何か、喫煙・年齢・社会経済状況など具体的な例を使って徹底解説。医療従事者が観察研究で陥りやすい誤りと、DAGや多変量解析による調整法とは?

交絡因子の例を知り臨床研究でバイアスを回避する方法

「交絡を調整すれば大丈夫」と思っている研究が、実は20%以上の確率で誤った結論を導いています。


この記事の3ポイント要約
🔍
交絡因子とは「第3の変数」

曝露(原因)とアウトカム(結果)の両方に影響を与え、見せかけの因果関係を生み出す第3の変数。3つの条件を満たすものだけが交絡因子です。

⚠️
放置すると研究結論が逆転することもある

ホルモン補充療法の研究のように、交絡を無視したコホート研究の結論がRCTによって完全に覆された事例が存在します。臨床現場への影響は深刻です。

🛠️
対処法は「デザイン段階」が最優先

多変量解析や傾向スコアでの事後調整は重要ですが、ランダム化など研究デザイン段階での排除が最も確実です。DAGを使った因果構造の可視化が鍵になります。


交絡因子の定義と3つの条件:臨床研究の基礎を整理する

交絡因子(confounder)とは、曝露変数とアウトカム変数の両方に影響を与える第3の変数であり、見かけ上の因果関係を作り出す原因になります。つまり、本来は直接関係のない2つの事象が「関連している」と誤って観察されてしまう状況を引き起こす因子のことです。


日本疫学会の定義では、ある変数が交絡因子と認定されるためには以下の3条件を同時に満たす必要があります。
























条件 内容 確認の問い
条件① アウトカムに影響を与える その因子は結果を変化させるか?
条件② 曝露(要因)と関連がある その因子は原因と結びついているか?
条件③ 曝露とアウトカムの中間因子でない 原因→因子→結果 という一方向の流れになっていないか?


この3条件のうち、特に理解が難しいのが条件③の「中間因子ではない」です。


中間因子(mediator)とは、曝露がアウトカムに影響する経路の途中に位置する変数のことです。たとえば「肥満→糖尿病脳梗塞」という経路において、糖尿病は肥満と脳梗塞の中間因子です。この場合、糖尿病は交絡因子ではありません。中間因子を誤って交絡因子として統計モデルに投入してしまうと、本来見たい因果効果が消えてしまうという深刻な問題が起きます。つまり中間因子です。


交絡因子と中間因子は「データの相関だけ」では判断できません。必ず医学的・生物学的な因果構造の仮定に基づいて識別する必要があります。これが原則です。


日本疫学会:交絡バイアス・交絡因子の定義(疫学用語の基礎知識)


交絡因子の具体例5選:臨床でよく遭遇するシーンで理解する

実際の臨床研究や疫学調査では、さまざまな交絡因子が問題になります。代表的な5つの事例を通じて、どのように「見せかけの関連」が生まれるかを確認しましょう。


例①:飲酒と肺がん(交絡因子=喫煙)


ある調査で「飲酒量が多い人ほど肺がんの発症率が高い」という結果が得られたとします。しかし、飲酒者には喫煙者が多い傾向があり、喫煙が肺がんの直接原因です。喫煙は①肺がん発症に影響し、②飲酒と関連し、③飲酒と肺がんの中間因子ではないため、交絡因子の3条件を完全に満たしています。飲酒が直接肺がんを引き起こしていたわけではなく、喫煙という交絡因子がなければ、この関連は観察されなかったでしょう。


例②:高血圧と高収入(交絡因子=年齢)


統計データを単純に集計すると「高血圧の人は高収入である」という一見奇妙な関連が観察されます。これは年齢という交絡因子によるものです。年齢が上がると血圧も上がりやすく(男性の60代平均収縮期血圧は約138 mmHg、20代は約120 mmHg)、同時に年功序列が残る日本では年齢が高いほど収入も高くなりやすい。年齢を調整して分析すると、高血圧と高収入の関連は消失します。年齢が条件です。


例③:コーヒー摂取と心筋梗塞(交絡因子=喫煙)


「コーヒーをよく飲む人は心筋梗塞になりやすい」という研究結果も、交絡因子の古典的な例です。喫煙者にはコーヒーを好む人が多く、喫煙自体が心筋梗塞リスクを直接高めます。喫煙という交絡因子を調整した後の研究では、コーヒーの適度な摂取がむしろ心血管リスクを下げる可能性すら示されており、結論が逆転した事例です。意外ですね。


例④:ホルモン補充療法と心血管疾患(交絡因子=社会経済的地位)


医療現場への影響という観点で最も重要な例です。複数のコホート研究において「ホルモン補充療法(HRT)は心血管疾患を予防する」と報告され、欧米では2000年頃まで広く実施されていました。しかし実際には、HRTを受ける女性は社会経済的地位が高く、もともと心疾患リスクが低い層に偏っていました。その後、ランダム化比較試験(RCT)によって、HRTはむしろ静脈血栓塞栓症リスクを高めることが明らかになりました。社会経済的地位という交絡因子が見落とされた結果、数百万人規模の患者に誤った治療が行われた可能性があります。これは深刻な事例ですね。


例⑤:朝食と学力(交絡因子=親の教育意識)


「毎日朝食を食べる子どもは学力が高い」というデータも交絡の代表例です。親の教育意識が高ければ子どもに朝食を食べさせる習慣も整い、学習サポートも手厚くなります。「朝食→学力向上」という単純な因果連鎖ではなく、「親の教育意識」という第3の変数が背後に存在します。医療・保健指導の現場でも、食習慣と健康指標の研究において同様の構造が繰り返し登場します。


Best Biostatistics:交絡因子とは?中間因子など統計的な意味を事例でわかりやすく解説


交絡因子の見つけ方:DAGを使って因果構造を可視化する

交絡因子を正しく特定するためには、データの統計的相関だけを見ていては不十分です。これが基本です。


現代の疫学では、DAG(Directed Acyclic Graph:有向非巡回グラフ)という因果ダイアグラムを使って、変数間の因果構造を可視化することが標準的なアプローチになっています。DAGとは、変数をノード(丸や四角)、因果関係を矢印で表した図で、複雑な因果構造を「地図」のように整理できるツールです。


DAGを描くことで、以下の3種類の変数を明確に区別できます。



  • 🔶 交絡因子(Confounder):曝露とアウトカムの両方に矢印が向かっている共通の原因変数。調整が必要。

  • 🔷 中間因子(Mediator):曝露→中間因子→アウトカムという経路上の変数。調整すると本来の効果が消えてしまうため、原則として調整しない。

  • 🔴 コライダー(Collider):曝露とアウトカムの両方から矢印が集まる変数。調整すると逆に偽の関連が生じる「コライダーバイアス」が発生するため、絶対に調整してはいけない。


コライダーへの調整は避けなければなりません。たとえば、「入院」という変数は、感染症(曝露)と骨折(アウトカム)の両方から矢印が向かうコライダーになりえます。「入院患者のみ」でデータを解析すると、感染症と骨折に見かけ上の逆相関が生じる、という現象が起きます。これを「バークソンバイアス」と呼びます。


DAGの描き方は「文献や専門家知識に基づいて因果の方向を仮定し、矢印を描く」という作業です。dagitty(https://www.dagitty.net/)というオンラインツールを使うと、ブラウザ上でDAGを作成し、調整すべき変数を自動的に提案させることができます。無料です。


mMEDICI Library(疫学専門家監修):DAGを徹底解説 基礎編 - 因果推論の必須ツールで交絡因子を可視化する


交絡因子の対処法:デザイン段階から解析段階まで体系的に理解する

交絡への対処法は、大きく「研究デザイン段階」と「統計解析段階」の2つに分かれます。デザイン段階での排除が最優先です。


研究デザイン段階での対処法


最も強力な方法はランダム化(無作為割り付け)です。ランダム化を行えば、既知の交絡因子も未知の交絡因子も、理論上すべての群で平均的に均等化されます。これがRCT(ランダム化比較試験)がエビデンスの最上位に位置する理由です。


ランダム化以外のデザイン段階での手法には、以下のものがあります。



  • 制限(Restriction):特定の交絡因子の値が同一の集団だけを研究対象に絞る。例:「非喫煙者のみ」に絞って解析する。シンプルですが、一般化可能性が下がるデメリットがある。

  • マッチング(Matching):対照群を選ぶ際に、交絡因子の値(年齢・性別など)を曝露群と意図的に揃える。症例対照研究でよく使われる。

  • 層別化(Stratification):データ収集段階から交絡因子の値でグループを分けて収集する。


統計解析段階での対処法


デザイン段階で排除しきれなかった交絡因子には、解析段階での調整が必要です。ただし、あくまで最終手段というポジションです。



  • 📊 多変量解析:回帰モデルに交絡因子を共変量として投入し、交絡の影響を統計的に除く。アウトカムが連続変数なら重回帰分析、二値変数ならロジスティック回帰分析、生存時間データならCox比例ハザードモデルを使用する。

  • 📊 層別解析(Stratified analysis):交絡因子の値でデータを層に分けて、各層内で曝露とアウトカムの関連を評価する。計算式で表すとMantel-Haenszel法による重み付き平均が代表的。

  • 📊 傾向スコア解析(Propensity Score Analysis):複数の交絡因子をまとめて「曝露を受ける確率(傾向スコア)」として1つのスコアに集約し、それを用いてマッチング・層別化・重み付け(IPW)を行う。観察研究で複数の交絡因子を同時に扱いたいときに特に有効です。


解析段階の調整には限界もあります。多変量解析が有効に機能するには、投入する交絡因子変数が正確に測定されていることが前提です。たとえば、自己申告による体重データは実測値より平均で女性約2.5kg、男性約1.8kg軽く記録されることがあり、測定誤差が残存交絡(residual confounding)を生じさせます。データ収集の精度も交絡対策の一部です。


交絡因子が見落とされると何が起きるか:論文読解への実践的応用

交絡因子を見落とした研究が医療現場にどれだけの問題をもたらすか、改めて整理しておく価値があります。


論文を批判的に読む際、交絡因子の観点から確認すべき項目は次のとおりです。



  • 🔍 調整した交絡因子の選定理由は明示されているか?「年齢・性別・喫煙」などを調整したと書いてあっても、なぜその因子を選んだかの根拠(DAGや先行研究の引用)がなければ信頼性は低い。

  • 🔍 中間因子を誤って調整していないか?血圧と脳卒中の関係を見たい研究で、血圧の結果として生じる腎機能低下(中間因子)を調整してしまうと、真の効果が消えてしまう。

  • 🔍 未知の交絡因子(residual confounding)の可能性は議論されているか?多変量解析で調整しても、測定していない交絡因子は排除できない。観察研究の結論には常にこの限界がある。

  • 🔍 観察研究の結論とRCTの結論が一致しているか?前述のHRTの例のように、コホート研究の結論がRCTで逆転するケースは珍しくない。


研究報告ガイドラインのSTROBE(観察研究の透明性向上のためのガイドライン)では、「なぜその交絡因子を選択し、どのように調整したか」「どのようなバイアスの可能性があるか」を論文中に明確に記述することが求められています。投稿論文や研究プロトコルを作成する際には、このSTROBEチェックリストを参照することで、交絡の扱いが適切かどうかを体系的に確認できます。これは使えそうです。


臨床研究を読む際には、単に「p値が0.05未満だった」という表面的な結果だけでなく、「どのような交絡因子が存在し、それは適切に対処されているか」という視点を持つことが、エビデンスを正しく評価するために不可欠です。研究の信頼性を見抜く目を養うことが、医療従事者として質の高い診療につながります。


佐賀大学医学部整形外科:「因果か、交絡か」臨床研究の落とし穴 - 疫学研究における交絡の実例と問題点


バイオスタティスティクスコンサルタント:傾向スコアを使った観察研究の交絡調整3種の解説