次世代シーケンシングの原理と臨床応用・医療現場での活用法

次世代シーケンシング(NGS)の原理をわかりやすく解説。Illumina・PacBio・ナノポアの違いや、がんゲノム医療への臨床応用まで、医療従事者が知っておくべき知識とは?

次世代シーケンシングの原理と臨床応用・医療現場での活用を徹底解説

NGSのがん遺伝子パネル検査で、実際に治療薬が見つかる患者さんの割合はわずか約10%です。


この記事のポイント3つ
🔬
NGSの基本原理

サンガー法との違いを踏まえ、「並列処理」というNGS最大の特徴と、ライブラリ調製〜データ出力までの4ステップを解説します。

💡
主要プラットフォームの比較

Illumina(SBS法)・PacBio(SMRT法)・ナノポアの3種類の原理・精度・リード長の違いを、臨床選択の視点でわかりやすく整理します。

🏥
医療現場での実践活用

2019年に保険適用となったがん遺伝子パネル検査をはじめ、感染症・希少疾患診断における最新のNGS臨床活用の実態を紹介します。


次世代シーケンシング(NGS)とサンガー法の原理的な違い

次世代シーケンシング(NGS:Next-Generation Sequencing)を理解するには、その前身であるサンガー法との比較が最も手っ取り早い方法です。サンガー法は、DNA依存性ポリメラーゼを用いて一本鎖DNA鋳型に相補的なコピーを産生する方法です。反応ごとに4種類のジデオキシヌクレオチド(ddNTP)が混入されており、これが伸長鎖に取り込まれると3'ヒドロキシル基が欠損しているためDNA合成が停止します。得られた断片を電気泳動で分離し、各ddNTPに付けられた蛍光色素を読み取ることで塩基配列を特定します。


精度は非常に高い反面、処理できる量は1回あたり8〜96反応程度に限られます。本1冊を1人が1文字ずつ音読していくようなイメージです。


NGSはこの制限を根本から覆しました。解析したいDNAを数百〜数千塩基の断片に分解し、それぞれに「アダプター」と呼ばれる人工配列を両端に結合させた後、数百万〜数十億の断片を同時並行で読み取ります。1冊の本をバラバラのページに分解し、数百万人が一斉に読み上げるイメージに近いです。これにより、かつては30億ドルと13年以上を費やしたヒト全ゲノム解読が、現在では数日で可能になりました。コスト面でも劇的な差があり、Illumina社が2014年に達成した「1,000ドルゲノム」はひとつのマイルストーンとして記憶されています。


医療従事者が知っておくべき最重要概念として「被覆度(カバレッジ)」があります。シーケンシング反応には確率的なエラーが生じるため、同じ領域を複数回読み直すことで精度を高める手法が取られています。一般的には30回以上の被覆が必要条件とされており、被覆度が30を下回ると信頼性のある結果が得られません。被覆度が高いほど低頻度変異の検出感度が上がりますが、コストと計算量も増えます。つまり被覆度の設定は目的ごとに最適化する必要があります。


参考:NGSの技術概要と各プラットフォームの比較について詳しく解説されています。


次世代シーケンシング(NGS)とは|コスモ・バイオ株式会社


次世代シーケンシングの原理:ライブラリ調製からデータ出力までの4ステップ

NGSの工程は大きく4ステップに分けられます。①サンプル調製(核酸抽出)→②ライブラリ調製→③シーケンシング→④データ解析、です。


①核酸抽出: 血液・組織・唾液などの生体サンプルからDNAまたはRNAを単離します。投入する核酸の品質と量は最終的なデータ品質に直結するため、このステップを軽視すると後段の解析精度が大幅に低下します。


②ライブラリ調製: 抽出したDNAを超音波処理や酵素処理で300〜500bp程度に断片化し、各断片の両端にアダプター配列をライゲーション(連結)します。このアダプターには、フローセルへのハイブリダイゼーション配列(P5/P7)、サンプルを識別するインデックス配列(i5/i7)、シーケンスプライマーの結合配列(SR1/SR2)が含まれています。アダプターに挟まれたDNA断片の集合体を「ライブラリ」と呼びます。複数サンプルに異なるインデックスを付与することで、1回の実行で複数サンプルを同時解析する「マルチプレックス」が可能になります。


③シーケンシング(Illumina SBS法の場合): ライブラリをフローセル(ガラス基盤)に流し込むと、アダプター配列がフローセル表面の相補鎖に結合します。そこでブリッジPCRと呼ばれる固相増幅を繰り返し、同一DNA断片のコピーが数千個集まった「クラスター」を形成します。クラスター形成後、可逆性の蛍光標識ヌクレオチドを1塩基ずつ伸長させ、各サイクルでレーザー照射→蛍光検出→蛍光/保護基除去を繰り返します。この手法をSequence-By-Synthesis(SBS)法と言い、Illumina社の中核技術です。蛍光シグナルが1塩基ごとに写真として記録されるので、クラスター内の全分子が同期して1塩基ずつ読み進めます。


④データ解析: 読み取られた塩基配列データ(リード)を既知の参照ゲノムにマッピング(アライメント)し、変異の有無を特定します。各塩基の信頼スコアとして「Qスコア」が用いられ、Q30(精度99.9%)以上が臨床品質の基準とされています。


このようなステップが確立されています。意外と見落とされがちですが、②のライブラリ調製は手作業を含む精密工程で、専門的な技術が必要です。「血液を機械に入れれば自動で診断が出る」というイメージは正確ではなく、この前処理工程の品質管理こそが診断精度を大きく左右します。

































NGS主要プラットフォームのステップ比較
工程 Illumina(SBS法) PacBio(SMRT法) Nanopore(ナノポア法)
断片化 300〜500bp 数kb〜数十kb 数kb〜1Mb超
増幅 ブリッジPCR(フローセル上) 増幅なし(単分子)
検出原理 蛍光(可逆ターミネーター) 蛍光(リアルタイム) 電流変化(イオン電流)
Qスコア(精度) Q31(99.92%) Q33(99.95%)HiFi Q21(99.26%)


参考:ライブラリ調製からシーケンスまでの詳細な工程と専門用語が整理されています。


次世代シークエンサーの種類とその原理についてわかりやすく解説|easy-bio-blog


次世代シーケンシングの原理比較:Illumina・PacBio・ナノポアの特徴と選択基準

現在の市場でNGSプラットフォームとして主流を占めているのは3種類です。それぞれ設計思想が根本的に異なるため、目的に応じた選択が求められます。


🔵 Illumina(SBS法):精度とスループットの王者


Illumina社のシーケンサーは2018年時点で世界市場シェア約90%を誇り、現在も臨床・研究の両分野で主流です。フローセル上でのブリッジPCRによりクラスターを形成し、可逆性蛍光ヌクレオチドを1塩基ずつ取り込ませながら配列を読み取るSBS法を採用しています。1回の実行で数億〜数十億リードを高精度(Q31、99.92%)で取得できるため、全ゲノムシーケンス(WGS)・全エクソームシーケンス(WES)・RNA-Seqなど幅広い用途をカバーします。欠点はリード長が150〜300bp程度と短いことで、反復配列の多い領域の解析やde novoアセンブリには不向きです。また、シーケンス反応が進むにつれてバックグラウンド蛍光が増加するため、リード末端に向かいエラー率が上昇します。


🟢 PacBio(SMRT法):長さと精度を両立するHiFiリード


Pacific Biosciences社のSMRT(Single Molecule Real-Time)法は、ZMW(ゼロモード導波路)と呼ばれる直径数十nmのナノウェルの底にDNAポリメラーゼを固定し、環状化したSMRTbell型ライブラリを繰り返し読み取る方式です。同一分子を複数回通読することで得られるCCS(Circular Consensus Sequencing)リードは「HiFiリード」と呼ばれ、Q33(99.95%)という高精度を維持しながらリード長15kb前後を実現します。Illuminaが苦手とする繰り返し領域・構造変異の検出、エピゲノム(DNA修飾)の直接検出に強みがあります。課題はスループットの低さとコストの高さです。ロングリードが必要な難治性遺伝疾患の診断などで有用性が注目されています。


🟡 ナノポア(Oxford Nanopore Technologies):現場対応型のリアルタイム解析


Oxford Nanopore Technologies(ONT)社のナノポアシーケンサーは、タンパク質ナノポアに電圧をかけたイオン電流中にDNA/RNA鎖を通過させ、各ヌクレオチドが生み出す電流変化のパターンで塩基を識別する、まったく新しい原理に基づきます。DNAポリメラーゼを一切使わない点が他の方式と大きく異なります。最大の特徴は、1Mb(100万塩基)を超える超ロングリード取得が可能な点と、MinIONという手のひらサイズの小型装置でリアルタイム解析ができる点です。感染症アウトブレイク時の現場検出など「オフサイト検査」への応用が期待されています。一方で読み取り精度は現在Q21(99.26%)程度と他より低く、エラー率が高いためディープシーケンシングやバリアント解析では補正処理が不可欠です。


これが原則です。「精度最優先ならIllumina」「繰り返し領域・構造変異ならPacBio」「現場対応・超ロングリードならナノポア」という使い分けが基本です。臨床現場でのプラットフォーム選択は解析目的と予算・ターンアラウンドタイムの3点を軸に検討します。



  • 🔵 Illumina:高精度・高スループット・低コスト(リード短め)→ WGS、WES、RNA-Seq、がん遺伝子パネル

  • 🟢 PacBio HiFi:超高精度・ロングリード(コスト高め)→ 難治性遺伝疾患、構造変異、繰り返し領域

  • 🟡 Nanopore:超ロングリード・小型・リアルタイム(精度低め)→ 感染症現場検査、エピゲノム直接検出


参考:NGSの種類別の特徴と臨床応用先の選択基準が実例付きで解説されています。


次世代シーケンサー(NGS)とは|OlvTools


次世代シーケンシングの原理を活かした臨床応用:がんゲノム医療・感染症・希少疾患

NGSが医療現場に本格的に持ち込まれた最大のきっかけは、2019年6月のがん遺伝子パネル検査の保険適用です。それまでは研究ツールの位置付けが強かったNGSが、臨床診断のインフラとして認められた歴史的転換点でした。


🎯 がんゲノム医療への応用


がん遺伝子パネル検査では、1回の検査で数十〜数百の遺伝子を網羅的に解析し、一塩基変異(SNV)・挿入欠失(InDel)・コピー数変異(CNV)・転座などの異常を一括検出します。従来の「コンパニオン診断」が特定遺伝子の異常を一本釣りで確認していたのに対し、パネル検査は地引き網のように幅広い変異を拾い上げます。この検査の費用は、診療報酬上で検査実施時44,000点、エキスパートパネルの患者提供時に12,000点、合計56,000点(3割負担で約16万8,000円)が算定されます。対象は、標準治療が終了または終了見込みの固形がん患者、標準治療がない希少がん・原発不明がんの患者などに限られています。


しかし、検査を受けても実際に治療薬が見つかる患者さんの割合は約10%前後と言われています。「検査で何も見つからない」ケースが多いことを、医療従事者として患者に事前に説明しておくことが極めて重要です。それでも、見つかった変異情報は将来の研究や新薬開発に活用されるなど、医学全体への貢献という意義もあります。


🦠 感染症診断への応用


メタゲノム解析(mNGS)を用いることで、従来の培養法では特定困難な起因微生物を網羅的に同定できます。特に培養陰性の難治性感染症、新興感染症、中枢神経系感染症などにおいて有用性が高まっています。ナノポアシーケンサーの小型・リアルタイム解析の特性は、アウトブレイク発生時の現場診断に理想的であり、COVID-19パンデミックではウイルスゲノムの変異追跡にも活用されました。


🧬 希少・難治性疾患の遺伝子診断


全エクソームシーケンス(WES)は、ゲノム全体のうちタンパク質をコードするエクソン領域(全体の約1.5%)に絞った解析で、全ゲノム解析より低コストで重要な変異を検出できます。疾患を引き起こす変異の多くはエクソン領域に集中しているためです。現在、日本では201疾患(2023年12月時点)の指定難病診断に保険適用の遺伝子検査が整備されています。この拡充もNGS普及の恩恵のひとつです。


参考:がん遺伝子パネル検査の保険適用・費用・対象条件が患者視点でまとめられています。


がんゲノム医療で活躍している次世代シーケンサーとは|オンコロ


次世代シーケンシングの原理でつまずく「被覆度・エラー・品質スコア」の正しい理解

NGSデータを臨床判断に用いる上で、データ品質の評価指標を正確に理解しておくことは必須です。ここで見落とされやすい重要な概念を整理します。


📊 Qスコア(クオリティスコア)


各塩基の読み取り精度を対数スケールで表したのがQスコアです。次のように計算されます。


$$Q = -10 \times \log_{10}(P)$$


$$\text{Q20} = \text{エラー率} \frac{1}{100} = \text{精度}99\%$$


$$\text{Q30} = \text{エラー率} \frac{1}{1000} = \text{精度}99.9\%$$


臨床品質の基準としてQ30以上が求められます。IlluminaシーケンサーはQ31(99.92%)が標準的な出力精度です。


🔁 被覆度(カバレッジ)とディープシーケンシング


同一ゲノム領域が何回読み取られたかを示す指標が被覆度です。一般的なWGSでは30×(30回被覆)以上が推奨されます。がん細胞では腫瘍組織内にクローン多様性があり、低頻度で存在する変異を検出するためには100×〜1000×のディープシーケンシングが必要になる場面もあります。がん遺伝子パネル検査では通常500×以上が設定されることが多いです。


⚠️ プラットフォーム固有のエラーパターン


各プラットフォームには固有のエラー癖があります。Illuminaでは同一塩基が6個以上連続するホモポリマー配列でエラー率が上昇しやすく、ナノポアでは読み取りサイクルの進行に伴い精度が変動します。PacBioの生リードは13〜15%というエラー率がありますが、CCSモードで同一分子を繰り返し読むことで99.95%まで精度を高められます。これはエラー率が高い点です。


つまりエラーの種類と発生文脈を知った上でデータを解釈することが重要です。同一領域で複数の独立リードが同一変異を支持しているかを確認する「バリアント支持リード数」の確認が、臨床判断における基本中の基本です。


また、NGSは腫瘍組織のFFPEサンプル(ホルマリン固定パラフィン包埋)でも解析可能ですが、ホルマリン固定による人工的な核酸損傷がシーケンスエラーとして現れることがあります。FFPE由来のアーチファクトと真の体細胞変異を区別するために、正常組織との対比解析(腫瘍・正常ペア解析)が推奨される場合があります。これは臨床現場で見落とされやすい点なので注意が必要です。


医療従事者が知っておくべきNGS原理の独自視点:「読まれない」ゲノム領域と医療判断への影響

NGSは「全ゲノムを完全に読める」と思われがちですが、これは正確ではありません。現在最も広く使われているIlluminaのショートリード(150〜300bp)では、ゲノムの特定領域が系統的に読み取れないか、著しく精度が低下することが知られています。医療従事者がこの限界を理解していないと、「異常なし」という報告が実は「読めなかった」を意味している可能性を見落とすリスクがあります。


読み取り困難な主な領域:



  • テロメア・セントロメア領域:高度な反復配列で構成されており、ショートリードでは参照ゲノムへのマッピングが困難です。

  • セグメント重複領域:ゲノム内に非常に似た配列が複数存在するため、どの領域由来のリードか特定できないリードが生じます。

  • ホモポリマー(同一塩基の連続):AAAAAやGGGGGのような同一塩基が連続する領域はパイロシーケンシングやナノポアでエラーが増加します。

  • GCリッチ・ATリッチ領域:DNA増幅(PCR)の偏りが大きく、被覆度が著しく不均一になりやすいです。


このような「読めない・読みにくい領域」に病的変異が存在する可能性が否定できない場合には、ロングリードシーケンサー(PacBio HiFiやNanopore)との組み合わせが有効な選択肢になります。実際に、難治性てんかんや筋疾患の原因遺伝子領域には反復配列が関与するケースがあり、WESでは検出できなかった変異がロングリード解析で初めて同定された事例が報告されています。


さらに医療現場で注目されているのが「液体生検(リキッドバイオプシー)」との組み合わせです。血液中を循環するがん由来DNA(ctDNA)をNGSで解析することで、腫瘍組織の採取なしにがんの遺伝子情報を取得できます。ただし、ctDNAの濃度は非常に低い(通常1%未満)ため、500×〜1000×以上のディープシーケンシングと専用のエラー補正アルゴリズム(UMI:Unique Molecular Identifierの付与など)が必要です。「血液一滴でがんが分かる」は現時点では誤解であり、実際には適切な採血量の確保と高度な技術的補正が不可欠です。


NGSのデータを臨床に活かすためには、バイオインフォマティクス解析の結果レポートを読み解く基礎リテラシーが医療従事者にも求められるようになってきています。検査結果に記載される「Variant Allele Frequency(VAF)」「読み取り深度」「フィルタリング基準」などの指標の意味を理解した上で診療に用いることが、精度の高い医療判断につながります。この知識が条件です。


参考:NGSの品質管理指標(Qスコア・クオリティフィルタリング)の詳細が解説されています。


シーケンスクオリティースコア|Illumina