リーフェ・パーヘ=クリスティアーエンス、ハンスゲオルク・クライン編 『非侵襲的出生前遺伝学的検査(NIPT)(副題:出生前検査・診断へのゲノミクスの応用)』(アカデミックス・プレス、2018年)の第2章の論文の翻訳(ヒロクリニックNIPT仮訳)
第2章 NIPTの枠組みで「次世代シークエンス」の基礎を理解する
南サンフランシスコ大学 デール・ミュゼイ
はじめに:シークエンシング技術の進化
「次世代シークエンシング」(NGS)という用語を聞くと、「第一世代のシークエンシング」はどのようなものであったか、またNGSは第一世代とどこが似ていて、どこが違うか、といった疑問が湧く。サンガーは1970年代に第一世代DNAシークエンシングの開発を進めた(参考文献1,2)。彼の名を有名にしたシークエンシングの方法は、体外で細胞増殖機を使い、拡張できないDNA塩基をうまく拡張させるというものである。こうして変更を加えられた塩基は、一定の物質が最小限度、絡んで反応が生じている状況下で、低濃度で加えられる。具体的には、(1)高濃度の、拡張可能な塩基、(2)これからシークエンスされる、一本鎖のDNA、(3)DNAテンプレートに相補的な役割をする、短いオリゴヌクレオチドのプライマー(テンプレート上には、新しい塩基が合成することがある)、および(4)拡張反応を差配するDNAポリマー酵素の4種類である。サンガーが行った初期のシークエンシング実験では、これら4種類の反応がそれぞれ独立して生じ、個々には拡張不能な、単一の塩基(A(アデニン)、T(チミン)、G(グアニン)またはC(シトシン))が含まれる形であった。ポリメラーゼが、拡張不能な塩基の一つを発生段階のDNA分子にランダムに合成させるとき(例えば、発生段階にある拡張不能なGが、反対側はDNAテンプレートにあるCと合成する場合など)は常に、それ以上は合成を止めようとするため、首部分のないテンプレートが再生されることとなる。ここで極めて大事なことは、発生段階の鎖はすべて、同じオリゴヌクレオチドのプライマーから据え着いて広がっていくため、拡張がどの段階で止まるか、そしてその結果、発生段階のDNA鎖がどの程度の長さになるかは、当該分子の3’末端の基盤の直接の代理変数になることである。4つの反応の一つずつで、合成を止めた分子の長さを分析するために用いる電子泳動用ゲルを使えば、テンプレート全体の配列を推論することが可能である。
サンガー式シークエンシングは、独特の顔料を施した拡張不能の基盤を導入したことで、わずかながら計測がより可能になった(図1)。4つの反応に仕切りを入れて、基盤特有の情報を入手するよりも、毛細管電気泳動器は蛍光顔料検知器と組み合わせると、DNA断片の相対的な大きさと拡張が停止した基盤の正体の両方を分析することができた(文献3~5)。計測不可であることを理由にこれらの機器を批判するのは、それがもたらした、決して小さくない成果の一つを見落とすことになる。つまり、これらの機器こそ、1990年代、初期の人間ゲノム配列を進めた機器であったことだ(文献6~9)。とは言え、数十億ドルもの費用と数年単位の時間がかかる状態を考えると、大きな技術的跳躍でもない限り、ゲノム・シークエンシングは臨床現場では、ほぼ全く使えない状態が続くと思われる。
次世代シークエンシング(NGS)はサンガー式に見られた多くの技術的限界を克服し、ゲノム・シークエンシングに革命をもたらしたが(文献10)、それでもNGSで最も知れ渡った方法論は、その多くが過去の技術と共有するものから成っている。後ほど詳述するように、次世代シークエンシングは拡張停止と蛍光基盤にも影響するが、その際はDNAポリメラーゼの単一基盤を発生段階のDNA分子に一度で付着させる機能に依存している。実際に次世代シークエンシングの実験は多くの点で、サンガー式反応を数百万とか数十億のレベルで、同時並行で実施するようなものである(このため、次世代シークエンシングには「巨大な同時並行配列」という別称がある)。
次世代シークエンシングの役割
次世代シークエンシングの装置は、DNA分子の特殊製作したライブラリーを蒸留して、長いテキストファイルの配列にしていく役割をしている。テキストファイルは、配列された各分子ごとに一本の線となっている。次世代シークエンサーで、分子からテキストファイルにマッピングする作業は、ブロッコリーを用いたRNAシケンシング(文献11)から、リボソム・プロファイリング(リボゾームが付加されたmRNA断片をディープシケンシングする手法。文献12)、そして妊婦を対象にNIPT検査で行うDNAシークエンシング(文献13)まで、様々な研究や臨床現場にわたって展開されている。こうした次世代シークエンシングの応用例は、「ライブラリー調製」と呼ばれる、DNAの上流をシークエンサーに注入する手法の種類によって、大きく分かれる。上流部門での調製が様々分かれているのを映し出すと、下流部門での実例を広く比較分析することになるが、その一つが3章で詳しく取り上げるNIPTで用いられて分析手法である。本章では、次世代シークエンシングで用いられる各機器のDNAの配列方法を説明することに加え、NIPTに絞って、上流から下流部門にかけて、いかなるシークエンシング事業があるかを見ていく。
上流部門のシークエンサー
DNAの抽出
無細胞DNAは、その名の通り血液細胞には存在せず、血漿から抽出しなければならない。無細胞DNAの断片は死亡した細胞の残骸である(文献14)。細胞がプログラム化された死を迎えると(これを「アポトーシス」という。)、一組の酵素が合体し、それによりゲノムDNAを消化する(文献15)。こうした酵素は、ヌクレオソームに閉じ込められていないDNAにしかアクセスできない。ヌクレオソームは、細胞内の遺伝子発現とゲノム・トポロジーをコントロールするヒストン8量体から構成されている(文献17)。ヌクレオソームDNAにアクセスできないということは、ヌクレオソーム内を回流している150ヌクレオチド未満のDNA断片はアポトーシス過程中、生存していることを意味し、かつ死にかけた細胞から脱出したDNA断片が無細胞DNAを形成し、それがシークエンシングされて、後で詳しく述べる次世代シークエンシングリード(読み取り断片。シークエンシング反応での出力のこと:梅澤)と呼ばれるものを出力することを意味する。
血漿から無細胞DNAを抽出するには、まず血液を遠心分離機にかけて、血漿とバフィーコート(血液の白色細胞が含まれている)、赤血球に分離させる必要がある。血液全体のおよそ55%が血漿である。遠心分離機から血漿を取り出す際には、バフィーコートを慎重に取り除くようにする必要がある。これは、白色血液細胞中に占める母体DNAの濃度が高すぎると、胎盤から取った、希少な無細胞DNAが薄まり、胎児の異数性を検出する感度が弱まるか、完全になくなってしまうためである。
商業ベースの、標準的なDNA抽出技術を用いれば、血漿サンプルから取り出した、分析の実施に十分な量の無細胞DNAを清浄することが可能である(文献18、19)。通常、血漿に含まれる濃縮無細胞DNAの量は1ml当たり、わずか5~50ng程度だが、血漿中の無細胞DNAのこの低量が注目されるのは、これが基準になって、無細胞DNAに基づく出生前診断の際の必要血液量の下限値が確定している。血液量が少なすぎてDNAの抽出量が不十分であると、抽出された検体に含まれるゲノムのコピー数が少ないために、胎児の遺伝子量にわずかな変化があっても検出できないかもしれない。例えば、抽出検体にゲノムのコピーが10あったとした場合、21番遺伝子の量の2%の変化は、検出できそうにない。逆に効率的な抽出法があれば、胎児ゲノム断片が低量であっても、胎児の染色体異常を検出できるだけの十分なゲノム相当物を取り出すことができることとなる。DNA抽出で取り出すべきゲノム相当物の数は、その後行うNIPT検査によって異なる。全染色体シークエンシング(WGS)の場合、血液のどの部分であっても、無細胞DNAの必要数は極めて少ないため、患者から抜き取る血液量は非常に低量で足りる(文献13)。このため、血液検体1本から複数回、DNA抽出をしようとすることも可能である。これと対比すると、一塩基多型法(SNP)などの注目された技術は、特定の領域ごとに数百のゲノム相当物を必要とし、それによって対立因子のバランスが高い精度で測定されることとなる(WGSとSNPについては第3章で詳しく述べる)(文献20)。このため、SNPのためのNPIT検査で必要となる血液量は、通常WGSの場合より多くなる。
無細胞DNAの濃度は非常に低いので、NIPTを実施するのに十分な無細胞DNAが抽出できたかどうか、測定することは些細なことではない。通常DNAの抽出量は、次世代シークエンシングを行う前にPCR(?)を行うことで増量できる。つまり、抽出が非効率であっても、シークエンシング用に多量のDNAを生み出すことは可能である。ということは、抽出が非効率であったかどうかは、次世代シークエンシングの深さを反映したものではない、ということである。幸い、シークエンシングするデータの「複雑さ」から、抽出が非効率であるかどうか、見抜くことができる。たとえば、WGSの場合には、効率的に抽出をすれば、ゲノム上は0または1個(大抵は0)が配列したDNA断片になる。それは、シークエンシングが、ゲノム情報統合型物質を豊富に含む、元のプールからのポアソン・サンプルであるからである(文献21)。しかし、抽出の非効率さに加えて、もしゲノム情報統合型物質の元のプールが薄かったりすると、DNA断片は染色体上に0か1未満の確率で置かれるため、結果として複雑さの低いデータとなってしまう。逆に抽出が極めて効率的であれば、シークエンシングに必要な、十分なDNAを生むためにPCRが必要とはされないかもしれない。こうした「PCRのない」ライブラリーの準備では、ライブラリーの複雑さが高くなるものと思われる。胎児の異数性のデータが統計的に有意になるよう、データを使っての次世代シークエンシングの複雑さを観察することが重要である。
ライブラリーの準備
NGS(次世代シークエンシング)の機械
結論
NGS(次世代シークエンシング)がNIPTアプリとして特に適しているのは、些細ではあるが明確な理由、そして余り意識されてない理由の2つの理由からである。明確な理由としては、NGSはデジタルの、ヌクレオチドレベルのデータを提供することで、深さと対立遺伝子に基づくNIPTの作業フローが実行可能となります。NIPTの作業フローでは、無細胞DNAの断片を突き止め、その量を測定することが必要となっている(第3章でさらに詳しく論じる)。極めて重要なことは、NGSで用いる機器は、こうしたデータを簡単にすばやく生み出すことができる点で、これに助けられてNIPTは検査機関、検査受検者、患者の制約条件を解決している。
一方、余り意識されていない理由の関連では、NGSは一方で、胎盤に由来する無細胞DNAに関連性のあるシグナルを捕捉している点がある。例えば、断片の一対を測定するNGSでは断片の長さを測定するが、胎盤由来の断片の方が、母体由来の断片に比べて一般に短い。また、胎児由来の断片はDNAメチル化する特徴があり、これは亜硫酸水素塩を施すと、その後、NGSで検出が可能となる(文献36:メチル化c塩基は変わらないが、非メチル化c塩基が亜硫酸水素塩に反応してウラシルに変換する(その配列はチミン塩基に似ている)。)最後にNGSは、単一ヌクレオチド決定の際に、無細胞DNA断片の末端の位置を確認・報告するが、この末端情報には、胎盤の重要なシグナルが含まれている。というのは、無細胞DNA断片の末端の位置を決定するに当たって、母体のヌクレオソームと胎盤のヌクレオソームの位置は、構造的に異なっているためである(文献37)。こうした胎盤のシグナルを抽出し、増幅する分析アルゴリズムによって、胎児の染色体異常を敏感に捕捉することは可能である。
無細胞DNAに基づくNIPT検査は、現在、急速に出生前臨床診断のお決まりコ-スになりつつある。これは主として、NGSが無細胞DNAの状況を読み、数を数える手段として成熟しつつあることによる。臨床の現場でNIPTがこれほどまでに広く採用されるようになると、経費を削減する技術開発を刺激するとともに、大規模なデータを生み出し、それによって一層繊細な、胎盤に限定したシグナルの発見につながっていく。かくして、無細胞DNAの計量化と理論化を図る動きは、今後とも着実に急速な発展を続け、そうした改善によって無細胞DNAに基づくNIPTの結果は向上するとともに、より幅広い人に利用されるようになる。
翻訳:梅澤眞一