セルフリーDNAにおけるがんドライバー遺伝子発現の手がかりの探索
はじめに
ヌクレオソームは、DNAパッケージの小型でエレガントな部分です。長い遺伝子ネックレスのビーズのように、各ヌクレオソームにはDNAの小さなターニングセクションが含まれており、ヒストンと呼ばれる8つの特殊なタンパク質に巻かれています。その結果、ヌクレオソームはそれよりもはるかに多く含まれている可能性があります。どの遺伝子が転移性がんを駆り立てているかの手がかりとなる可能性があります。
2016年、ワシントン大学のチームは、健康な人のセルフリーDNA(cfDNA)におけるヌクレオソーム占有率のマップを解析しました。1 これらのin vivo占有率マップは、単一細胞で見られる発現の構造と構成と高い相関関係を示しました。これは、起源の組織からヌクレオソームにエピジェネティックなフットプリントが存在する可能性を示唆しています。研究著者らは、このようなフットプリントは、他に明らかな遺伝子型の違いがない場合に、疾患に寄与するさまざまな細胞タイプを決定するために使用できると主張しました。cfDNAに存在するヌクレオソームの研究は、リキッドバイオプシーなどの非侵襲的スクリーニングを使用してがんを検出する新しい方法を提供する可能性もあります。
同時に、グラツ医科大学のヒト遺伝学研究所のMichael Speicher教授の研究室のチームも、cfDNAにどのような生物学的に関連性のある情報があるかを調査していました。cfDNAはヌクレオソームで保護されたDNAであるため、cfDNAの包装方法に機能データがあるかどうかに焦点を合わせました。これらは正しいことで、転写開始部位におけるヌクレオソーム占有のパターンが、がんドライバー遺伝子の発現を推測するための情報を提供することを示しています。2
iCommunityは、Speicher教授の同僚である、がん研究ユニットにおける個別化医学の液体生検責任者であるEllen Heitzer博士と、バイオインフォマティクス学者であるPeter Ulz, MScと話をしました。研究者らは、ヌクレオソーム研究について、またアルゴリズムを用いて解析されたリキッドバイオプシーデータがどのように研究者にがんの進行と治療反応に関する重要な情報を提供するかについて議論しました。
Ellen Heitzer博士は、がん研究ユニットの個別化医療のための液体生検の責任者であり、Peter Ulz博士は、グラツ医科大学のヒト遺伝学研究所のバイオインフォマティクスです。
Q:貴院の研究部門の疾患フォーカスは何ですか?
Peter Ulz(PU):当研究所には70人の従業員がおり、Michael Speicher教授が率いています。ほとんどのスタッフが遺伝性疾患のルーチン診断アッセイを実施していますが、さまざまなリキッドバイオプシーの応用についても研究を行っています。
Ellen Heitzer(EH):私の主な関心事はがん研究です。私は、家族性がん症候群の日常診断と、リキッドバイオプシーの遺伝子解析法に焦点を当てた研究の両方に携わっています。6年以上にわたり、血漿からがんゲノムを非侵襲的に縦断的にモニタリングできる手法に取り組んできました。
過去には、単一の循環腫瘍細胞を調べました。今ではctDNAの解析が好まれています。これは、単一の循環腫瘍細胞よりも、腫瘍をより包括的にカバーする優れたマーカーです。
Q:リキッドバイオプシーの価値は何ですか?
EH:従来の組織生検では、腫瘍の時期をスナップショットにすることができます。しかし、腫瘍がどのように変化したかを調べるために4週間ごとに組織生検を行うことは困難です。一方、液体生検は数週間ごとに簡単に行うことができます。その結果、リキッドバイオプシーにより、診断から治療反応、がんの再発まで、疾患の全過程で被験者を追跡することができます。
リキッドバイオプシーの研究分野はダイナミックで、当社は急速に進歩しています。
Q:バイオインフォマティクスの観点から、リキッドバイオプシーサンプルからDNAシーケンスデータを解析する際の課題は何ですか?
PU:多くの人は、シーケンスランからの膨大な量のデータを分析するのが難しいと感じています。小規模シーケンスを実施しているため、これはラボで最も難しい問題ではありません。私たちの課題は、ctDNAシーケンスから得られる非常に低いシグナルです。腫瘍の病期やその他のさまざまなパラメーターに応じて、正常細胞からのcfDNAは腫瘍由来DNAをはるかに上回る可能性があります。その過程で起こるバイアスを排除しながら、ごく少量のDNAやさらに小さな腫瘍分画から良好な情報を得ることは困難です。
Q:cfDNAの転写因子結合部位におけるヌクレオソーム占有率のパターンを研究するアイデアのきっかけとなったのは何ですか?
PU:cfDNAはヌクレオソームで保護されたDNAであるため、当初は、cfDNAの包装方法に隠されたリキッドバイオプシーサンプル内にはさらにいくつかの情報が必要であるというビジョンがありました。クロマチンリモデリングとMNase-Seqに関する複数の論文を読むと、3 cfDNAに適用できると考えました。低カバレッジ全ゲノムシーケンス(WGS)のデータがあり、遺伝子の発現の有無を示すシグナルタイプがあるかどうかを調べました。次に、100を超える対照のシーケンスデータを確認し、同様のシグナルがあるかどうかを調べました。これらの結果は有望であり、この研究の構築に利用しました。同じシグナルを利用して原産組織を推測したワシントン大学の研究は、さらに私たちの興奮を高めました。
"転写開始部位のヌクレオソームは、発現している遺伝子と発現していない遺伝子のカバレッジパターンが異なることがわかりました。"
Q:この新規手法に全エクソームシーケンス(WES)の代わりにWGSを使用した理由は何ですか?
PU:ヌクレオソーム占有率シグナルは転写部位の最初にあります。ほとんどのエクソームシーケンスキットは、最も高いシグナルを得る非翻訳領域ではなく、ゲノムのコーディング部分を濃縮します。エクソームエンリッチメント解析によって非翻訳領域が濃縮される場合でも、非翻訳領域の直前の部分は失われます。残念なことに、これは発現情報を見つけることができる領域です。
Q:研究の結果はどうでしたか?
PU:WGSを用いて、がん被験者の血漿中に存在するcfDNAを解析しました。遺伝子発現中、ヌクレオソームは転写開始部位で除去されます。細胞がアポトーシスを受けるとcfDNAが血流に放出されるため、このヌクレオソーム枯渇領域(NDR)は、ヒストンで保護されていないため、ヌクレアーゼによって優先的に消化されます。つまり、ヌクレオソームが除去されない不活性遺伝子のDNA断片は、活性遺伝子よりも循環血中に豊富にあります。転写開始部位のヌクレオソームは、発現している遺伝子と発現していない遺伝子に対して異なるカバレッジパターンを示すことを示しました。このパターンはシーケンスデータから確立できます。機械学習アルゴリズムを使用して、どの遺伝子が疾患を高精度に推進しているかを予測することができます。
この研究の最も興味深い側面は、この方法が健康な人やがんの被験者に効果があることです。どの遺伝子が発現しているかをかなり推測することができます。これまで、高カバレッジのがん被験者から2つのctDNAサンプルをシーケンスしてきました。データは有望に見え、この方法がより広範なサンプルにどのように適用可能か、また異なる腫瘍エンティティの詳細な解析に利用できるかどうかを検討しています。
Q:がんサンプルについてWGSから推測した発現結果をどのように確認しましたか?
PU:発現予測を確認するために、データを対応する原発腫瘍のRNA-Seqデータと比較しました。これらの領域はバランスの取れた領域と比較して比較的濃縮されており、循環血中で非常に高い腫瘍割合に達する可能性があるため、コピー数の増加が大きい領域に焦点を当てました。これらの領域からRNA-Seqデータを抽出し、遺伝子発現の予測アルゴリズムと比較しました。これらの予測は確認されました。現在、より感度の高い手法に改良を進めており、血漿中に見られるctDNAを用いてこれらの予測をより一般的に行うことができます。
"発現予測を確認するために、データを対応する原発腫瘍のRNA-Seqデータと比較しました。"
Q:データの解析にはどのソフトウェアを使用しますか?
PU:DNAアライメントにはBurrow-Wheeler Aligner(BWA)を使用し、転写開始部位周辺のカバレッジを調べるためにSAMToolsを使用するスクリプトもあります。遺伝子発現予測には、当社が開発したサポートベクターマシンに基づく機械学習アプローチを使用します。
Q:この治験の実施にあたり、どのような課題に直面しましたか?
PU:サンプルサイズとシーケンスコストは大きな課題でした。数百のサンプルと、低カバレッジWGSからの対応するデータセットがありますが、解析したい領域でのシーケンス深度が不足しているため、これらのデータは使用できませんでした。ローシグナルを補正するためにすべてをハイカバレッジでシーケンスする余裕がなかったため、この問題を解決するためにデータをマージしました。
Q:臨床現場へのメソッドの移行をサポートするには、どのような強化が必要ですか?
PU:当社の手法で得られる結果を不明瞭にする可能性のある問題があることがわかりました。例えば、高度に発現している遺伝子と発現していない遺伝子のヌクレオソーム構成には違いがあります。高い遺伝子発現の準備ができている遺伝子は、非常に厳格なヌクレオソーム構造を持ち、私たちの方法はこれらの遺伝子の発現を予測するのに成功しています。ヌクレオソームが厳密に組織化されていない遺伝子は評価が困難であり、当社のアルゴリズムでは、発現の有無にかかわらず、発現していないと予測することがよくあります。その結果、当社のアルゴリズムでは、現在サンプル中のすべての遺伝子の遺伝子発現を予測することはできません。この問題の是正に取り組んでいます。
また、この手法を臨床現場で適用するには、通常のアポトーシスプロセスで正常なDNAに信号が混入しているため、リキッドバイオプシーの腫瘍分画を増やす必要があります。本研究の2つのがんサンプルは、高い腫瘍割合を示しました。すべての被験者のサンプルで、このことが発見されるわけではありません。腫瘍分画が高いサンプルでも、過剰に見られ、コピー数の変化や増加がある領域に焦点を合わせる必要があります。現在、遺伝子が発現しているかどうかを予測できる領域は限られています。さらなる発見を願っています。
"遺伝子発現の予測には、当社が開発したサポートベクターマシンに基づく機械学習アプローチを使用します。"
Q:cfDNA遺伝子発現は、将来の病気の理解にどのように役立つでしょうか?
PU:サイエンティストは、腫瘍における遺伝子変異や変異を探しています。これにより、分子腫瘍学の飛躍的な進歩と治療反応の同定につながりました。しかし、一部の情報が不足しています。腫瘍における遺伝子発現の解析により、疾患や治療中にその腫瘍で起こっていることを追跡できると考えています。これによって、薬物ターゲットの同定や治療のモニタリングに利用できる全く新しい情報スペクトルが得られ、治療抵抗性の最初の兆候が現れた時にそれを捉えることができることを願っています。
EH:当社のアプローチのもう1つの利点は、コピー数解析を実行し、同じデータセットから発現データを抽出できることです。最近の研究では、前立腺がんの新規局所増幅の出現を報告しました。4 腫瘍ゲノムは、腫瘍の進行中に非常に動的です。将来的には、この局所増幅に存在する遺伝子が腫瘍で発現しているかどうか、そしてそれが疾患の進行や治療抵抗性の促進に関与しているかどうかを、私たちのアプローチが知ることができます。十分な腫瘍DNAがcfDNAに存在することを考えると、このアプローチはあらゆるタイプのがんに適用できると考えています。
"MiSeqとNextSeqのワークフローは簡単で、シーケンス速度が速く、時間を大幅に節約できます。"
Q:新しいマーカーが同定された場合、これらの研究の生データを使用して、異なる遺伝子発現レベルの存在を評価し、疾患進行を理解できますか?
PU:新たに同定されたマーカーが遺伝子の発現に基づいている場合、それらを組み込むことができます。当面は、コピー数の増加がある地域のマーカーに注目する必要があります。これにより、他の種類のマーカーの検索が制限される可能性があります。理論は、シグナルが十分に高く、腫瘍分画がかなりある場合、遺伝子に何らかの応答があったかどうかを調べることができるということです。今はそれに取り組んでいます。
Q:MiSeqシステムとNextSeqシステムはどのように研究を可能にしましたか?
EH:MiSeqとNextSeqのワークフローは簡単で、シーケンス速度が速く、時間を大幅に節約できます。血漿DNA抽出から最終結果まで2~3日でローカバレッジWGSを実施できます。どちらのシステムも高速なデータアクセスを提供しており、これは当社にとって大きな利点です。
Q:TruSeq ® Nano DNA Library Prep Kitを選んだ理由は何ですか?
EH:TruSeq Nano DNA Library Prep Kitはサンプルインプット量が少ないため、選択しました。素晴らしい結果が得られました。コピー数解析とWGSについては、このキットに満足しており、引き続き使用する予定です。
Q:研究の次のステップは何ですか?
PU:当社は、腫瘍DNAの割合が低いcfDNAで機能できるように、メソッドをより高感度にすることに重点を置いています。これにより、疾患経過の早い段階からサンプルを調べることができます。腫瘍に関する情報が早く得られるほど、治療決定に関する情報を得る可能性が高くなります。
EH:また、原発腫瘍とその成長を促進する遺伝子を事前に知らずに使用できる血漿DNAの他のマーカー、変異、コピー数の変化も解析しようとしています。私たちは、がん患者のモニタリングとスクリーニングに役立つ新しいマーカーを発見するために、通常の疑わしい変異を超えて他の情報を抽出しようとしています。バイオインフォマティクスの作業はかなりの量です。
"当社は、腫瘍DNAの割合が低いcfDNAで機能できるように、メソッドの感度を高めることに注力しています。これにより、疾患経過の早い段階からサンプルを調べることができます。"
Q:今後の研究でイルミナ製品を使用する予定はありますか?
PU:引き続きMiSeqシステム、NextSeqシステム、TruSeq Nano DNA Library Prep Kitを使用します。
現在、ターゲットエンリッチメントを行い、シグナルの少ない実験をダウンスケールすることでカバレッジニーズを減らすことで、少ないシーケンスデータでアプローチをテストしています。この目的のために、すでに一部のイルミナDNAエンリッチメントキットをテストしています。アプローチを最適化することで、既存のデータセットをすべて活用したいと考えています。
EH:また、ターゲットリシーケンスには、TruSeq Nano DNAとNextera ® Rapid Captureプロトコールの組み合わせも使用しています。また、イルミナのコンシェルジュプロジェクトも進行中で、固有の分子識別子を持つTruSeq Cancer Amplicon Kitを実行しています。私たちの研究がクリニックに移転することになるのであれば、既知の実行可能なターゲットに焦点を合わせる必要があります。これは、ゲノム全体の解析よりも効率的であり、適切な治療や患者が特定の治療に抵抗性を示す理由を決定します。
イルミナのシステムと製品の詳細については、こちらの記事をご覧ください。
参考文献
- Snyder MW, Kircher M, Hill AG, et al. セルフリーDNAは、生体内ヌクレオソームフットプリントを含み、その起源の組織を知らせます。セル。2016年、164:57~68歳。
- Ulz P, Thallinger GG, Auer M, et al. 血漿DNAの全ゲノムシーケンスによる発現遺伝子の推論。自然遺伝学。2016; 48: 1273-78.
- Valouev A, Johnson SM, Boyd SD, et al. 初代ヒト細胞におけるヌクレオソーム構成の決定因子。自然。2011; 474: 516~620。
- Ulz P, Belic J, Graf R, et al. 全ゲノム血漿シーケンスは、転移性前立腺がんの推進力として局所増幅を明らかにします。Nat Commun. 2016; 7: 12008, doi: 10.1038/incomms12008。