2023年12月4日
2025年9月23日更新:Nature誌の2025年9月18日号で発表された画期的な研究では、DRAGENとDRAGEN Iterative gVCF Genotyper(IGG)が英国BioBankの全ゲノム490,640の共同解析を可能にし、祖先全体で15億のバリアントを発見し、これまでにない規模とスピードでプレシジョンメディシンを進歩させたことが強調されています。
先週、UK Biobankは50万検体のシーケンス解析を、学界、業界、慈善団体、政府全体の承認済み研究者に発表しました。このマイルストーンは、創薬やその他の生物医学の開発においてサイエンティストに大いに役立つと専門家は考えています。
イルミナのソフトウェアおよびインフォマティクスの責任者Rami Mehioは、「表現型データにマッチした全ゲノムシーケンスデータに大規模にアクセスできるという点で、このプロジェクトは根本的に重要なプロジェクトである」と述べています。
2006年、UK Biobankは、英国の住民50万人を対象に、疾患の環境、ライフスタイル、および遺伝的相関を理解するという研究目標を発表しました。同社は40~69歳の参加者を募集しました。これは、がん、心血管疾患、認知症、糖尿病などの疾患がこの年代で発症する傾向があるためです。
4年以内に、この研究に同意した50万人の患者を登録し、2012年には生物医学データベースを立ち上げました。その後、2018年にUK Biobankは、これらの50万人の患者の全ゲノムをシーケンスする大規模なイニシアチブを発表しました。
UK BioBankの副最高経営責任者Mark Effingham PhDは、「この規模の全ゲノムシーケンスには、正確で高感度なテクノロジーが必要である」とし、当時のUK BioBankはイルミナを優先的テクノロジーパートナーとして起用しました。
全ゲノムシーケンス(WGS)は、アイスランドのdeCODE Geneticsと英国のWellcome Sanger InstituteのIllumina NovaSeq 6000シーケンスシステムで実施されました。
シーケンスが完了した後、野心的なプログラムに資金を提供した業界をリードする製薬会社Amgen、AstraZeneca、GSK、Johnson & Johnsonで構成される業界コンソーシアムが、イルミナと協力してデータを分析しました。この最初のステップでは、効率と精度で知られるDRAGENの生殖細胞系列パイプラインを使用しました。彼らは、将来のデータの相互解析を目的として、他の大規模集団ゲノミクスイニシアチブで使用されるものと一致するDRAGENパイプラインバージョンを選択しました。その他の大規模なイニシアチブには、シンガポールのPRECISEプログラム、英国のGenomics England、米国国立衛生研究所のAll of Us Researchプログラム、およびNashville Biosciencesが率いるAlliance for Genomic Discoveryがあります。
「全ゲノム解析は計算にかなり集中しており、このような規模では、速度、精度、信頼性、コストはすべてパイプラインの選択において重要な要素です」とMehioは言います。2番目のステップでは、コンソーシアムはIllumina Connected Analytics(ICA)クラウドプラットフォームにデプロイされたDRAGENジョイントコーリングソリューションを使用してコホートを集約するようイルミナに依頼しました。
「研究者にとってこのデータを有用にするには、個々のサンプルを解析するだけでは不十分です。これらのサンプルを集約コホートとして提示する必要があります。」とMehioは言います。
イルミナの受賞歴のあるDRAGEN二次解析は、バリアントのサンプルの最も正確なマイニングに理想的なツールであり、DRAGENアグリゲーションはそれを単一の遺伝子データセットに変換しました。
「これはおそらく現時点で世界最大の全ゲノムシーケンスの集約です。」と Mehioは続けます。「ICAのDRAGENジョイントコーリングソリューションは、数十万のサンプルに拡張され、N+1問題を解決します。したがって、コホートにさらに10,000検体を追加しても、ユーザーは最初からジョイントコーリングを再開する必要はありません。」
「DRAGENアルゴリズムにより、50万ゲノムから約15億の驚異的なバリアントを同定できるようになりました。」とEffinghamは付け加えます。
「Amazon Web Services(AWS)でホストされている当社のICAインフラストラクチャーは、大規模なコホート集約をスケーリングしサポートする能力がユニークです」とMehioは言います。「複数の集団レベルのプロジェクトで同様の集約を完了しました。このプラットフォームは大規模なコンピューティングが可能で、研究者らは豊富なデータセットをマイニングし、共同作業を行うことができます。このプラットフォームには、最も人気のあるツール、そしてもちろん主要なDRAGENパイプラインがすべて揃っています。イルミナは、シーケンスと解析を可能にするだけでなく、世界中の追加データから、研究者が健康と疾患の遺伝学についてより深く理解する能力を拡大しています。
「UK Biobankと協力して、これらの大規模コホート全体のゲノムデータを解析するテクノロジーを探ります。これにより、研究者らはモデルを改良し、創薬ターゲットとポリジェニックリスクスコアをより正確に把握するためのさらに多くの統計データを得ることができます。」とMehioは説明します。
「このように膨大なデータセットは貴重な洞察を約束するものです」とEffinghamは言います。「研究者らは、遺伝子が創薬をどのように前進させ、最も重要な点として患者の健康と幸福をどのように改善できるか理解を深めることができるでしょう。」


