Precision health, Population genomics, 製品

英国がゲノム研究とより良いヘルスケアの新しい基準をどのように設定しているか

UK Biobankは極めて大規模なコホートをシーケンスし、イルミナは解析の提供を支援

英国がゲノム研究とより良いヘルスケアの新しい基準をどのように設定しているか
Photo: Marc Dufresne
2023年12月4日

先週、UK Biobankは50万のサンプルのシーケンス解析を、学界、業界、慈善団体、政府全体の承認研究者に発表しました。このマイルストーンは、創薬やその他の生物医学の開発においてサイエンティストに大きく役立つと専門家は考えています。

イルミナのソフトウェアとインフォマティクスの責任者であるRami Mehio氏は、表現型データと一致する全ゲノムシーケンスデータへのアクセスを可能にするという点で、このプロジェクトは根本的に重要なプロジェクトであると述べています。

2006年、UK Biobankは、英国に住む50万人の人々を対象に、疾患の環境、ライフスタイル、および遺伝的相関を理解する研究を行うことを発表しました。がん、心血管疾患、認知症、糖尿病などの疾患はこの期間に発症する傾向があるため、40~69歳の参加者を募集しました。

4年以内に、研究は50万人の同意患者を登録し、2012年には生物医学データベースを立ち上げました。その後、2018年にUK Biobankは、これらの50万人の患者の全ゲノムをシーケンスする主要なイニシアチブを発表しました。

英国バイオバンクの副最高経営責任者であるMark Effingham博士は、この規模の全ゲノムシーケンスには、正確で高感度なテクノロジーが必要であり、当時英国バイオバンクはイルミナを優先テクノロジーパートナーとして採用しました。

全ゲノムシーケンス(WGS)は、アイスランドのdeCODE Geneticsと英国のWellcome Sanger InstituteのイルミナNovaSeq 6000シーケンスシステムで実施されました。

シーケンスが完了した後、業界をリードする製薬会社であるAmgen、AstraZeneca、GSK、Johnson & Johnsonが、イルミナと協力してデータを分析するという野心的なプログラムへの資金提供を支援した業界コンソーシアム。この最初のステップでは、効率と精度で知られるDRAGENの生殖細胞系列パイプラインを使用しました。彼らは、将来のデータのクロス解析を目的として、他の大規模集団ゲノミクスイニシアチブで使用されるものと一致するDRAGENパイプラインバージョンを選択しました。その他の大規模なイニシアチブには、シンガポールのPRECISEプログラム、英国のゲノミクスイングランド、米国国立衛生研究所のAll of Us Researchプログラム、およびAlliance for Genomic DiscoveryであるNashville Biosciencesが率いるものがあります。

“全ゲノムのゲノム解析は計算にかなり集中しており、このような規模では、速度、精度、信頼性、コストはすべてパイプラインの選択において重要な要素です”とMehio氏は述べています。2番目のステップでは、コンソーシアムはイルミナのConnected Analytics(ICA)クラウドプラットフォームにデプロイされたDRAGEN共同通話ソリューションを使用してコホートを集約するようイルミナに依頼しました。

研究者にとってこのデータを有用にするには、個々のサンプルを解析するだけでは不十分です。これらのサンプルを集合コホートとして提示する必要があります。

イルミナの受賞歴のあるDRAGEN二次解析は、バリアントのサンプルの最も正確なマイニングに理想的なツールであり、DRAGENアグリゲーションはそれを単一の遺伝子データセットに変換しました。

“これはおそらく現時点で世界最大の全ゲノムシーケンスの集約です。” Mehioは引き続き、ICAのDRAGEN共同コールソリューションは、数十万のサンプルに拡張され、N+1の問題を解決します。したがって、コホートにさらに10,000個のサンプルを追加しても、ユーザーは最初からジョイントコールを再開する必要はありません。

DRAGENアルゴリズムにより、50万ゲノムから約15億の驚異的なバリアントを同定できるようになりました。

Amazon Web ServicesまたはAWSでホストされている当社のICAインフラストラクチャは、大規模なコホート集約をスケーリングしサポートする能力がユニークであるとMehio氏は述べています。複数の集団レベルのプロジェクトで同様の集計を完了しました。このプラットフォームは大規模なコンピューティングが可能で、研究者は豊富なデータセットをマイニングし、共同作業を行うことができます。このプラットフォームには、最も人気のあるツール、そしてもちろん、主要なDRAGENパイプラインがすべて揃っています。イルミナは、シーケンスと解析を可能にするだけでなく、世界中の追加データから、研究者が健康と疾患の遺伝学についてより詳しく知る能力を拡大しています。

“UK Biobankと協力して、これらの大規模コホートのゲノムデータを解析するテクノロジーを探ります。これにより、研究者はモデルを改良し、創薬ターゲットとポリジェニックリスクスコアをより正確に把握するためのさらに多くの統計データを得ることができます。”とMehio氏は説明します。

このように膨大なデータセットは貴重な洞察を約束します、とEffingham氏は述べています。遺伝子が創薬をどのように前進させ、何よりも患者の健康と幸福をどのように改善できるかを研究者が理解するのに役立ちます。