Leadership perspectives

イルミナはゲノムAIの業界をリード

イルミナはゲノムの未知の領域を解読する能力を実証

イルミナはゲノムAIの業界をリード
Photo by Illumina
2025年11月18日
著名なサイエンティストで人工知能担当バイスプレジデントのKyle Farh氏

ゲノミクスの歴史の大半において、最大の課題は、単にデータを取得することでした。最初のヒトリファレンスゲノムのマッピングには13年と数十億ドルを要しました。イルミナはテクノロジーの改良によって名声と評価を築いてきました。今では、かつてのコストのごく一部で、卓越した精度を保ちながら、数時間でゲノムをシーケンスできるようになりました。

業界では現在、毎年400億ギガバイトを超えるゲノムデータが生成されています。 問題は、もはやデータを取得することではなく、それを理解することです。リファレンスゲノムと比較すると、私たち一人一人には個人差を生み出す約400万の遺伝的バリアントが存在し、その99.9%の機能は不明です。壊滅的な遺伝性疾患は、1つの遺伝的バリアントというごく小さな違いによって引き起こされる可能性があることがわかっています。しかし、良性バリアントを病原性バリアントから選り分けるために、膨大な量のデータをどのように分類すればよいのでしょうか?

そのタスクは人間には手に負えないものです。ゲノム科学の次なる時代の鍵は人工知能(AI)です。

ここ数年でAIへの熱狂は最高潮に達しており、ChatGPTのような大規模言語モデルが広く採用されています。このようなアプリケーションは、公開されているあらゆる成果物のコーパスを基にして新たなテキストや画像、さらには動画まで生成するものであり、真に革命的であることは否定しがたいです。違いは、これらの人為的に作られた情報源は初めから高度に構造化されているという点です。ゲノムの生物学は桁違いに複雑です。

しかし、コードを解読することはできます。当社はすでにそれを行っています。

当社は先日、イルミナの新事業であるBioInsightを発表しました。これは、当社のソフトウェア、インフォマティクス、AI、ファーマデータパートナーシップ、および大規模な全国ゲノミクスイニシアチブチームを集め、大規模で包括的なデータソリューションに対する業界の需要を満たすものです。7年にわたり、そして今なお世界をリードするゲノムAIアルゴリズムを開発してきたこのビジネスのAI部門を、引き続き率いていけることを大変嬉しく思います。

これらのアルゴリズムは、ゲノム解析のワークフロー全体に適用されています。シーケンス中、品質管理のためにエラーを補正し、生のシグナルをデータに迅速に変換します。二次解析では、バリアントをより正確に検出します。しかし、これらのバリアントの意義を解釈し、疾患を引き起こす可能性のある少数のものに絞り込む三次解析においてこそ、当社の主力アルゴリズムが真価を発揮します。これは単に技術的な能力の問題ではありません。ゲノミクスAIが人間の健康にもたらし得る影響こそが重要なのです。

Splice AI、PrimateAI-3D、およびPromoterAI

2019年、当社はSpliceAIをリリースしました。このディープニューラルネットワークは、クリプティックスプライス変異を同定します。これは、それ自体はタンパク質をコードしませんが、タンパク質コード配列を指定するバリアントです。ゲノムの98%以上がノンコーディング領域ですが、ノンコーディングバリアントは依然として病原性がある可能性があるため、無視するのは危険です。スプライス部位のヌクレオチドから離れた位置に存在していても、これらのバリアントはmRNAスプライシングの正常なパターンを乱し、小児期の発達障害やがんの発症に関与することが知られています。当時の同等のサードパーティ製ツールでは、プレmRNA転写産物におけるスプライスジャンクションの予測精度は22~30%でしたが、 SpliceAIの予測精度は95%です。

私たちは、ヒトにおけるタンパク質コードバリアントの病原性を予測する最善の方法は、ヒトの枠を超えて見ることだと認識し、2023年にその成功に続く成果を示しました。

ホモ・サピエンスは、最も近い共通祖先が約6,000万年前に生息していたにもかかわらず、他の霊長類とDNA配列の90%以上が共通しています。イルミナでは、できるだけ多くの霊長類ゲノムを相互参照すれば、それらに共通するバリアントを見つけることができ、これらのシーケンスが自然選択で除去されていない場合、ヒトでも良性であると推測できると考えました。そして、これらの良性バリアントを除外することで、私たちが探している病原性バリアントに焦点を合わせることができます。

そこで、私たちはこれまでで最大規模の霊長類ゲノム解析に取り組み、世界中の16の科すべてから233種、合計で800を超える個体を対象にしました。このデータにより、当社の次のフラッグシップアルゴリズムであるPrimateAI-3Dは、進化そのものを学習する形で効果的にトレーニングされ、同年6月にPrimateAI-3Dに関する調査結果をScience誌に発表しました

最近では、この夏にPromoterAIを用いてノンコーディングゲノムの調査をさらに拡大しました。このディープラーニングモデルは、遺伝子転写の開始位置を定義し、RNAやタンパク質の産生を可能にする、遺伝子の前にある制御配列であるプロモーター領域内の病原性バリアントを検出します。

遺伝子のタンパク質コード配列にバリアントがない場合でも、その遺伝子のプロモーター領域に変異があると、適切に発現しなくなることがあります。実際、Science誌で発表した付随論文では、プロモーターセグメントが希少疾患の遺伝的原因の最大6%に寄与することがわかりました。しかし、同じ研究では 、PromoterAI、PrimateAI-3D、およびSpliceAIを併用することで、タンパク質短縮バリアントのみを使用する場合と比較して、診断率を効果的に2倍できることが示されました。 

撮影イルミナ

市場で比類なき存在

多くの企業が現在、AIテクノロジー、さらにはゲノムAIに投資しています。しかし、当社の多くの同僚にとって、ゲノミクスは同時に追求している他のいくつかのプロジェクトに埋もれています。イルミナでは、ゲノミクスは中核事業です。これは、27年間にわたり当社が培ってきた専門知識であり、世界最高峰のアルゴリズムと自信を持って競わせています。

PrimateAI-3Dに関する最も驚くべき事実の一つをご紹介します。 その研究は、 Science 誌に掲載され、6つの異なる臨床ベンチマークおよび4つのコホート(UK Biobank、神経発達障害コホート、自閉症スペクトラム障害コホート、先天性心疾患コホート)にわたって病原性バリアントを検出する目的で、他の15種類の機械学習手法と比較されました。PrimateAI-3Dは、すべてのカテゴリーで最も多くのバリアントを検出しただけでなく、どの競合他社も複数のカテゴリーで2位を獲得することはありませんでした。

同時に、私たちは単独で取り組んでいるわけではありません。ゲノミクス(およびマルチオミクス)のデータに関する課題は、人間の健康に影響を与える洞察を生み出すために、ステークホルダーのエコシステム全体を必要とします。当社は、Alliance for Genomic Discoveryなどのパートナーシップを構築し、専有データを共有しています。私たちは、NVIDIAと協力してマルチオミクスデータ解析と解釈のためのプラットフォームを前進させ、Tempusと協力して彼らのデータプラットフォームを活用し、アルゴリズムのトレーニングに役立てています。また、AIベースの解析手法に関する知識と、アストラゼネカの優秀な人材の知識を組み合わせています。

製薬会社は、医薬品開発におけるAIツールの可能性に気づき始めています。イルミナの新しいBioInsight事業は、構成部門全体の有能な人材の協力によって支えられており、パートナーや顧客が生物学的発見の次の波を実現するために活用できる大規模なデータ資産とAIソリューションを開発します。

私は、AIチームが成し遂げたすべての成果を非常に誇りに思っており、彼らが次に何に取り組んでいるかを共有するのが待ちきれません。エビデンスは議論の余地のないものです。ゲノミクスの次の時代が到来しており、私たちはその道を先導しています。

将来の見通し
この記事には、リスクや不確実性を伴う将来の見通しに関する記述が含まれている場合があります。将来の実際の結果は、将来予想に関する記述の内容と実質的に異なる場合があります。例えば、次のものがあります。(i)新たなテクノロジーの研究、開発と立ち上げに伴う本質的に重大な課題、(ii)新製品、新規サービス、新規アプリケーションを展開し、ゲノミクス関連の製品およびサービスの市場を拡大する当社およびパートナー企業の能力、(iii)パートナー企業のパフォーマンスへの依存を含め複数当事者間のコラボレーションに関連する課題、ならびに証券取引委員会への提出書類(最新のForm 10-K および Form 10-Qを含む)。当社は、将来予想に関する記述を更新する義務を負わず、また更新する意図もありません。

最近の記事

世界中のコミュニティーが結集するとき
世界中のコミュニティーが結集するとき
中国におけるプレシジョンメディシンの加速に尽力
Video: 中国におけるプレシジョンメディシンの加速に尽力
一度に1ゲノムずつ、抗菌薬耐性に取り組む
一度に1ゲノムずつ、抗菌薬耐性に取り組む