2024年4月3日
ポッドキャストのMendelspodは、バイオテクノロジーとプレシジョンメディシンにおける最新の進展をカバーしています。13のシーズンと10年以上にわたり、司会者であるTheral Timpsonは、サイエンティスト、エグゼクティブ、ジャーナリストと、これらの分野を推進する最大のアイデアと最新のテクノロジーについて、長いインタビューを行ってきました。
イルミナは、GenomeWebと提携して、当社の副社長兼著名なサイエンティストであるKyle Kai-How Farh博士が、最新のエピソードでTimpsonのゲストとして登場したことを誇りに思います。
Mendelspodのエピソードを聞く “どのようにゲノミクスAIをトレーニングしますか? イルミナのAI Lab Kyle FarhのVPが自然選抜について語る
Farhはハーバード大学医学部で医学博士号を、MITで博士号を取得しました。また、Broad Instituteでの博士課程修了後の医学研究や集団遺伝学研究からBoston Children’s Hospitalの臨床遺伝学科での研修まで、遺伝学への専念はキャリアの道のりでした。
この7年間、ファーはイルミナのゲノム解釈のための人工知能研究所を率いてきました。セル、サイエンス、ネイチャージェネティクス、その他の権威あるジャーナルで10の論文に貢献してきました。そのうちの最新の論文は、何百万年もの自然選抜によって効果的にトレーニングされ、病原性を持つ可能性のある遺伝子変異を同定するPrimateAI-3Dの開発を研究室でカバーしています。
親戚を研究して自己発見する
ポッドキャストでは、ファーがゲノムAIについて詳細に話しています。最も有名なAIプログラムは、その予測を行うために公開された豊富な著作物(ChatGPTの場合、どの単語が次の文になる可能性が最も高いかを予測)から導き出すことができますが、これまで知られていなかった遺伝子変異の影響を特定するために構築されたAIは、そのような贅沢はありません。
そうすると、‘In the human genome—base 2,000,000,006—AはCに転じました。これは疾患の原因になりますか? Farh氏は、実際にそのことを言える人はいません。「膨大な量のデータがありますが、ほとんどの場合、正しい回答を示すラベルはありません。」
そこで、彼のチームは、ヒトの健康について最良の予測を行うために、233種のヒト以外の霊長類から800人以上の個人をシーケンスしました。彼らはこのデータを使用してアルゴリズムをトレーニングし、生命の樹の中で最も近い親戚に共通するバリアントを同定しました。これらのバリアントが何百万年もの自然選択を生き延びていれば、良性であると排除しても安全です。また、良性バリアントを同定することで、排除プロセスにより、病原性の可能性のあるバリアントを見つけやすくなります。
Farh氏は、広く使用されている公開データベースであるClinVarは、以前は約70,000の遺伝子変異をカバーしていました。この機械学習の手法により、解釈される変異の数が約450万にまで拡大すると述べています。
ブレークスルーは簡単ではありません
Farhは、イルミナに特有の多くの要因によってこの研究を実施する能力があると信じています。同社は、世界中の70人以上の学術著者と既存の関係を持っていました(そのほとんどは、実際にジャングルに行き、サンプルを提供するようサルを捕まえた人々です)。イルミナは、これらのサンプルから膨大な量のシーケンスデータを生成するテクノロジーを持っており、そのデータを解釈するために必要なコンピューティング能力のための資金を有しています。学界の多くのラボでは、ディープラーニングコンピューティングは、少なくとも最も強力で効果的なモデルを得るために必要な規模では、非常に手頃な価格になってきています。
PrimateAI-3Dのその他のブレークスルーの1つは、その名前です。Farhのチームは、DNAシーケンスから新たに同定された良性バリアントを、コードする3次元タンパク質構造に重ね合わせるためにこの手法を使用することができます。そこから、病原性バリアントがどのポケットにあるかがわかります。多くの場合、タンパク質の一部のポケットは3D空間では非常に明白ですが、ゲノムの線形空間ではかなり切り離されています。
イルミナのAIラボは、PrimateAI-3Dの予測と実世界の効果の間に強い相関関係をすでに示しています。LDL遺伝子またはPCSK9遺伝子に保有するバリアントのPrimateAI-3Dスコアによって、血中コレステロール値がよく予測されていることを示すことができます。“これにより、脂質異常症や2型糖尿病などの疾患や頻度の低いバリアントのリスクがある人を正確に予測することができます。”
PrimateAI-3Dは現在、またはまもなくイルミナのソフトウェア製品で利用可能になります。特に、DRAGEN Secondary Analysis、Illumina Connected Analytics、および遺伝性疾患アプリケーション用のEmedgeneバリアント解釈ソフトウェアについて言及しています。
より投機的な性質の予測
Farhは、ラボの次のステップについて尋ねられたとき、有望なリードをいくつか提供しています。彼のチームは、個々の細胞に異なる変異を導入し、それらの変異が細胞機能にどのように影響するかを測定する遺伝子編集技術である“perturb-seq”を実験しています。(とても楽しかったです)
また、タンパク質をコードしないゲノムの一部の病原性バリアントを同定するアルゴリズムにも取り組んでいます。Timpsonは、これが希少疾患の診断に針を動かす可能性があることを示唆し、Fahは次のように同意します。「実は、エクソームによる診断率は30%です。それは患者や医師にとって非常に不満足なことです。
今後5~10年で、Farhは、前例のない規模のコホートのシーケンスに現在取り組んでいる努力によって、プレシジョンメディシンの新時代が到来するのを目の当たりにしています。彼は、PCSK9遺伝子を破壊する自然変異を持つ人は、コレステロール値が非常に低く、心臓発作から保護されているという比較的最近の発見を指摘しています。非常に迅速に、製薬会社はPCSK9を阻害する抗体を作ることができました。今では素晴らしい薬剤です。このように自然発生の変異が有益であり、あらゆる種類の疾患に対する大きな治療標的となりうる遺伝子が〔存在する〕数多くあると思います。そして最終的には、AIもそれらを特定する上で中心的な役割を果たします。
PrimateAI-3Dがイルミナのコネクテッドアノテーションでゲノムバリアントアノテーションをどのように強化するかについての詳細は、イルミナのGenomics Research Hubでこの記事をお読みください。