まとめ
- リンチ症候群に関連するPMS2遺伝子の病理学的な小バリアント検出は、偽遺伝子PMS2CLによって交絡されます。
- DRAGEN 4.3は、全ゲノムシーケンスを使用してPMS2における小さなバリアントの検出を強化するための洗練されたアルゴリズムを導入しました。
- このアプローチを22のノンセルラインサンプルに適用することで、予想されるすべてのP/LPバリアントが検出されます。
- この方法は、単一または複数コピーのパラローグを持つ他の遺伝子に拡張可能です。
リンチ症候群スクリーニングのためのPMS2における病原性バリアント検出は、偽遺伝子PMS2CLによって交絡されます
私たちの何兆もの細胞には、それ自体が数十億のサブユニットを含む完全なDNAセットが含まれています。そのすべてを物理的に作成し維持することは、どのように可能でしょうか? 答えの重要な部分は、私たちのゲノムにはさまざまなエラー修正メカニズムが含まれていることです。これらのメカニズムの1つはミスマッチ修復(MMR)と呼ばれ、適切にペアリングされていないDNAを認識して修正します。例としては、AがTではなくGの反対側にある場合が挙げられます。
MMR遺伝子に欠陥がある場合、 リンチ症候群があり これは、がんの遺伝的素因として2番目に多い形態です。1 4つの主要なリンチ症候群遺伝子(MSH2、 MSH6、 MLH1、 PMS2)は、一般集団では279人に1人という高い可能性があります。2大腸がんの発生率が高いことを考えると、 リンチ症候群患者では、子宮がん、 その他の悪性腫瘍、早期発見の重要性、 正確な遺伝子スクリーニングは、健康転帰を改善する大きな可能性を持っています。
PMS2は、疑似遺伝子であるPMS2CLが存在するため、リンチ症候群の遺伝子スクリーニングに特に課題があります。2つの領域間の高い類似性(図1)は、バリアントコーリングに重大な課題をもたらします。3 この領域由来のリードのミスアライメントやあいまいなマッピングは、偽陽性または偽陰性の結果につながる可能性があり、臨床上の意思決定や患者ケアに影響を与えます。4 現在利用可能な手法では、拡張が難しい長距離PCRなどの専用の単一遺伝子ウェットラボテストが必要になる場合があります。
イルミナで定評なるPCRフリー全ゲノムシーケンスアッセイを使用して、これらの課題に対処し、PMS2エクソン11~15における小型バリアントコールの信頼性を向上させることを目指しています。
多領域ジョイント検出アプローチ
従来のバリアントコーラーは、小さな違いをチェックする前に、まずアライナーを使用して、シーケンスリードを元のゲノム位置に一意にマッピングします。この方法は、リードまたはリードペアがリファレンスゲノムの1つの部分のみに似ている場合にうまく機能しますが、2つ以上の領域が等しく一致する場合に苦労します。ゲノムの少なくとも5%には、ほぼ同一のコピーが1つ以上あるため、リードの真の起源が不明確なことがよくあります。リードのグループが低信頼度でマッピングされている場合、従来のバリアントコーラーは有用な情報を含んでいてもリードを無視することがあります。リードが誤ってマッピングされた場合(つまり、一次アライメントがリードの真のソースではない場合)、バリアント検出エラーが発生する可能性があります。
これらの課題に対処するため、多領域関節検出(MRJD)と呼ばれる新しい計算手法を開発しました。MRJDは、各領域を個別に分離してジェノタイピングするのではなく、リードのグループが由来した可能性のあるすべての場所を考慮し、その下にあるシーケンスを共同で検出しようとします。このアプローチは、あいまいなアライメントでリードを保持し、遺伝子変換またはクロスオーバーイベントによるリードのミスアライメントの事例に適しています。
図2は、PMS2およびPMS2CL高ホモロジー領域を例にしたMRJDの一般的なワークフローを示しています。つまり、MRJDは(マッピングの品質に関係なく)すべてのパラロガス領域で一次アライメントを行い、リードと以前の知識に基づいてすべてのハプロタイプを構築して配置し、小さなバリアントを呼び出すために関節遺伝子型を計算します。
MRJD高感度モードは、感度が最優先されるアプリケーションに推奨されます
図2に示すように、MRJDには2つのモードがあります。精度とリコールのバランスを提供するデフォルトモードと、精度を犠牲にして最大限のリコールを提供する高感度モードです。病原性を持つ可能性のあるすべてのバリアントの同定が最重要であり、そのようなバリアントの配置を直交的に確認することが可能な環境(例えば、長距離PCRベースの検査)では、MRJD高感度モードの使用を推奨します。
細胞株サンプルのMRJD性能
イルミナのPolaris 1ダイバーシティパネルから147の細胞株サンプルから、PMS2ハイホモロジー領域でMRJDのバリアントコーリング性能をベンチマークしました。5 長距離PCRデータから派生した直交する小型バリアントコールを使用してグラウンドトゥルースが確立されました。5 MRJD高感度モードは、DRAGEN小型バリアントコーラーと比較して大幅に高いリコールを達成し、SNVとIndelの集約リコールはそれぞれ約99.7%と97.1%です(図3)。Indelの回収率が低いのは、ロングレンジPCRデータにおけるSNVと比較して、Indelのエラー率が高いためです。この問題に対処するために、1000ゲノムプロジェクトからの多様な祖先を表す147の細胞株サンプルからなる独立したデータセットを利用して、ロングリードベースのアプローチでコンコーダンス解析を実施しました6。ロングリードベースのアプローチに対する総回収率は、SNVとIndelの両方で99.7%を超えています。
MRJD高感度モードによる高いリコール率は、すべてのパラロガス領域にすべての変異体を配置することで達成され、精度は低くなります。スプリアスコール率を測定するために、PMS2とPMS2PMS2CLPMS2のMRJD高感度モードコールのみを比較しました。この解析では、スプリアスコール率が0.7%未満であることが示されています。これは、報告されたアリルのほとんどが実際にサンプル内で発生するが、MRJD高感度(曖昧な配置)によって両方の場所で報告されることを意味します。
ノンセルラインサンプルにおけるMRJD性能
MRJDアプローチが実際の環境でどのように機能するかを評価するため、Broad Clinical LabsとTempus AIと協力して、合計22の非細胞株サンプルでMRJD性能を評価しました。そのうち16サンプルは、PMS2とPMS2CLの高相同性領域に臨床的に意義のある変異を持つ可能性があります(Broad Clinical Labsの11サンプル、Tempus AIの5サンプル)。NEB遺伝子の三重領域に発生するネマリンミオパチーに関連する既知の病原性バリアントを持つBroadからの追加の6つのサンプルも解析に含まれました。これは、この領域がDRAGEN v4.3のMRJDでカバーされている別のセグメント重複であるためです。
MRJD高感度モードにより、22サンプルすべてにおいて臨床的に重要なすべての小さなバリアントの存在を検出できました(表1)。
影響を受けないと推定されるサンプルにおけるP/LPバリアントコール率を推定する
効率的なスクリーニングと確認の反射アプローチでは、影響を受けていない個人のサンプルでは、全体的に低い陽性率が必要です。この率を推定するために、1000 Genomes Projectの147の細胞株を用いてP/LPバリアントコール率を測定しました。PMS2遺伝子のP/LPバリアントコール率は1/147(0.68%)であり、影響を受けていない個人のサンプルでは反射負荷が低いことを示しています。
ディスカッション
要約すると、WGSデータを使用してパラロガス領域におけるde novo生殖細胞系列の小さなバリアントコーリングの課題に対処し、感度と特異性を向上させる、新しい計算戦略である多領域ジョイント検出をここで紹介します。このアプローチをPMS2およびNEB遺伝子に適用することで、この研究がリンチ症候群およびネマリンミオパチーに関連するバリアントのより信頼性の高い検出に貢献し、罹患した個人に対してより良いリスク評価と個別化された管理戦略を可能にすることを実証しました。
MRJDは、配列同一性が高いパラロガス領域で機能する汎用フレームワークとして設計されています。PMS2およびNEBに加えて、DRAGEN v4.3に含まれるMRJDは、他の5つの臨床的に意義のある困難な遺伝子の反復領域である生殖細胞系列の小さなバリアントコーリングもサポートしています。SMN1、SMN2、STRC、IKBKG、およびTTN。ヒトゲノムには、問題のある領域を持つ200~500の医学的に関連する遺伝子が含まれていると推定されており、高い相同性が主な懸念事項となっています。7-8 当社のアプローチは、同様の相同性の課題に直面している他の医学的に関連する遺伝子におけるバリアントコールのさらなる研究への道を開くと予想されます。
補足資料
このブログで発表された結果に加えて、当社はTempus AIと協力して、150の細胞株サンプルを使用してMRJDの発信者を評価しました。この共同研究の結果は、ISMB 2023会議で発表されました。詳細な洞察については、このリンクで入手可能な出版物を参照してください。MRJDの発信者のパフォーマンスは、このアブストラクトの発表以来、さらに改善しています。
ご利用について
ソフトウェアはDRAGENのv4.3リリースで入手できます。インストールファイルとリリースノートは こちらから入手できます。MRJDの発信者の詳細については、 こちらの ユーザーガイドを参照するか、ffg-info@illumina.comにお問い合わせください。
謝辞
Broad Clinical Labs のMarina DiStefano氏とEdyta Malolepsza氏、Tempus AIのFrancisco M. De La Vega氏とPavana Anur氏が、セルライン以外のサンプルについてMRJDの発信者を評価してくれたことに感謝します。
参考文献
- リンチHT、リンチPM、ランスパSJ、スナイダーCL、リンチJF、ボランドCR。リンチ症候群のレビュー:病歴、分子遺伝学、スクリーニング、鑑別診断、および医療法的な影響。 Clin Genet. 2009;76(1):1-18. doi:10.1111/j.1399-0004.2009.01230.x
- AK、Jenkins MA、Dowty JGらに勝つ。大腸がんにおける主要遺伝子およびポリ遺伝子の有病率と浸透率。2017年 以前は、2 6(3):404-412. doi:10.1158/1055-9965.EPI-16-0693
- van der Klift HM, Mensenkamp AR, Drost M, et al. リンチ症候群または体質性ミスマッチ修復不全症候群が疑われる発端者の大規模コホートにおけるPMS2の包括的な変異解析。 Hum Mutat. 2016;37(11):1162-1179. doi:10.1002/humu.23052
- Huang KL, Mashl RJ, Wu Y, et al. 成人がん10,389種の病原性生殖細胞系列バリアント 。Cell. 2018;173(2):355-370.e14. doi:10.1016/j.cell.2018.03.039
- Gould GM、Gauman PV、Theilmann MRなど。遺伝子とその疑似遺伝子の同等のハイブリッドキャプチャーに基づくリフレックスワークフローを介して、PMS2の3′エクソンにおける臨床的に有効なバリアントを検出する。 BMC Med Genet. 2018;19(1):176. doi:10.1186/s12881-018-0691-9
- Chen X, Harting J, Farrow E, et al. ロングリードPacBio HiFiシーケンスを使用した脊髄性筋萎縮症解析のための包括的なSMN1およびSMN2プロファイリング。 Am J Hum Genet. 2023;110(2):240-250. doi:10.1016/j.ajhg.2023.01.001
- Ebbert MTW, Jensen TD, Jansen-West K, et al. 暗く迷彩化した遺伝子の系統的解析により、明白な視界に隠れている疾患関連遺伝子が明らかになります。 Genome Biol. 2019;20(1):97. doi:10.1186/s13059-019-1707-2
- Wagner J, Olson ND, Harris L, et al. 難易度の高い医学的に関連する常染色体遺伝子の厳選されたバリエーションベンチマーク。 Nat Biotechnol. 2022;40(5):672-680. doi:10.1038/s41587-021-01158-1