リピート伸長疾患を診断するための全ゲノムシーケンスパイプライン

Michael Eberle, Denise Perry, Egor Dolzhenko, and Ryan Taft; published February 16, 2022

はじめに

ショートタンデムリピート(STR)は、ゲノム全体に認められ、ほとんどのヒト遺伝子(92%)のエクソンに存在します。1 ほとんどのSTRの生物学的機能は不明ですが、2 反復増殖(RE)障害として集団的に知られている遺伝状態クラスにおいて、一部のSTRとヒト疾患1を結びつけるエビデンスがあります。これまでに、ハンチントン病、筋萎縮性側索硬化症(ALS)、前頭側頭型認知症(FTD)、脆弱なX症候群など、40を超える神経遺伝疾患がRE疾患として特定されています。3 ゲノム全体で臨床的に重要なREを特定する能力は、RE疾患を診断し、医学的に関連するゲノム領域の包括的な評価を提供するために不可欠です。RE評価の現在の対策には、PCRベースまたはサザンブロットアッセイなどのターゲット化された方法が含まれ、6コストと時間がかかる場合があります。

PCRフリー全ゲノムシーケンス(WGS)は、ほぼ偏りのないゲノム全体のサーベイを提供します。多くの臨床検査室では、一塩基多型(SNP)や挿入/欠失(indel)、コピー数バリアント(CNV)などの小さなバリアントを同定するための診断ツールとしてWGSをすでに導入していますが、STR拡張などのより複雑な構造バリアント(SV)には導入していません。RE評価の場合、拡張STRバリアントを正確に呼び出すツールとツールの性能に関する解析的妥当性のエビデンスの両方が欠如していることが、臨床導入における主な制限となっています。

STRのジェノタイピングに特化したアルゴリズムの最近の進歩、7、ExpansionHunterソフトウェアパッケージなどの8 は、WGSが高感度かつ高い特異性でゲノム全体のREを確実に検出できることを示しています。9 WGSとExpansionHunterの組み合わせにより、以前に診断されていない神経性RE疾患が明らかになりました。 家族歴がない、またはRE疾患の疑いがない患者を含む。9 トレーニングを受けた専門家によるジェノタイプコールをサポートするリードレベルのエビデンスを解析するための目視検査ステップを追加。 Association for Medical Pathology(AMP)およびCollege of American Pathologists(CAP)の推奨に従い、10は、解析中の特定のコールの精度をさらにサポートします。小さなバリアントの場合、通常、視覚的検査はIntegrated Genome Viewer(IGV)を使用してアライメントを分析することで行われます。11しかし、REなどのリファレンスゲノムとは大きく異なる複雑なバリアントでは、これらのバリアント用に特別に設計された視覚化ツールが必要です。この記事では、病原性REを検出するためのWGSの検証と実装について説明し、ソフトウェア対応の目視検査ステップを臨床パイプラインに追加すると、偽陽性結果の数が大幅に減少しました。

ExpansionHunterによるREの呼び出し

ExpansionHunterは、特定の座位のWGSデータから、ダイナミックグラフリファレンスゲノムの作成を通してリピートサイズを推定します。このダイナミックグラフでは、リピートがループで表され、シーケンスリードはこのダイナミックグラフにアライメントされます。8 リピートがシーケンスデータのリード長(例:150 bp)よりも大幅に短い場合、リピートの正確なサイズを特定するために使用できるスパンリードが必要です。リピートの長さがリード長よりも長い場合、リピート内の完全なリード(インリピートリード、またはIRR)が同定され、カウントされてリピートのサイズを確率的に推定することができます。

REViewerによるデータの可視化

ラボの慣行には、目視データ検査のためのIGVなどのツールの使用が含まれます。しかし、これらのツールは、データを標準参照ゲノムにアライメントすることに依存しており、これは、大量の追加シーケンスの挿入を含む可能性のあるより大きなREにとって問題となる可能性があります。IGVソフトウェアとRE調査のギャップに対処するため、イルミナはRepeat Expansion Viewer(REViewer)を開発しました。これは、ExpansionHunterによって特定されたリピートを含むWGSリードの静的視覚化を作成するソフトウェアツールです。12 REViewer内では、リードはExpansionHunterで特定された遺伝子型によって表される2つのハプロタイプにアライメントされ、リードのパイルアップは静的画像としてプロットされます。結果として得られるプロットにより、ハプロタイプと、それに対応するExpansionHunter遺伝子型のリードパイルアップを直接視覚化できます(図1)。視覚化から、ユーザーは領域に整合するシーケンスリードを特定および調査できるため、IGVが小さなバリアントコールを視覚的に確認するためにどのように使用されるかと同様に、ExpansionHunterコールの追加評価が可能になります。この視覚化に基づいて、ExpansionHunterが行ったジェノタイプコールをレビューして、推定上の偽陽性または保護的中断(すなわち、FMR1におけるAGGの中断)を特定することができます。これにより、検査の適応に関連する場合、ラボはバリアントの直交的な調査を行うことができます。

図1:ExpansionHunterを使用した検出されたREの可視化:1つの対立遺伝子で増殖したDMPKリピートのリードパイルアップ。REViewerはリピート全体にリードを分散させ、ハプロタイプ全体で同様のカバレッジを実現し、拡張リピートの存在をサポートします。リピート内のリードのアライメント位置はランダムに選択されることに注意してください。淡い色で示されるアライメントは、いずれかのアリルに割り当てることができるリードに対応しています。

WGSパイプラインによりERの同定が増加

ExpansionHunterとREViewerを使用してWGSデータでREを同定することを検証するため、Genomics England ProjectとIllumina Clinical Services Laboratory(ICSL)の科学者はWGSワークフローを使用して、以前に検査された793のサンプルで最も一般的な遺伝性RE疾患のうち13件を後ろ向きに評価しました。9このベンチマークデータセットに対するExpansionHunterの出力を比較したところ、221の拡張対立遺伝子のうち215件、正常対立遺伝子検査のうち1321の1316件の正しい分類が示されました。これは、97.3%(95%信頼区間(CI):94.2%~99%)の全感度と99.6%(95% CI:99.1%~99.9%)の特異性を示した。すべてのコールを目視検査し、各コールをサポートするリードの品質に基づいて必要に応じて再分類しました。[*] 目視検査および補正後[PD1] 、感度は99.1%(95% CI:96.7%~99.9%)、特異度は100%(95% CI:99.7%~100%)でした(表1)。拡大したコールの可視化により、偽陽性を検出し、両アレルの伸長があるサンプルで1つの対立遺伝子のみが増殖したと分類された遺伝子の1つですべての偽陰性対立遺伝子を再分類することができました。これらの結果は、正常または拡張に分類される特定の関心領域でREを同定するために、このWGSパイプラインを臨床検査室で確立する上で役立ちます。

表1:目視検査による精度の向上:目視検査後に検査したすべての遺伝子座における正常アレルと拡大アレルの総数に基づく性能。9

RE診断のためのWGSパイプラインの使用例

イルミナのクリニカルサービスラボ(ICSL)は、ExpansionHunterソフトウェアの臨床バリデーションを実施し、希少および未診断の遺伝性疾患患者の臨床WGS検査の一環として、2019年12月にExpansionHunterと目視検査ワークフロー(図2)を実施しました。ICSL検査の定義には、イルミナの慈善活動プログラムであるイルミナiHopeプログラムの一環として、21の臨床的に重要なRE障害のレビューが含まれます。このプログラムは、分子検査へのアクセスが限られた個人に臨床WGSを提供することを目指しています。ICSLはこれまでに、筋強直性ジストロフィー(DMPK)、脊髄小脳失調症7型(ATXN7)、脊髄小脳失調症8型(ATXN8OS)、フリードライヒ失調症(FXNにおける両アレル伸長)など、臨床的に重要なRE疾患に関する7件の臨床報告を発表しています。 

1例では、コンゴ民主共和国のiHopeプログラムを通じて、キンシャサ大学と共同で、ICSLは脊髄小脳失調症、橋小脳萎縮、骨格筋萎縮、錐体外路筋硬直、筋緊張亢進、構音障害、部分失明、および同様の特徴の父親の家族歴を患う3人の成人姉妹からサンプルを受け取りました。臨床WGS解析とExpansionHunterにより、脊髄小脳失調症7型に関連するATXN7遺伝子におけるCAGトリヌクレオチドリピートの伸長が同定されました。脊髄小脳失調症7型の表現型スペクトルには、青年期または成人期発症の進行性小脳失調および視覚症状が含まれ、3人の姉妹で説明されている臨床的特徴と一致しています。これらの所見を記載した臨床報告書が、家族の医師に発行されました。 

図2:REの診断ツールとしてWGSを使用するための推奨臨床ワークフロー:最初の臨床評価後、WGSデータはExpansionHunterを使用して解析されます。拡張が呼び出された場合、または表現型がRE疾患に関連している可能性がある場合は、ExpansionHunterが検討するリードの目視検査が推奨されます。リードの品質が高いと思われる場合、サンプルは直交検査に送られ、リピートの長さを確認し、特徴づけます。拡大が不十分な場合、表現型の重複が強い患者のみが直交性の確認と特性評価の両方のために送られます。

ディスカッション

ここでは、WGS、ExpansionHunter、およびREViewerを使用して、臨床的に関心のあるRE疾患を同定し、視覚的に検査 する臨床パイプラインの有用性について説明します。このパイプラインは現在、複数の臨床検査室で使用されており、ICRチームはこのパイプラインを使用して、検証済みのREが特定された臨床報告書を発行しています。ExpansionHunterおよびREViewerは、それぞれgithub.com/illumina/ExpansionHuntergithub.com/illumina/REViewer

詳細はこちら

論文を読む:英国における神経リピート拡大障害の診断のための 全ゲノムシーケンス:レトロスペクティブな診断精度と前向き臨床検証研究

参考文献
  1. Madsen BE, Villesen P, Wiuf C. ヒトエクソンにおける短いタンデムリピート:疾患変異のターゲット。 BMC Genomics。2008;9:410。2008年9月12日発行。doi:10.1186/1471-2164-9-410
  2. Fan H, Chu JY. 短いタンデムリピート変異の簡単なレビュー。 2007;5(1):7-14. doi:10.1016/S1672-0229(07)60009-6
  3. Paulson HL. Chapter 9-Repeat expansion diseases. In: Geschwind DH, Paulson HL, Klein C, editors. Handbook of Clinical Neurology (Neurogenetics, Part I; vol. 147) [Internet]. Elsevier; 2018:105–123. Available at: http://www.sciencedirect.com/science/article/pii/B9780444632333000099. 2020年10月14日にアクセス。
  4. Gossye H, Engelborghs S, Van Broeckhoven C, van der Zee J. C9orf72 Frontotemporal Dementia and/or Amyotrophic Lateral Sclerosis. In: Adam MP, Ardinger HH, Pagon RA, et al., eds. GeneReviews®. Seattle (WA): University of Washington, Seattle; January 8, 2015. Accessed October 14, 2020. 臨床神経遺伝学:常染色体優性脊髄小脳失調症。
  5. Shakkottai VG, Fogel BL. 臨床神経遺伝学:常染色体優性脊髄小脳失調症。 Neurol Clin. 2013;31(4):987-1007. doi:10.1016/j.ncl.2013.04.006
  6. Bird TD. Myotonic Dystrophy Type 1. In: Adam MP, Ardinger HH, Pagon RA, et al, editors. GeneReviews® [Internet]. Seattle (WA): University of Washington, Seattle; 1993. Available at: http://www.ncbi.nlm.nih.gov/books/NBK1165/. 2020年10月14日にアクセス。
  7. Dolzhenko E, Bennett MF, Richmond PA, et al. ExpansionHunter Denovo:ショートリードシーケンスデータで既知および新規のリピート伸長を見つけるための計算手法。 ゲノムバイオル。2020;21(1):102。2020年4月28日発行。doi:10.1186/s13059-020-02017-z
  8. Dolzhenko E, Deshpande V, Schlesinger F, et al. ExpansionHunter: a sequence-graph-based tool to analyze variation in short tandem repeat regions. Bioinformatics. 2019;35(22):4754-4756. doi:10.1093/bioinformatics/btz431
  9. Ibanez K, Polke J, Hagelstrom T, et al. Whole genome sequencing for diagnosis of neurological repeat expansion disorders. bioRxiv 2020.11.06.371716; doi: https://doi.org/10.1101/2020.11.06.371716
  10. Roy S, Coldren C, Karunamurthy A, et al. 次世代シーケンサーバイオインフォマティクスパイプラインを検証するための基準とガイドライン:Association for Molecular PathologyとCollege of American Pathologistsの共同推奨。 J Mol Diagn. 2018;20(1):4-27. doi:10.1016/j.jmoldx.2017.11.003
  11. Robinson JT, Thorvaldsdóttir H, Wenger AM, Zehir A, Mesirov JP. Integrative Genomics Viewerによるバリアントレビュー。 Cancer Res. 2017;77(21):e31-e34. doi:10.1158/0008-5472.CAN-17-0337
  12. Dolzhenko E, Weisburd B, Ibanez Garikano K, et al. REViewer: Haplotype-resolved visualization of read alignments in and around tandem repeats. bioRxiv 2021.10.20.465046; doi: https://doi.org/10.1101/2021.10.20.465046