ゴーシェ病とパーキンソン病研究に使用されるDRAGEN:PCRフリーの全ゲノムシーケンスを用いたGBA1バリアントの解決

Samuel Strom, PhD, FACMG; Eric Roller; published January 24, 2023

このブログは、Communications Biology(2022年6月、PMID:35794204)に発表された論文の要約です。論文の全文を読むことをお勧めします。この研究は、Illumina Inc.、ユニバーシティ・カレッジ・ロンドン、ベイラー医科大学、プリマス大学(英国)、ダンディー大学(英国)、国立神経疾患脳卒中研究所、およびジョンズホプキンズ大学の研究者による共同研究です。この国際的サイエンティストチームがこの分野に多大な貢献をもたらしてくれたことに感謝いたします。

GBA1遺伝子とは何でしょうか? なぜ重要なのでしょうか?

GBA1遺伝子(以前はGBAとして知られる)は、グルコセレブロシドと呼ばれる細胞膜に存在する大分子のリサイクルに関与するリソソーム酵素をコード化します。この遺伝子が不活性になると、これらの分子が蓄積し、脳やその他の身体の神経細胞に毒性を示します。

GBA1の両コピーが不活性化すると、常染色体劣性ゴーシェ病が引き起こされます。この疾患は内臓の肥大と血球の異常を特徴とし、稀ではありますが重度疾患です。ゴーシェ病の詳細については、GeneReviewsをご覧ください。

GBA1遺伝子の活性コピーが1つしかないと、パーキンソン病(PD)およびレビー小体型認知症(LBD)のリスクが高くなります。PDは、振戦、固縮、緩徐な動き、平衡障害、睡眠障害を特徴とする運動障害です。LBDは記憶障害と認知機能障害を特徴とします。どちらも退行性、すなわち症状が時間の経過とともに悪化し、生活の質の大幅な低下が起こり、最終的には死に至ります。人口の高齢化に伴い、PDはますます一般的になりつつあり、2020年には米国で90万人以上が罹患すると予想されています。PD患者は機能を改善し、疾患の経過を遅らせることができるドーパミン様分子であるレボドパなど、多くの薬理学的介入を受けることができますが、完治はしません。

LRRK2遺伝子のバリアントとともに、GBA1バリアントはPDの最も一般的かつ特定可能な遺伝的リスク因子であり、薬剤開発研究や遺伝子治療の臨床試験が急がれています(ここから4つのを参照)。

GBA1が評価が難しい遺伝子である理由

標準的な次世代シーケンサーでは、GBA1の重要なバリアントについて偽陽性と偽陰性の両方の結果を得る可能性があります。これは、1番染色体のGBA1近傍に相同性の高い偽遺伝子(GBAP1)が存在するためで、これは標準的なバリアントコールのアプローチを混乱させ、この領域のゲノム不安定性を引き起こします(図1A)。この不安定性により、ヒト集団には遺伝子変換または相互組み換えのいずれかからさまざまな構造多型が生じています(図1B-1D)。これらの変換アリルや組み換えアリルには、コピー数の増減が含まれているため、遺伝子解析がさらに複雑なものになります。GRCh38のヒトゲノムリファレンスシーケンスのエラー、すなわち、GRCh38のGBAP1リファレンスシーケンスの3箇所の位置に誤ってGBA1塩基が含まれていると、不正確な結果が生じる可能性があります。

図1. さまざまなタイプの組み換えアリルの構造と直交性確認のためのプライマーの位置。

(PMID:35794204

A. 野生型アリル。プライマーペア1のPCRのみに増幅が起こります。プライマーペア2では、2つのプライマーが互いに離れすぎているため増幅が起こらず、プライマーペア3ではプライマーの配向が許さないため、増幅が起こりません。

B. 非相互組み換え(遺伝子転換)。野性型アリルのように、プライマーペア1を用いたPCRのみに増幅が起こります。

C. 遺伝子と偽遺伝子の相互交差により、DNAの大きな領域が欠失します。プライマーペア2を用いたPCRのみに増幅が起こります。

D. 遺伝子と偽遺伝子の相互交差により、DNAの大きな領域が重複します。プライマーペア1とプライマーペア3の両方を用いたPCRで増幅が起こります。正常なアリルが存在し、プライマーペア3で増幅すると、コピー数の増加数に関わりなくアンプリコンが生成されます。

DRAGENがこの問題をどのように解決するか?

DRAGEN 3.10以降で利用可能なGBA1ターゲットコーラーは、以前にイルミナが開発したSMN1/2およびCYP2D6コーラーにおいて説明されているように、密接に関連するパラログを解決する戦略に基づき設計されています。

PCRフリーライブラリー調製を使用して生成された30倍以上の全ゲノムシーケンスデータを使用して、本コーラーはGBA1GBAP1、および潜在的なGBA1/GBAP1遺伝子ハイブリッドの合計コピー数を計算します。 領域にアライメントされたリード数は、GC含有率に対して正規化および補正され、コピー数はガウス混合モデルから導かれます。この解析によってコピー数の変化が示唆された場合、領域全体にわたるGBA1GBAP1を含む80箇所を超える分化部位と、最も問題のある領域内の10箇所の座位(GBA1のエクソン9~11)を考慮に入れて、ブレークポイント検出が実行されます。

最終的に、DRAGENのGBA1コーラーは、コピー数解析、ブレークポイントマッピング、分化した座位におけるハプロタイプ量、およびターゲットバリアント検出を組み合わせて、ゴーシェ病、PD、および/またはLBDに関連する既知の病原性、病原性の可能性、およびリスクアリルバリアントをすべてジェノタイピングします。これには、E326K、A495P、L483P、N409S、RecNciI、およびc.1263del+RecTL(詳細は付録を参照)などの複雑なおよび/または解析の難しいアリルが含まれます。

GBA1ターゲットコーラーの仕組み

DRAGEN GBA1のターゲットコーラーを用いて、ますます拡大する3つのデータセットの解析を試みました。そして、それぞれのデータセットについて、以前に確立された結果および/または直交型PCRベース検査の結果とDRAGENの精度を比較しました。

テスト1:30症例と12例の対照

症例には、1つ以上のコピー数増加を伴う11サンプル、5つのコピー数減少を伴う5サンプル、および1つ以上の病原性の小規模バリアントを伴う16サンプルが含まれていました。この研究の結果はすべてのサンプルとバリアントで完全に一致しており、さらなる検査を進める信頼度を与えてくれました(表1)

表1 パイロット症例/対照研究の結果。すべてのCNV、SNV、および複雑なアリルは、30の症例と12の対照で一致として検出されました。

テスト2:ゴーシェ病とパーキンソン病研究の参加者

この試験では、RAPSODI試験の約400人の参加者から得た全ゲノムシーケンス(WGS)データに対するコーラーの性能を評価し、それぞれおよそ50%となるように症例と対照に分けました。これらの参加者のサブセットには、PCRベースの光学ゲノムマッピングアプローチを使用した試験が事前に行われていました。ここでも、DRAGEN GBA1のターゲットコーラーの性能は完全な精度で、偽陽性のない196の陽性バリアントを精確に同定しました(表2)

テスト3:1KGP、AMP-PD、AMP-LBDデータセット

集団レベルのゲノミクスに真にスケールアップするため、症例や対照から得られた公開WGSデータセットを用いてGBA1解析、すなわちAMP-PD試験および1000ゲノムプロジェクト(1KGP)を実施しました。これらの優れたデータセットにより、4,923例の症例と5,700例の対照ゲノムにアクセスすることができました。

まず、これらのゲノムのGBA1コピー数の状態を確認し、パターンを探しました(表3)。対照と比較して、症例にコピー数の増減は見られず、これらのバリアントが疾患リスクに寄与する可能性は低いことを示していました。しかし、直近にアフリカ系の祖先を持つ人々では、そうでない人々と比較してコピー数が増加している人々の割合が多くなっていました。これは、多様な地理的サンプル集団を研究に含めることの重要性を際立たせることになりました。このようなパターンについて認識していない場合、GBA1関連疾患の因子となる分子病理を誤って解釈してしまう可能性があります。これらのコピー数バリアントはそれ自体は疾患に関連していませんが、病原性の小規模バリアントや再構成を検出するためにはGBA1コピー数の状態を精確にコールすることが不可欠です。

すべての陽性結果についての直交データは得られませんが、DRAGENとBWA-GATKの比較では、解析の難しいエクソンにおけるGBA1コールの感度と特異性の向上が見られます(表4)

 

表2 PDコホートおよびLBDコホートにおけるエクソン9~11相同領域におけるGBAP-1様バリアント。TP = 真陽性、FP = 偽陽性、FN = 偽陰性、BWA-GATK = Burrows-Wheeler Alignment and Genome Analysis Toolkit。
表3 1KGPおよびAMP-PD WGSデータセットにおける症例および対照群からのGBA1コピー数イベント 症例/対照の頻度に差は認められず、GBA1のコピー数の変化は良性である可能性が高いことを示しています。最近のアフリカ系の人々では、コピー数増加イベントがある個人の割合が、他の人々と比較して統計的に有意に増加しています(10.8%~<1%、カイ二乗p値<0.00001)。
表4 AMP-PD解析の感度とPPV。TP = 真陽性、FP = 偽陽性、FN = 偽陰性、BWA-GATK = Burrows-Wheeler Alignment and Genome Analysis Toolkit。

結論

GBA1は極めて重要な遺伝子であり、標準的なマッピングやバリアントコールの手法では十分な解析ができません。これに対処するため、DRAGENには、偽遺伝子干渉のノイズを排除し、実データで複雑な遺伝子変換イベントを特定できるGBA1の高精度なターゲットコーラーが含まれています。これもまた、DRAGENチームが発見したPCRフリー全ゲノムシーケンスの価値を最大化する方法の一例です。

このコーラーは、DRAGEN Bio-IT Platformの最新のビルドで利用できるようになりました。研究を改善するために、このコーラーをどのようにお使いになりますか? その他に、どのような遺伝子に特に注意が必要でしょうか?

ゲノムデータのGBA1解析を行う方法

このターゲットコーラーを利用するには、次の2つの方法があります。

·   バイオインフォマティシャンは、GitHubを介してスタンドアロンバージョンのコーラーにアクセスできます(使用および引用方法の詳細については、READMEおよびLICENSEファイルを参照してください)。

·   オンプレミスまたはクラウドソリューションでDRAGEN v3.10以降を使用している場合、“--enable-gba=true”を使用して生殖系列DNAシーケンスパイプラインの一部としてコーラーを起動できます。詳細については、オンラインヘルプをご参照ください。

学術用途向けの詳細情報またはDRAGEN試用版ライセンスについては、dragen-info@illumina.comまでお問い合わせください。 

付録

以下のバリアントが上記テキスト、表、および/または図に参照されています。

*遺伝子変換アリルには、簡便性を考慮してタグ付けバリアントが選択されています。実際のゲノム変換は、利用可能な命名システムを用いて容易に説明できるものよりも複雑になっています。