Cyrius:全ゲノムシーケンスデータを用いた正確なCYP2D6ジェノタイピング

Xiao Chen and Michael Eberle; January 19, 2021

はじめに

臨床で処方された多数の薬剤の薬物代謝率には個人間で大きなばらつきがあります。薬物代謝におけるこの変動の大きな要因は、薬物代謝酵素の遺伝子組成です。したがって、これらの酵素をコードする遺伝子(すなわち、ファーマコゲネス)のジェノタイピングは、個別化医療の重要な構成要素です1。チトクロームP450 2D6(CYP2D6)は、最も重要な薬物代謝酵素の1つをコードし、臨床使用薬剤の約21%の代謝に関与しています2CYP2D6遺伝子は多型性が高く、Pharmacogene Variation(PharmVar)Consortium 3で100を超える星のアリルが定義されています。スターアリル4は、小さなバリアント(SNVおよびindel)と構造バリアント(SV)の組み合わせによって定義される遺伝子ハプロタイプであり、異なるレベルの酵素活性、すなわち、不良、中間、正常、または超高速代謝5~7に対応しています

CYP2D6のジェノタイピングは、CYP2D6の一般的な欠失と重複、およびCYP2D6とその偽遺伝子パラログであるCYP2D74,8,9の間のハイブリッドによって困難にされています。CYP2D74,8,9は、いくつかのほぼ同一の領域を含む94%のシーケンス類似性を共有しています8,10。従来、CYP2D6ジェノタイピングは、PharmacoScanなどのアレイベースのプラットフォーム、またはTaqManアッセイ、ddPCR、およびロングレンジPCRなどのポリメラーゼ連鎖反応(PCR)ベースの方法で、低または中スループットで行われます。これらのアッセイは、調べるスターアリル(バリアント)の数が異なるため、アッセイ全体でジェノタイピング結果にばらつきが生じます8,11,12。SVを検出するには、これらのアッセイまたはテストプラットフォームを、既知のCNVのサブセットのみの検出に限定される可能性のあるコピー数変動(CNV)アッセイで補完する必要があります4,9

近年の次世代シーケンスの進歩により、ハイスループットかつ臨床的に意義のある時間枠でゲノム全体のプロファイリングが可能になりました。これらの進歩により、多くの国が大規模な集団シーケンスプロジェクトを実施しています13~15。ファーマコゲノミクス(PGx)検査はこれらの取り組みの臨床的有用性を大幅に高めます。これらの研究でPGxを可能にするため、CYP2D6とCYPCYP2D67の相同性の課題を克服する新しいWGS特異的CYP2D6ジェノタイピングツール、Cyrius 16を開発しましたCYP2D7CYP2D6 ここでは、WGSによって実現されるPGxのアプリケーションに関するCyriusの概要と今後の方向性について説明します。 

Cyriusが使用するCYP2D6ジェノタイピング法

CYP2D7との相同性のため(図1)、CYP2D6ではリードアライメントの精度が低下し、変異コールが困難になり、エラーが発生しやすくなります。 CYP2D7 Cyriusは、この課題を克服するために新しいアプローチを使用し、CoriellサンプルNA12878(*3/*68+*4)を例に、詳細なワークフローを図2に示します。まず、Cyriusは、CYP2D6またはCYP2D7のいずれかにマップされたすべてのリードを使用してWGSアライメントBAMファイルからリード深度を計算することで、CYP2D6とCYP2D7の両方の合計コピー数を特定します。Next Cyriusは、集団におけるCYP2D6とCYP2D7の違いが証明されている117塩基に基づいて、完全なCYP2D6遺伝子の数を決定し、ハイブリッド遺伝子を同定します。 CYP2D7 ハイブリッドは、これらの塩基で測定されたCYP2D6のコピー数(CN)が遺伝子内で変化したときに同定されます。例えば、図2Bに示すサンプルNA12878には、CYP2D6のフルコピーが2つ、エクソン1がCYP2D6から、エクソン2~9がCYP2D7から(すなわち *68)ハイブリッドが1つあります。次のCyriusは、リードアライメントを解析して、星型アリルを定義するタンパク質を変化させる小さなバリアントを同定します(図2C)。最後に、CyriusはSVと小さなバリアントをスターアリルの定義と照合し、呼び出されたバリアントと一致する遺伝子型を生成します。

Figure 1. WGS data quality in CYP2D6/CYP2D7 region.
CYP2DCYP2D67領域(GRCh38)の各位置についてプロットした1000 Genomes Project(1kGP)の2504サンプルの平均マッピング品質(赤線)。メジアンフィルターは200bpのウィンドウで適用されます。CYP2D6/CYP2D7の9つのエクソンは、オレンジ色(CYP2D6)と緑色(CYP2D7)のボックスで表示されます。CYP2DCYP2D67の下流にある2つの2.8kbリピート領域(REP1およびREP2)はほぼ同一で、本質的にアライメントができません。 CYP2D7 紫色の破線のボックスは、CYP2D7とREP7の間の固有のスペーサー領域を示します。遺伝子内の2つの主要な相同領域はピンク色で網掛けされており、マッピング精度の低い領域を強調しています。
Figure 2. Cyrius workflow, using NA12878 (*3/*68+*4) as an example.

A. CN(CYP2D6+ CYP2D7)は、CYP2CYP2D6CYP2D7のいずれかにアラインするすべてのリードをカウントし、モデル化することで得られます。ヒストグラムは、1kGPサンプル中のノーマライズされたCYP2D6+ CYP2D7深度の分布を示し、CN2、3、4、5、6、7のピークを示します。赤色の縦線はNA12878の値を表し、CN5に対応しており、追加のコピー(CYP2D6またはハイブリッド)を示します。B. SVは、CYP2D6/CYP2D7の分化塩基のCNを調べることで呼び出されます。エクソンは黄色のボックスで示されます。青色の点は、未処理のCYP2D6 CNを示し、CN(CYP2D6+ CYP2D7)にCYP2D6をサポートするCYP2D6とCYPCYP2D6CYP2D77のリードの比率を掛けて算出します。赤色の菱形は、3’末端でCYP2D6由来である遺伝子のCN(完全なCYP2D6またはCYP2D7-CYP2D6ハイブリッド)を示し、CN(CYP2D6+ CYP2D7)からCN(スペーサー)を引いて算出されます。CYP2D6 CNは各CYP2D6/CYP2D7分化部位で呼ばれ、遺伝子内のCYP2D6 CNの変化はハイブリッドの存在を示します。NA12878では、CYP2D6 CNはエクソン2とエクソン1の間で2から3に変化し、CYP2D6- CYP2D7ハイブリッド(*68)を示しますC. タンパク質を変化させる小さなバリアントを定義する星型対立遺伝子のリードカウントのサポートは、各バリアントのCNを呼び出すために使用されます。y軸は、照会されたすべての小さなバリアント位置のリードカウントを示します。NA12878では6つのバリアントが呼び出され、そのうちの1つはg.100C>Tで2つのコピーと呼ばれています(1つのコピーは*4に属し、もう1つのコピーは星のアリルの定義に基づいて*68に属します)。最後に、スターアリルは検出されたSVと小さなバリアントに基づいて呼び出されます。

性能検証

CDC Genetic Testing Reference Material Program(GeT-RM)11,17により、主要なファーマコゲネスのコンセンサスジェノタイプが複数のジェノタイピングプラットフォームを使用して導出されるリファレンスサンプルのパネルが利用可能になったことで、新たに開発された手法のジェノタイピング精度の評価が可能になりました。Cyriusが行ったCYP2D6コールを、138のGeT-RMサンプルと、PacBio HiFiシーケンスリード(2つのサンプルがGeT-RMとPacBio間で重複)を使用して生成された真実を含む144の真相設定サンプルに対して評価しました。Cyriusは当初、144の真理値サンプルで5回の不一致コールを行い、96.5%の一致率を示しました。その後、原因を同定し、Cyriusがこれらの5つのサンプルのうち4つを正しく呼び出すことができ、99.3%(144サンプル中143サンプル)のトレーニング済み一致率を達成しました。Cyriusの精度は、2つの既存のCYP2D6発信者であるAldy 18(86.8%)およびStargazer 19(84.0%)16よりも高いです。

この研究で使用した検証サンプルでは、40スターアリルを含む47種の異なるハプロタイプ、*13+*2、*68+*4、*36+*10、*36+*36+*10などの重複やタンデム配列などの複数のSV構造におけるCYP2D6コールの精度が確認されました。これらの40スターアリルは、PharmVarの131スターアリルの30.5%(2020年7月時点)、既知の機能を持つスターアリルの51.7%(60のうち31)を占めています。5つの異なる集団(欧州人、アフリカ人、東アジア人、南アジア人、混合アメリカ人)を表す1000 Genomes Project(1kGP)20のサンプルにCyriusを適用することで、これらの検証済みの40の星型アリルが、パンゲノム集団に存在する星型アリルの96%を占めることが示されています。

次に、597の1kGPトリオのシーケンスデータにおけるCyriusコールのメンデル一貫性を評価しました。上記の真のジェノタイプとの比較では異なるハプロタイプフェージングが可能ですが、メンデル整合性チェックは、CYP2D6のコピーが3つ以上存在する場合の星型アリルのフェージングをより厳密にチェックするものです。3人の家族全員の電話を受けた572人のトリオのうち、561人(98.1%)がメンデル語で一貫しています。一貫性のないトリオはすべて、フェージングを変更することで解決できます。つまり、両親に存在しない星のアリルが呼び出された発端者はありませんでした。一貫性のない症例の大半(8/11)は、CYPCYP2D6の2つの同一のコピーが同じハプロタイプであるべきであり、他のハプロタイプはCYP2D6のコピーがない(*Cyrius call *1/*1 vs. trio-based phasing *5/*1x2)ことを3者が特定した。このメンデルの一貫性チェックでは、家系全体での遺伝子型の一貫性を確認しますが、いわゆる星型アリルの精度は確認しません。トリオコンコーダンステストと、真正なジェノタイプに対して上記で実施された精度テストを組み合わせることで、Cyriusが産生するジェノタイプ全体の精度に自信が持てます。

5つの民族集団にわたる実用的な薬理遺伝学バリアント

Cyriusで採用されている方法は、別のファーマコジーンCYP2B6を含む、同じ相同性の問題に苦しむ他のパラログを解決するために適用できます。より完全なファーマコゲノミクスの全体像を提供するために、ジェノタイプ19のファーマコゲノミクスにCPIC 21レベルAガイドライン(https://cpicpgx.org/genes-drugs/)を追加したパイプラインを開発しました。このガイドラインでは、遺伝情報を使用して影響を受けた薬剤の処方を変更する必要があります。これら19の遺伝子には、CACNA1S、CFTR、CYP2B6, CYP2C19, CYP2C9, CYP2D6, CYP3A5, CYP4F2、DPYD、G6PD, IFNL3, NUDT15, RYR1, SLCO1B1、TPMT、UGT1A1, VKORC1、HLA-AHLA-Bが含まれます。このうちCYP2D6/CYP2B6(Cyrius)およびHLA-A/HLA-B(DRAGEN HLAコーラー)のジェネリングに専門コーラーを使用しています。小さなバリアントやCNVを星型アリルや活性スコアに変換することで、1kGPサンプルにおける異なる代謝因子ステータスの分布を評価し、修正された薬剤処方を必要とする遺伝子型を持つ遺伝子を特定できました。この解析に基づき、我々は、パンゲノム集団の99.2%の個人が、実用的なバリアントを持つファーマコジーンを少なくとも1つ持っていると推定しており(図3)、WGSは、ほぼすべての健康な個人に貴重な薬理遺伝学情報を提供できることを示しています。

Figure 3. Distribution of the number of pharmacogenes with actionable variants per individual in the pangenomic population.

まとめ

非常に複雑なCYP2D6領域を正確にジェノタイピングする新しいソフトウェアツール、Cyriusをご紹介します。144のバリデーションサンプル全体で、パンゲノム集団の星型アリルの約96%を占める40の異なる星型アリルにわたるCyriusの精度を確認することができます。Cyriusの詳細に関心のある読者は、この方法を説明する当社の原稿を読むことが推奨されます16。従来のジェノタイピングアッセイと比較して、WGSはCNVを含むすべてのバリアントをアッセイし、適切なソフトウェアと組み合わせることで、既知の星型アリルをすべて正確に解決できるため、集団全体でより正確なアリル頻度データベースを構築するための有望なオプションを提供します。WGSベースのPGxツールとCyriusのようなよりターゲットを絞った手法の継続的な開発により、当社はファーマコゲノミクスを加速し、個別化医療に一歩近づくことができます。

確認

コンセンサスジェノタイプを生成していただいたCDC Genetic Testing Reference Material Program(GeT-RM)に感謝いたします。1kGP WGSデータの生成とリリースについて、ニューヨークゲノムセンターとCoriell Institute for Medical Researchに感謝いたします。共同著者のFei Shen、Nina Gonzaludo、Alka Malhotra、Cande Rogert、Ryan Taft、David Bentleyに感謝いたします。Bochao ZhangがDRAGEN HLAの発信者を提供してくれたことに感謝します。

参考文献
  1. Evans WE, Relling MV. ファーマコゲノミクスによる個別化医療への移行。 Nature. 2004;429(6990):464-468. doi:10.1038/nature02626
  2. Zhou S-F. ヒトチトクロームP450 2D6の多型とその臨床的意義:パートI Clin Pharmacokinet. 2009;48(11):689-723. doi:10.2165/11318030-00000000-000000
  3. Gaedigk A, Ingelman-Sundberg M, Miller NA, et al. Pharmacogene Variation(PharmVar)コンソーシアム:ヒトチトクロームP450(CYP)アリル命名法データベースの組み込み。 Clin Pharmacol Ther. 2018;103(3):399-401. doi:10.1002/cpt.910
  4. Nofziger C, Turner AJ, Sangkuhl K, et al. PharmVar GeneFocus:CYP2D6。 Clin Pharmacol Ther. 2020;107(1):154-170. doi:10.1002/cpt.1643
  5. Gaedigk A, Simon SD, Pearce RE, Bradford LD, Kennedy MJ, Leeder JS. CYP2D6活性スコア:遺伝子型情報を表現型の定性的尺度に変換する。 Clin Pharmacol Ther. 2008;83(2):234-242. doi:10.1038/sj.clpt.6100406
  6. Gaedigk A, Sangkuhl K, Whirl-Carrillo M, Klein T, Leeder JS. 全世界の集団における遺伝子型からのCYP2D6表現型の予測。 Genet Med. 2017;19(1):69-76. doi:10.1038/gim.2016.80
  7. Caudle KE, Sangkuhl K, Whirl-Carrillo M, et al. CYP2D6遺伝子型から表現型への翻訳の標準化:Clinical Pharmacogenetics Implementation ConsortiumとDutch Pharmacogenetics Working Groupによるコンセンサス推奨事項。 Clin Transl Sci. 2020;13(1):116-124. doi:10.1111/cts.12692
  8. Nofziger C, Paulmichl M. CYP2D6の正確なジェノタイピング:心臓の失神には適していません。 Pharmacogenomics. 2018;19(13):999-1002. doi:10.2217/pgs-2018-0105
  9. Yang Y, Botton MR, Scott ER, Scott SA. CYP2D6遺伝子のシーケンス:バリアントアリルの発見から臨床薬理遺伝学検査まで。 Pharmacogenomics. 2017;18(7):673-685. doi:10.2217/pgs-2017-0033
  10. Gaedigk A. CYP2D6遺伝子解析と解釈の複雑さ。 Int Rev Psychiatry Abingdon Engl. 2013;25(5):534-553. doi:10.3109/09540261.2013.825581
  11. Pratt VM, Everts RE, Aggarwal P, et al. 28の薬理遺伝学遺伝子に対する137のゲノムDNA参考資料の特性評価:GeT-RM共同プロジェクト。 J Mol Diagn JMD. 2016;18(1):109-123. doi:10.1016/j.jmoldx.2015.08.005
  12. Bousman CA, Jaksa P, Pantelis C. 精神医学における商業的な薬理遺伝学検査の系統的評価:CYP2D6およびCYP2C19のアリルカバレッジと結果報告に焦点を絞る。 Pharmacogenet Genomics. 2017;27(11):387-393. doi:10.1097/FPC.0000000000000303
  13. Ashley EA. プレシジョンメディシンイニシアチブ:新たな国家の取り組み。 JAMA. 2015;313(21):2119-2120. doi:10.1001/jama.2015.3595
  14. The Genome of the Netherlands Consortium, Francioli LC, Menelaou A, et al. オランダ人集団の全ゲノムシーケンスバリエーション、集団構造、人口統計学的背景。 Nat Genet. 2014;46(8):818-825. doi:10.1038/ng.3021
  15. Turnbull C, Scott RH, Thomas E, et al. 100,000ゲノムプロジェクト:NHSに全ゲノムシーケンスをもたらす。 BMJ. 2018;361:k1687. doi:10.1136/bmj.k1687
  16. Chen X, Shen F, Gonzaludo N, et al. Cyrius:全ゲノムシーケンスデータを用いた正確なCYP2D6ジェノタイピング。 Pharmacogenomics J. 2021年1月18日オンライン公開:1-11. doi:10.1038/s41397-020-00205-5
  17. Gaedigk A, Turner A, Everts RE, et al. CYP2D6アリルの遺伝子検査のための標準物質の特性評価:GeT-RM共同プロジェクト。 J Mol Diagn JMD. 2019年8月9日オンライン公開。doi:10.1016/j.jmoldx.2019.06.007
  18. Numanagić I, Malikić S, Ford M, et al. 高度に多型化した構造的バリアント遺伝子のアレル分解と正確なジェノタイピング。 Nat Commun. 2018;9(1):1-11. doi:10.1038/s41467-018-03273-1
  19. Lee S, Wheeler MM, Patterson K, et al. Stargazer:CYP2D6をモデルとして使用した次世代シーケンスデータからスターアリルを呼び出すためのソフトウェアツール。 Genet Med. 2019;21(2):361. doi:10.1038/s41436-018-0054-0
  20. The 1000 Genomes Project Consortium. ヒトの遺伝的変異に関するグローバルリファレンス。 Nature. 2015;526(7571):68-74. doi:10.1038/nature15393
  21. Relling MV, Klein TE. CPIC:ファーマコゲノミクス研究ネットワークの臨床薬理遺伝学実施コンソーシアム。 Clin Pharmacol Ther. 2011;89(3):464-467. doi:10.1038/clpt.2010.279