Customer Interview

大規模なブルゲノムシーケンスにより、家畜の迅速な改善を実現

1000 Bull Genomes ProjectのWGSデータは、肯定的および否定的な形質の発見を支援し、世界中の群れに利益をもたらしています。

大規模なブルゲノムシーケンスにより、家畜の迅速な改善を実現

大規模なブルゲノムシーケンスにより、家畜の迅速な改善を実現

はじめに

ウシ個体の全ゲノムシーケンス(WGS)は、現在のゲノム解析技術を使用して牛の品種の遺伝的変異を評価する最適な方法です。ただし、このオプションは、ほとんどのブリーダーや研究者にとっては依然として経済的な範囲にありません。その結果、より安価な一塩基多型(SNP)アレイを使用して、雄牛、ウシ、およびハイファーのルーチンジェノタイピングが行われます。SNPアレイは、陽性の産生形質や健康形質、または疾患やその他の陰性形質に関連する遺伝子変異を発見するように設計されています。

2012年、当時Agriculture Victoria 1のBen Hayes博士は、ウシの遺伝学のグローバルな理解を支援し、国際的な協力を促進するために、1000 Bull Genomes Project 2を設立しました。3このプロジェクトの最初のランでは、オーストラリアの主要な祖先である仔牛の選抜ラインから238匹の動物をシーケンスし、HiSeq 3000システムの平均ゲノムカバレッジの10.5倍を達成しました。このプロジェクトには現在、40の国際パートナー、2,700の乳製品および牛の動物が含まれ、9,000万近くの遺伝的バリアントが特定されています。世界中の研究者やブリーダーが、致死的変異4の同定や、ウシにおける最大規模のシーケンスレベルのゲノムワイド関連解析(GWAS)など、このデータで得られた発見から恩恵を受けています。5オーストラリアのメルボルンにあるLa Trobe UniversityとAgriculture VictoriaのシニアリサーチフェローであるHans Daetwyler博士は現在、1000 Bull Genomes Projectをリードしています。彼のチームは、今後1年以内にさらに多くの動物を飼育する別のランを計画しています。

iCommunityは、Daetwyler博士と話し合い、プロジェクトがどのように誕生したか、さまざまな調査結果、他の品種における肯定的な形質と否定的な形質に関連するバリアントを特定するためにWGSを使用する将来について学びました。

Hans Daetwyler博士、オーストラリアのメルボルンにあるLa Trobe University and Agriculture Victoriaのシニアリサーチフェロー。

Q:1000 Bull Genomesプロジェクトとは?

Hans Daetwyler(HD):1000 Bull Genomes Projectは、もともとAgriculture Victoriaの上司であったBen Hayes博士によって提案されました。当時、シーケンスは多数の動物で実施するのに費用がかかり、古い品種の研究や新しい品種の研究で広く利用されることができませんでした。インピュテーションを可能にするのに十分な数の個人をシーケンスするための資金が機関にありませんでした。これは、低密度SNPアレイデータで観察されなかった遺伝子型を統計的に推測するものです。

1000 Bull Genomes Consortiumの背景にあるアイデアは、Bos Taurus、Bos Indicusその他のBos種を含む牛の全ゲノムシーケンスを比較することでした。最初の論文を発表した時、1000 Bull Genomes Projectには、世界中の234の牛の個人と5つのパートナー機関が含まれていました。5それ以降、ほぼ毎年、新しい分析ラウンドを実施しています。各ランでより多くの動物が追加され、より多くのパートナー施設がプロジェクトに参加しています。これまでに2,700頭以上の動物のシーケンスを実施しています。

Q:1000 Bull Genomes Projectが始まったときの役割は何ですか?

HD:プロジェクトの最初の数年間、データ解析を実施しました。パートナーは、リファレンスゲノムにアラインした全ゲノムシーケンスを送ってきました。BAMファイルを解析し、データを結合し、バリアントコーラーを実行してデータセットのSNPとインデルを特定しました。パートナーには、プロジェクト内のすべての動物の生SNPとフィルターSNP、および関連する遺伝子型のリストを提供しました。今日もこのプロセスを続けます。

2016年にHayes博士がクイーンズランド大学に異動したとき、私は1000 Bull Genomes Projectの運営委員会の委員長を引き継ぎました。

"分娩時や非常に若い年齢の子牛に対してより正確なEBVを持っている農家は、そうでなかったよりもはるかに早い時期に育種のために自信を持って個人を選択し、使用することができます。乳牛の生育間隔を5~6年から2年に短縮します。"

Q:研究者は、原因バリアントを特定するためにどのようなツールや手法を使用していましたか?

HD:10年前、彼らは関連する遺伝子領域を同定するために低密度SNPアレイを使用しており、他のバリアントを同定するためにその領域のターゲットシーケンスを実行した可能性があります。当時、シーケンスはゆっくりとした高価なプロセスでした。研究者は、古いNGSテクノロジーを使用してターゲットシーケンスを実行し、その後、定量的形質遺伝子座(QTL)の保因者であると疑われる動物でのみ使用していたでしょう。彼らはリファレンスゲノムを持っていなかったため、どこで調べるか、関与する遺伝子の数についてよく理解していませんでした。彼らは、このアプローチを使用して少数の変異しか特定しなかった可能性があります。

1000 Bull Genomes Projectデータベースは、多くの動物に基づく全ゲノムシーケンスで構成されています。これにより、原因となる変異の発見プロセスが大幅に加速し、世界中の群れの遺伝子利益が改善されました。

Q:乳牛や牛の遺伝子獲得率を向上させることが重要なのはなぜですか?

HD:栄養と健康管理以外にも、遺伝子変化は、生産性と効率の向上、および群れ内の健康福祉形質の改善の重要な要素です。遺伝的利益は累積的です。時間の経過とともに、複合的な関心のように作用します。パフォーマンスの向上や健康と福祉の向上を目的に遺伝子的に前向きな変化を起こす度に、集団に留まり、前向きな効果はさらに高まります。農家の努力のかなりの要素が、時間の経過とともに群れの生産性を高めることに費やされています。

Q:以前の選択的育種アプローチと比較して、ゲノム選択の利点は何ですか?

HD:ゲノミクスの前、農家は表現型の選択を使用し、個人とその子孫を観察し、その特性に基づいて育種する個人を選択しました。また、近親者に関する情報を使用する家系の選択も使用していたでしょう。

ゲノム選択のパワーは、その情報を、より遠い親戚の生産、効率、健康データと組み合わせることです。ゲノム選択は、特に若い人において、推定育種値(EBV)の精度の向上につながります。分娩時や非常に若い年齢の子牛のEBVの精度が高い農家であれば、そうでなかったよりもはるかに早い時期に育種を行えると確信して、その個人を選抜し、使用することができます。乳牛の生育間隔を5~6年から2年に短縮します。

Q:ウシの家畜育種子の何パーセントが、群れを改善するためにゲノム選択を使用していますか?

HD:ゲノム選択の使用は、酪農家と牛肉農家で異なります。表現型の選択とは対照的に、ゲノムの選択により、娘がいない若い雄牛を使用することができます。この数年で、これらの若いゲノム検査済みサイアの使用が劇的に増加しました。一部の国では、この割合は使用されている人工授精(AI)サイア全体の80%を超えています。オーストラリアでは、ゲノム検査済みのサイアの使用率は約40%です。オーストラリアの牛肉では、乳製品よりも割合が低くなりますが、北米の主要な牛肉品種ではかなり高い割合になります。

"プロジェクトにおけるすべての動物は、カリフォルニア大学デービス校のAgriculture Research Serviceの新しいリファレンスゲノムに再編成されたか、または再編成される予定です。今後、すべての人のデータが改善されることを願っています。"

Q:NGSとサンガーシーケンスを比較した場合、シーケンスの先祖ブルはどのような価値がありますか?

HD:原因変異または原因に近い変異の検索は、NGSの全ゲノムシーケンスで構成される大規模なデータセットがある場合にのみ可能です。NGSにより、サンガーシーケンスよりも低価格でより多くの動物をシーケンスすることができます。NGSは、SNPアレイの遺伝子型評価のみを行う個人のシーケンス表現型を推測できる、インピュテーションの精度と効率を向上させました。これが最大の利点です。

NGSの利点は、機能的ゲノム研究にも影響します。RNA-Seqおよびクロマチン免疫沈降(ChIP)-Seq with NGSは、一連の個人に関する機能情報を提供します。その情報は、原因に近い変異の探索に利用し、その変異を直接ジェノタイピングすることができます。これらの変異を直接ジェノタイピングすることで、品種全体およびトレーニング集団との関連性が低い個体でも予測精度が向上します。

Q:主要な祖先雄牛はどのように同定されますか?

HD:主要な祖先雄牛を同定するために用いられる方法がいくつかあります。主な方法は、家系を選択し、どの個人がその家系の遺伝的バリアントのほとんどを説明するかを特定することです。新しい手法では、その集団のジェノタイプやハプロタイプさえも使用して多様性を探します。主要な先祖は、集団で代表されるハプロタイプが最も多く、またはハプロタイプセットの強力な相補性を持っているかどうかに基づいて選ばれます。もう1つの方法は、一連の個人でカバーされていないハプロタイプを持つ個人を調べることです。

Q:シーケンスされた個人の総数と、1000 Bull Genomesデータベースに含まれるウシの品種は何個ですか?

HD:1,000人の個人という当初の目標を上回りました。前回の解析では、2,700人以上の個人がいましたが、1,000頭の強気の新たなランを開始しようとしています。プロジェクトにおけるすべての動物は、カリフォルニア大学デービス校のAgriculture Research Serviceから新しいリファレンスゲノムに再アライメントされたか、または再アライメントされる予定です。今後、すべての人のデータが改善されることを願っています。

1000 Bull Genomesデータベースには、牛肉群よりもわずかに多くの乳製品群があります。このプロジェクトの主な品種は、ホルスタインが約20%です。アンガスは次に大きなグループで、次にブラウンスイスが続きます。また、SimmentalやFleckviehなどのデュアルパーパスの牛もデータベースに含まれています。最近では、オーストラリアのBrahmanなど、ボスの指標となる貢献が数多くありました。

Q:1000 Bull Genomesチームによって同定された新しいウシマーカーは何個ですか?

HD:1,000 Bull Genomes Projectを開始する前に、研究者は解析に最大60万のバリアントを使用していました。240頭の動物で実施した最初のランでは、Taurus単独で2,500万~2,700万のSNPとインデルを特定しました。現在、Bos taurusの個人だけで約4,000万人に達しています。Bos indicus牛、Yak、その他の亜種を含めると、約8,000万のフィルターされたバリアントになります。

"1000 Bull Genomesデータベースは、動物育種におけるWGSデータの早期使用を通じて、ウシ研究のペースを加速させました。"

Q:研究者にとっての1000 Bull Genomesデータベースの価値は何ですか?

HD:1000 Bull ReferenceGenomesデータセットは、研究者にとって2つの点で価値があります。まず、研究者はこれをリファレンスセットとして使用して、SNPアレイ遺伝子型を持つ集団個人のデータセットの全ゲノムシーケンスを補完することができます。その後、強力なGWASを実行し、WGSを利用するさまざまなゲノム選択アプローチを調査することができます。4

また、研究者は原因または致死的な劣性遺伝疾患変異を探すことができます。1000 Bull Genomesデータセットを対照として使用することで、研究者はフィルタリング戦略を使用して検索を小さなゲノム領域に絞り込むことができます。

Q:このデータベースは世界中の研究者が利用できますか?

HD:1000 Bull Genomesデータベースは、プロジェクトに参加し、コンソーシアムとデータを共有することに同意した研究機関が利用できます。データを用いて実施される研究の種類には制限がほとんどありません。ただし、コンソーシアムの研究者は、施設外でデータを共有することはできません。例えば、研究者が1000 Bull Genomesデータを解析したいコラボレーターを持つ場合、コラボレーターはプロジェクトのメンバーになる必要があります。

現在、このプロジェクトには世界中に38の施設があります。1000 Bull Genomes Projectは、いくつかの重要な協力関係を育んできました。それは永遠の伝統の1つです。

Q:1000 Bull Genomesデータベースではどのような発見が行われていますか?

HD:1000 Bull GenomesデータベースのWGSデータは貴重なものであり、適用された多くの育種と研究研究をサポートしています。研究者は、1000 Bull Genomesデータベースを使用して、いくつかの乳汁産生形質の陽性バリアントを同定しました。6また、データを使用して同定されたいくつかの原因変異もあります。例えば、フランスの共同研究者たちは、胚性致死性変異の原因変異を発見しました。これは、私たちがその存在を知っていたにもかかわらず、これまで発見されていなかったものです。7

シーケンスレベルのGWASにより、形質アーキテクチャーの理解が向上し、機能研究がサポートされました。例えば、WGSデータによりQTL研究の補完が可能になりました。また、WGSデータを使用してSNPセットを同定し、優先順位を付け、ゲノム予測を改善しています。8–11

"HiSeqシステムはハイスループットであるため、WGS、RNA-Seq、ChIP-Seqを低価格で実行できます。データ品質は優れており、システムはWGSの主力製品です。"

Q:これらの発見はブリーダーにどのような影響を与えましたか?

HD:1000 Bull Genomesデータベースは、動物育種におけるWGSデータの早期使用を通じて、ウシ研究のペースを加速させました。致死的変異の発見は、ブリーダーにすぐにプラスの影響をもたらしました。変異が発見されたら、すぐにSNPアレイに添加し、群れ内のキャリアを同定しました。これらの個体はAIプロセスでに対して選択され、群れ集団内の致死的変異の頻度を減らします。

今では、すべての集団におけるSNPとインデルのバリエーションのより完全なインベントリーがあり、より良いSNPアレイを設計できるようになりました。原因であると推測するのに十分な頻度で存在するランダムなSNPに頼るのではなく、原因であり、形質に直接影響を与えるSNPでアレイを濃縮することができます。

Q:WGSを実施するためにどのNGSシステムを使用していますか?

HD:2台のHiSeq 3000システムでシーケンスを行い、MiSeqとNextSeq 500システムも備えています。HiSeqシステムはハイスループットであるため、WGS、RNA-Seq、ChIP-Seqを低価格で実行できます。データ品質は優れており、システムはWGSの主力製品です。MiSeqシステムは、若干長いリードが必要なアプリケーションに使用します。

NovaSeq 6000システムでHiSeqシステムをアップグレードするかどうか調査中です。これにより、1台の装置で大規模なWGSとシーケンスによるジェノタイピング(GBS)を実施できるようになります。

Q:何千ものゲノムを他の家畜や植物種にシーケンスして、種データベースを作成する1000 Bull Genomesアプローチですか?

HD:このアプローチは、羊のSheepGenomesDBにも似たようなプロジェクトで使用されています。12 935頭の羊のシーケンスを行い、NCBIまたはEBIのショートリードシーケンスアーカイブから生データをダウンロードし、ニュージーランドのAgResearchやブリスベンのCSIROなどの共同研究者とともに処理しました。バリアントコーリングを実施し、遺伝子、SNP、およびインデルで*.vcfファイルを作成し、データを欧州バリアントアーカイブに公開しました。13

工場でもこのコンセプトはメリットがあると思います。荒野灌漑や一部の主要な作物で使用されていることは確かです。しかし、一部の植物は非常に大きなゲノムを持っています。小麦ゲノムには170億塩基対があります。そのため、WGSの実行コストが高くなり、データの共有が必須になります。コムギではエクソームシーケンスを実施しましたが、これは価格が安いことが理由です。対照的に、キャノーラは12億塩基対の短いゲノムを持っています。そのため、WGSは10倍でも比較的安価です。

植物のもう1つの問題は、一部の種が倍数体であるため、シーケンスとゲノムアセンブリが複雑になることです。多倍体植物はサブゲノム間に直交領域を有しており、短いリードは2、3、または4つの異なる場所に見当識的に等しい精度でマッピングできます。通常、多倍体植物ゲノムは動物やヒトのゲノムよりも質が劣ります。

"シーケンスは非常に安価になり、GBSがSNPアレイに取って代わる可能性があります。高出力で低価格のNovaSeq 6000システムは、将来的にコスト構造を変える可能性があります。"

Q:GBSはSNPアレイのジェノタイピングに取って代わると思いますか?

HD:今日の牛や羊のルーチンジェノタイピングのほとんどはSNPアレイで行われており、現在はGBSよりも低価格で高品質のデータを提供しています。GBSにはいくつかの問題があります。その低いカバレッジシーケンスでは、シーケンスエラーと真のアリルの区別が困難になるからです。SNPチップは、シーケンスベースのジェノタイピングよりも質の低いDNAも取得できるため、産業アプリケーションに役立ちます。

とはいえ、GBSアレイとSNPアレイのどちらが将来最適になるかは、オープンマインドです。最も高品質なデータを最も低価格で提供する方法に焦点を合わせています。シーケンスが非常に安価になり、GBSがSNPアレイに取って代わる可能性があります。高出力で低価格のNovaSeq 6000システムは、将来的にコスト構造を変える可能性があります。

Q:1000 Bull Genomes Projectの次のステップは何ですか?

HD:当社の新しいシーケンス、データ解析、リファレンスゲノムに関する論文が開発中です。38のパートナー機関もすべてデータを公開しています。

いくつかのバリアントコーラーをテストし、SAMツールからGATK HaploType Caller 14に移行して、この次の解析を行います。1000 Bull Genomesデータベースを3000を超える牛ゲノムに増やし、より多くの公開データを含めます。新しい、より大規模なリファレンスゲノムに移行すると、データ品質が向上し、より良い結果を提供するためにインピュテーションが改善されることを期待しています。

この記事で言及されているシステムの詳細はこちら:

MiSeqシステム

NextSeq 550システム

NovaSeq 6000 System

参考文献
  1. Agriculture Victoria、agriculture.vic.gov.au/agriculture。2019年1月3日にアクセス。
  2. 1000 Bull Genomes Project、www.1000bullgenomes.com/ 。2019年1月3日にアクセス。
  3. Hayes BJとDaetwyler HD。1000 Bull Genomesプロジェクト:アプリケーションと成果。Annu Rev Anim Biosci . doi: 10.1146/annurev-animal-020518-115024. 印刷前にエパブする。
  4. Bouwman AC, Daetwyler HD, Chamberlain JA, et al. ウシの成育に関するゲノムワイド関連解析のメタ解析により、哺乳類の体格を制御する一般的な遺伝子が同定されます。 Nat Genet. 2018;50:362−367。
  5. Daetwyler HD, Capitan A, Pausch H, et al. 234頭の雄牛の全ゲノムシーケンスにより、牛における単一遺伝子形質と複雑な形質のマッピングが容易になります。 Nat Genet. 2014;46:858−865。
  6. Pausch H, Emmerling R, Gredler-Grandl B, et al. 3種類の牛種にわたるシーケンスベースの関連研究のメタ解析により、ヌクレオチド分解能での乳汁中の脂肪およびタンパク質の割合について25 QTLが明らかになりました。 BMC Genomics。2017;18:853。
  7. Michot P, Fritz S, Barbat A, et al. PFAS(ホスホリボシルホルミルグリシナミジンシンターゼ)のミスセンス変異は、モンベリアルデ乳牛のMH1ハプロタイプに関連する胚致死性の原因である可能性がありますJ Dairy Sci . 2017;100:8176−8187。
  8. Brøndum RF, Su G, Janss L, et al. 全ゲノムシーケンスデータから得られる定量的形質座位マーカーは、ゲノム予測の信頼性を高めます。 J Dairy Sci . 2015;98:4107−4116。
  9. VanRaden PM, Tooker ME, O’Connell JR, et al. 酪農牛のゲノム予測を改善するためにシーケンスバリアントを選択するGenet Sel Evol。2017;49:32。
  10. Raymond B, Bouwman AC, Schrooten C, et al. 全品種ゲノム予測のための全ゲノムシーケンスデータの有用性。 Genet Sel Evol. 2018;50:27。
  11. MacLeod IM, Bowman PJ, Vander Jagt CJ, et al. 生物学的な過去の変異やシーケンスバリアントの活用により、QTLの発見と複雑な形質のゲノム予測が強化されますBMC Genomics。2016;17:144。
  12. SheepGenomesDB, Resources for the Sheep Genomics Community, sheepgenomesdb.org/ 。2019年1月3日にアクセス。
  13. European Variation Archive、www.ebi.ac.uk/eva/ 。2019年1月3日にアクセス。
  14. GATK。Haplotype Caller:ハプロタイプの局所的な再組み立てにより、生殖細胞系列SNPおよびインデルを呼び出します。software.broadinstitute.org/gatk/documentation/tooldocs/3.8-0/org_broadinstitute_gatk_tools_walkers_haplotypecaller_HaplotypeCaller.php. 2018年11月29日にアクセス。