Customer Interview

大規模ブルゲノムシーケンスにより、家畜の迅速な改善を実現

1000 Bull Genomes ProjectのWGSデータは、世界中の群れに利益をもたらす、ポジティブおよびネガティブな形質の発見を支援しています。

大規模ブルゲノムシーケンスにより、家畜の迅速な改善を実現

大規模ブルゲノムシーケンスにより、家畜の迅速な改善を実現

はじめに

ウシ個体の全ゲノムシーケンス(WGS)は、現在のゲノム解析技術を使用して牛種の遺伝的変異を評価する最適な方法です。しかし、このオプションは、依然としてほとんどのブリーダーや研究者にとって経済的な手の届かないものです。その結果、ブル、ウシ、およびハイファーのルーチンジェノタイピングは、より安価な一塩基多型(SNP)アレイを使用して行われます。SNPアレイは、陽性の産生形質や健康形質、または疾患やその他の陰性形質に関連する遺伝子変異を発見するように設計されています。

2012年、当時Agriculture Victoria 1のBen Hayes博士は、ウシの遺伝学のグローバルな理解を支援し、国際的な協力を促進するために、1000 Bull Genomes Project 2を設立しました。3このプロジェクトの最初のランでは、オーストラリアの主要な祖先である仔牛の選抜ラインから238匹の動物をシーケンスし、HiSeq 3000システムの平均ゲノムカバレッジの10.5倍を達成しました。このプロジェクトには現在、40の国際パートナー、2,700の乳製品および牛の動物が含まれ、9,000万近くの遺伝的バリアントが特定されています。世界中の研究者やブリーダーが、致死的変異4の同定や、牛における最大規模のシーケンスレベルゲノムワイド関連解析(GWAS)など、このデータで得られた発見から恩恵を受けています。5オーストラリアのメルボルンにあるLa Trobe UniversityとAgriculture VictoriaのシニアリサーチフェローであるHans Daetwyler博士は現在、1000 Bull Genomes Projectを率いています。彼のチームは、今後1年以内にさらに多くの動物を飼育する別のランを計画しています。

iCommunityは、Daetwyler博士と話し合い、プロジェクトがどのように誕生したか、さまざまな調査結果、他の品種における肯定的および否定的な形質に関連するバリアントを同定するためにWGSを使用する将来について学びました。

Hans Daetwyler博士、オーストラリアのメルボルンにあるLa Trobe University and Agriculture Victoriaのシニアリサーチフェロー。

Q:1000 Bull Genomesプロジェクトとは?

Hans Daetwyler(HD):1000 Bull Genomes Projectは、もともとAgriculture Victoriaの上司であったBen Hayes博士によって提案されました。当時、シーケンスは多数の動物に対して行うのに費用がかかり、新旧の品種の研究で広く利用されることができませんでした。インピュテーションを可能にするのに十分な数の個人をシーケンスするための資金が機関にありませんでした。これは、低密度SNPアレイデータで観察されなかった遺伝子型を統計的に推測するものです。

1000 Bull Genomes Consortiumの背景にあるアイデアは、Bos Taurus、Bos Indicusその他のBos種を含む牛の全ゲノムシーケンスを比較することでした。1000 Bull Genomes Projectでは、最初の論文を発表した際、世界中の234の牛の個人と5つのパートナー機関が参加しました。5それ以降、ほぼ毎年、新しい解析ラウンドを実施しています。各ランでより多くの動物が加わり、より多くのパートナー機関がプロジェクトに参加しています。これまでに2,700匹以上の動物のシーケンスを実施しています。

Q:1000 Bull Genomes Projectが始まったときの役割は何ですか?

HD:プロジェクトの最初の数年間、データ解析を実施しました。パートナーはリファレンスゲノムにアライメントされた全ゲノムシーケンスを送ってきました。BAMファイルを解析し、データを組み合わせ、バリアントコーラーを解析してデータセット内のSNPとインデルを同定しました。パートナーには、プロジェクト内のすべての動物の生SNPとフィルターSNP、および関連する遺伝子型のリストを提供しました。このプロセスは今日も継続します。

Hayes博士が2016年にクイーンズランド大学に転校したとき、私は1000 Bull Genomes Projectの運営委員会の委員長を引き継ぎました。

"分娩時や非常に若い年齢の子牛に対してより正確なEBVを持っている農家は、そうでなかったよりもはるかに早い時期に育種のために自信を持って個人を選択し、使用することができます。乳牛の生育間隔を5~6年から2年に短縮します。"

Q:研究者は、原因バリアントを特定するためにどのようなツールや手法を使用していましたか?

HD:10年前、彼らは関連する遺伝子領域を同定するために低密度SNPアレイを使用し、その領域のターゲットシーケンスを実施して他のバリアントを同定したかもしれません。当時、シーケンスは低速で高価なプロセスでした。研究者は、古いNGSテクノロジーを使用してターゲットシーケンスを実行し、その後、定量的形質遺伝子座(QTL)の保因者であると疑われる動物でのみ使用していたでしょう。彼らはリファレンスゲノムを持っておらず、どこを見ればいいのか、また関与する遺伝子の数についてよく理解していませんでした。彼らは、このアプローチを使用して少数の変異しか特定しなかった可能性があります。

1000 Bull Genomes Projectデータベースは、多くの動物に基づく全ゲノムシーケンスで構成されています。これによって、原因となる変異の発見プロセスが大幅に加速し、世界中の群れの遺伝子利益が改善されました。

Q:乳牛や牛の遺伝子獲得率を向上させることが重要なのはなぜですか?

HD:栄養と健康管理以外にも、遺伝子変化は、生産性と効率の向上、および群れ内の健康福祉特性の改善の重要な要素です。遺伝的利益は累積的です。時間の経過とともに、複合的な関心のように作用します。パフォーマンスの向上や健康と福祉の向上を目的に遺伝子的にポジティブな変化を行うたびに、それは群れにとどまり、ポジティブな効果が悪化します。農家の努力のかなりの要素が、時間の経過とともに家畜の生産性を高めることに費やされています。

Q:以前の選択的育種アプローチと比較して、ゲノム選択の利点は何ですか?

HD:ゲノミクスの前、農家は表現型の選択を使用し、個人とその子孫を観察し、その特性に基づいて育種する個人を選定しました。また、近親者に関する情報を使用する家系の選択も使用していたでしょう。

ゲノム選択のパワーは、その情報を、より遠い親戚の生産、効率、健康データと組み合わせることです。ゲノム選択は、特に若い人にとって、推定育種値(EBV)の精度の向上につながります。分娩時や非常に若い年齢の子牛に対してより正確なEBVを持っている農家は、そうでなかったよりもはるかに早い時期に育種のために自信を持って個人を選択し、使用することができます。乳牛の生育間隔を5~6年から2年に短縮します。

Q:ウシの家畜育種子の何パーセントが、群れを改善するためにゲノム選択を使用していますか?

HD:ゲノム選択の使用は、酪農家と牛肉農家で異なります。表現型の選択とは対照的に、ゲノムの選択により、娘がいない若い雄牛を使用できるようになります。この数年で、これらの若いゲノム検査済みサイアの使用が劇的に増加しています。一部の国では、この割合は使用されている人工授精(AI)サイア全体の80%を超えています。オーストラリアでは、ゲノム検査済みのサイアの使用率は約40%です。オーストラリアの牛肉では、乳製品よりも割合が低くなりますが、北米の主要な牛肉品種ではかなり高い割合になります。

"プロジェクトに含まれるすべての動物は、カリフォルニア大学デービス校の農業研究サービスから新しい参照ゲノムに再アライメントされたか、または今後再アライメントされる予定です。今後、すべての人のデータが改善されることを願っています。"

Q:NGSとサンガーシーケンスを比較した場合、シーケンスの先祖ブルにはどのような価値がありますか?

HD:原因変異または原因に近い変異の検索は、NGSの全ゲノムシーケンスで構成される大規模なデータセットがある場合にのみ可能です。NGSにより、サンガーシーケンスよりも低価格でより多くの動物をシーケンスすることができます。NGSは、SNPアレイの遺伝子型評価のみを持つ個人のシーケンス表現型を推測できる、インピュテーションの精度と効率を向上させました。これが最大の利点です。

NGSの利点は、機能的ゲノム研究にも影響します。RNA-Seqとクロマチン免疫沈降(ChIP)-Seq with NGSは、一連の個人に関する機能情報を提供します。その情報は、直接ジェノタイピングできる原因に近い変異の検索に利用されます。これらの変異を直接ジェノタイピングすることで、種間およびトレーニング集団との関連性が低い個人でも予測精度が向上します。

Q:主要な先祖の雄牛はどのように同定されますか?

HD:主要な祖先雄牛を同定するために用いられる方法がいくつかあります。主な方法は、家系を選択し、どの個人がその家系の遺伝子変異のほとんどを説明しているのかを特定することです。新しい手法では、その集団のジェノタイプやハプロタイプさえも使用して多様性を探します。主要な祖先は、集団で代表されるハプロタイプが最も多いか、ハプロタイプセットの強力な相補性を持つかに基づいて選択されます。もう1つの方法は、一連の個人でカバーされていないハプロタイプを持つ個人を調べることです。

Q:シーケンスされた個人の総数と、1000 Bull Genomesデータベースに含まれるウシの品種は何個ですか?

HD:1,000人の個人という当初の目標を上回りました。前回の解析では、2,700人を超える個人がいましたが、1,000頭のブルの新たなランを開始しようとしています。プロジェクトに参加するすべての動物は、カリフォルニア州デービス大学の農業研究サービスから新しいリファレンスゲノムに再編成されたか、または今後再編成される予定です。今後、すべての人のデータが改善されることを願っています。

1000 Bull Genomesデータベースには、牛肉群よりもわずかに多くの乳製品群があります。このプロジェクトの主な品種は、ホルスタインが約20%です。アンガスは次に大きなグループで、次にブラウンスイスが続きます。また、SimmentalやFleckviehなど、データベースにはデュアルパーパスの牛もあります。最近では、オーストラリアのBrahmanなど、ボスの指標となる貢献が数多くありました。

Q:1000 Bull Genomesチームによって同定された新しいウシマーカーは何個ですか?

HD:1000 Bull Genomesプロジェクトを開始する前に、研究者は解析に最大60万のバリアントを使用していました。240頭の動物で実施した最初のランでは、Tauurus単独で2,500万~2,700万のSNPとインデルを特定しました。現在、Bos taurusの個人だけで約4,000万人に達しています。Bos indicus牛、Yak、その他の亜種を含めると、約8,000万のフィルターされたバリアントになります。

"1000 Bull Genomesデータベースは、動物育種におけるWGSデータの早期使用を通じて、ウシ研究のペースを加速させました。"

Q:研究者にとっての1000 Bull Genomesデータベースの価値は何ですか?

HD:1000 Bull ReferenceGenomesデータセットは、研究者にとって2つの点で価値があります。まず、研究者はこれをリファレンスセットとして使用して、SNPアレイ遺伝子型を持つ群れの個人のデータセットの全ゲノムシーケンスを補完することができます。その後、強力なGWASを実行し、WGSを利用するさまざまなゲノム選択アプローチを調査することができます。4

また、研究者は原因または致死的な劣性遺伝疾患変異を探すことができます。1000 Bull Genomesデータセットをコントロールとして使用することで、研究者はフィルタリング戦略を使用して検索を小さなゲノム領域に絞り込むことができます。

Q:このデータベースは世界中の研究者が利用できますか?

HD:1000 Bull Genomesデータベースは、プロジェクトに参加し、コンソーシアムとデータを共有することに同意した研究機関が利用できます。データを用いて実施される研究の種類には制限がほとんどありません。ただし、コンソーシアムの研究者は、施設外でデータを共有することはできません。たとえば、研究者が1000 Bull Genomesデータを解析したいコラボレーターを持つ場合、コラボレーターはプロジェクトのメンバーになる必要があります。

現在、このプロジェクトには世界中に38の施設があります。1000 Bull Genomes Projectは、いくつかの重要な協力関係を育んできました。それは永遠の伝統の1つです。

Q:1000 Bull Genomesデータベースではどのような発見が行われていますか?

HD:1,000 Bull GenomesデータベースのWGSデータは貴重なものであり、適用された多数の育種と研究研究をサポートしています。研究者は、1000 Bull Genomesデータベースを使用して、いくつかの乳汁産生形質の陽性バリアントを同定しました。6また、データを使用して同定されたいくつかの原因変異もあります。例えば、フランスの共同研究者たちは、胚性致死性変異の原因変異を発見しました。これは、私たちがその存在を知っていたとしても、これまで発見されていなかったものです。7

シーケンスレベルのGWASにより、形質アーキテクチャの理解が深まり、機能研究がサポートされました。例えば、WGSデータによりQTL研究の補完が可能になりました。また、WGSデータを使用してSNPセットを同定し、優先順位を付け、ゲノム予測を改善しています。8–11

"HiSeqシステムはハイスループットであるため、WGS、RNA-Seq、ChIP-Seqを低価格で実行できます。データ品質は優れており、システムはWGSの主力製品です。"

Q:これらの発見はブリーダーにどのような影響を与えましたか?

HD:1000 Bull Genomesデータベースは、動物育種におけるWGSデータの早期使用を通じて、ウシ研究のペースを加速させました。致死的変異の発見は、ブリーダーに即座にプラスの影響をもたらしました。変異が発見されたら、すぐにSNPアレイに添加し、群れの保因者を同定しました。これらの個体はAIプロセスで選択され、群れ集団内の致死的変異の頻度を減らします。

今では、すべての集団におけるSNPおよびインデル変異のより完全なインベントリーが得られ、より良いSNPアレイを設計できるようになりました。原因であると推測するのに十分な頻度で存在するランダムなSNPに頼るのではなく、原因であり、形質に直接影響を与えるSNPでアレイを濃縮することができます。

Q:WGSを実施するためにどのNGSシステムを使用していますか?

HD:2台のHiSeq 3000システムでシーケンスを行い、MiSeqとNextSeq 500システムも備えています。HiSeqシステムはハイスループットであるため、WGS、RNA-Seq、ChIP-Seqを低価格で実行できます。データ品質は優れており、システムはWGSの主力製品でした。MiSeqシステムは、やや長いリードが必要なアプリケーションに使用します。

NovaSeq 6000システムでHiSeqシステムをアップグレードするかどうか調査中です。これにより、1台の装置で大規模なWGSとシーケンスによるジェノタイピング(GBS)を実施できるようになります。

Q:何千ものゲノムを他の家畜や植物種にシーケンスして、種データベースを作成する1000 Bull Genomesアプローチですか?

HD:このアプローチは、羊のSheepGenomesDBにも似たようなプロジェクトで使用されています。12 935頭の羊のシーケンスを行い、NCBIまたはEBIのショートリードシーケンスアーカイブから生データをダウンロードし、ニュージーランドのAgResearchやブリスベンのCSIROなどの共同研究者とともに処理しました。バリアントコーリングを実施し、遺伝子、SNP、およびインデルで*.vcfファイルを作成し、データを欧州バリアントアーカイブに公開しました。13

工場でもこのコンセプトがメリットになると思います。アラブドプシスや一部の主要な作物で使用されていることは確かです。しかし、一部の植物は非常に大きなゲノムを持っています。小麦ゲノムには170億塩基対があります。そのため、WGSの実行コストが高くなり、データの共有が必須になります。コムギではエクソームシーケンスを実施しましたが、その理由の一つは価格が安いためです。対照的に、キャノーラの短いゲノムは12億塩基対です。そのため、WGSは10倍でも比較的安価です。

植物のもう1つの問題は、一部の種が倍数体であるため、シーケンスとゲノムアセンブリが複雑になることです。多倍体植物はサブゲノム間に直交領域を有しており、短いリードは2、3、または4つの異なる場所に見当識的に等しい精度でマッピングできます。通常、多倍体植物ゲノムは動物やヒトのゲノムよりも質が低いです。

"シーケンスが非常に安価になるため、GBSがSNPアレイに取って代わる可能性があります。高出力で低価格のNovaSeq 6000システムは、将来的にコスト構造を変える可能性があります。"

Q:GBSはSNPアレイのジェノタイピングに取って代わると思いますか?

HD:今日、牛や羊の日常的なジェノタイピングのほとんどはSNPアレイで行われており、現在はGBSよりも低価格で高品質のデータを提供しています。GBSにはいくつかの問題があります。その低いカバレッジシーケンスでは、シーケンスエラーと真のアリルを区別することが困難であるためです。SNPチップは、シーケンスベースのジェノタイピングよりも質の低いDNAも取得できるため、産業アプリケーションに役立ちます。

とはいえ、GBSアレイとSNPアレイのどちらが将来最適になるかは、オープンマインドです。最も高品質なデータを最も低価格で提供する方法に焦点を合わせています。シーケンスが非常に安価になるため、GBSがSNPアレイに取って代わる可能性があります。高出力で低価格のNovaSeq 6000システムは、将来的にコスト構造を変える可能性があります。

Q:1000 Bull Genomes Projectの次のステップは何ですか?

HD:当社の新しいシーケンス、データ解析、リファレンスゲノムに関する論文が開発中です。38のパートナー機関もすべてデータを公開しています。

いくつかのバリアントコーラーをテストしました。この次の解析では、SAMツールからGATK HaploType Caller 14に移行します。1000 Bull Genomesデータベースを3000を超える牛ゲノムに増やし、より多くの公開データを含めます。新しい、より大規模なリファレンスゲノムに移行すると、データ品質が向上し、より良い結果を提供するためにインピュテーションが改善されることを期待しています。

この記事で言及されているシステムの詳細はこちら:

MiSeqシステム

NextSeq 550システム

NovaSeq 6000 System

参考文献
  1. Agriculture Victoria、agriculture.vic.gov.au/agriculture。2019年1月3日にアクセス。
  2. 1000 Bull Genomes Project、www.1000bullgenomes.com/。2019年1月3日にアクセス。
  3. Hayes BJとDaetwyler HD。1000 Bull Genomesプロジェクトで牛の単純および複雑な遺伝的形質をマッピング:アプリケーションと成果。Annu Rev Anim Biosci . doi: 10.1146/annurev-animal-020518-115024. 印刷前にエパブする。
  4. Bouwman AC、Daetwyler HD、Chamberlain JA、他 ウシの成育に関するゲノムワイド関連解析のメタ解析により、哺乳類の体格を制御する一般的な遺伝子が同定されます。 Nat Genet. 2018;50:362−367。
  5. Daetwyler HD, Capitan A, Pausch H, et al. 234頭の雄牛の全ゲノムシーケンスにより、牛における単一遺伝子形質と複雑な形質のマッピングが容易になります。 Nat Genet. 2014;46:858−865。
  6. Pausch H, Emmerling R, Gredler-Grandl B, et al. 3種類の牛種にわたるシーケンスベースの関連研究のメタ解析により、ヌクレオチド分解能での乳汁中の脂肪とタンパク質の割合について25 QTLが明らかになりました。 BMC Genomics。2017;18:853。
  7. Michot P, Fritz S, Barbat A, et al. PFAS(ホスホリボシルホルミルグリシナミジンシンターゼ)のミスセンス変異は、モンベリアルデ乳牛のMH1ハプロタイプに関連する胚致死性の原因である可能性がありますJ Dairy Sci . 2017;100:8176−8187。
  8. Brøndum RF, Su G, Janss L, et al. 全ゲノムシーケンスデータから得られる定量的形質座位マーカーは、ゲノム予測の信頼性を高めます。 J Dairy Sci . 2015;98:4107−4116。
  9. VanRaden PM, Tooker ME, O’Connell JR, et al. 酪農牛のゲノム予測を改善するためにシーケンスバリアントを選択するGenet Sel Evol。2017;49:32。
  10. Raymond B, Bouwman AC, Schrooten C, et al. 全ゲノムシーケンスデータを全品種ゲノム予測に活用。 Genet Sel Evol. 2018;50:27。
  11. MacLeod IM, Bowman PJ, Vander Jagt CJ, et al. 生物学的な過去の変異やシーケンスバリアントを探索することで、QTLの発見と複雑な形質のゲノム予測が強化されますBMC Genomics。2016;17:144。
  12. SheepGenomesDB, Resources for the Sheep Genomics Community, sheepgenomesdb.org/. 2019年1月3日にアクセス。
  13. European Variation Archive、www.ebi.ac.uk/eva/。2019年1月3日にアクセス。
  14. GATK。Haplotype Caller:ハプロタイプの局所的な再組み立てにより、生殖細胞系列SNPおよびインデルを呼び出します。software.broadinstitute.org/gatk/documentation/tooldocs/3.8-0/org_broadinstitute_gatk_tools_walkers_haplotypecaller_HaplotypeCaller.php. 2018年11月29日にアクセス。