COPDマルチオミクスプロジェクトのための効率的なクラウドデータ解析

日本の岡山大学の研究者らによる、Illumina Connected AnalyticsとDRAGENパイプラインを使用した、全ゲノム、エクソーム、トランスクリプトーム、メタゲノムデータ解析

COPDマルチオミクスプロジェクトのための効率的なクラウドデータ解析

COPDマルチオミクスプロジェクトのための効率的なクラウドデータ解析

はじめに

日本の岡山大学病院ゲノム医療総合推進センター 准教授 冨田秀太博士は、プレシジョンがん研究に特化したバイオインフォマティクスチームを率いています。彼のチームは、肺がんの既知のリスク因子である慢性閉塞性肺疾患(COPD)を調査するマルチオミクスプロジェクトに取り組み、5ヵ月で完了しました。彼らは、各50サンプルを血液からの生殖系列全ゲノムシーケンス(WGS)、肺組織からの腫瘍全エクソームシーケンス(WES)、肺組織からの全トランスクリプトームRNAシーケンス(RNA-Seq)、および肺組織からのショットガンメタゲノミクスに使用しました。冨田博士はイルミナと提携して、厳しい期限に間に合うように次世代シーケンサー(NGS)バイオインフォマティクスパイプラインを最適化しました。

「Illumina Connected Analyticsを介してクラウド環境でDRAGENパイプラインを実行できることは、大きな利点でした。」

 

冨田秀太博士の顔写真
岡山大学病院ゲノム医療総合推進センターの准教授である冨田秀太博士は、プレシジョンがん研究に特化したバイオインフォマティクスチームを率いています。

 

安全で効率的な二次解析

「最も困難な作業の1つは、全ゲノムシーケンスの解析を期限内に完了することでした。」と、冨田博士は述べています。このプロジェクトでは、岡山大学の研究者たちは、日本国内のデータ解析ソリューションを使用する必要がありました。チームは、Amazon Web Services(AWS)東京サーバーで利用可能なクラウドベースのIllumina Connected Analyticsにアクセスすることを決定しました。

「前提条件として、オンサイトでの構築や保守が難しいハイスペックなコンピューティングリソースを利用できる環境を探していました。」と、冨田博士は話しています。「私たちは、WGS用のDRAGEN™ Germline、WES用のDRAGEN Enrichment、RNA-Seq用のDRAGEN RNAなど、すぐに使用できるさまざまな解析パイプラインを備えたIllumina Connected Analyticsを選択しました。また、クラウドを利用したデータ解析ワークフローは、非常に使いやすいものでした。医師兼サイエンティストではないバイオインフォマティシャンでも、Connected Analyticsを使用してNGSデータを解析できるのです。」

カスタムパイプラインのコラボレーション

「新人研修やトレーニングプログラムを含め、イルミナチーム全体との連携に満足しています」と、冨田博士は話します。「イルミナのサポートチームが私たちに協力し、あらゆる問題を解決するために迅速に対応してくれたおかげで、当初の計画を予定通りに完了することができました。」

冨田博士と彼のチームは、イルミナチームと協力して構築されたカスタムDRAGEN Metagenomicsパイプラインを使用しました。このパイプラインはConnected Analytics Japanインスタンスに配備され、冨田博士はメタゲノム解析のこの部分を実行できました。

「Connected Analytics環境では、50~60 Gb入力のWES解析時間は約50分、130~160 Gb入力のWGS解析時間は約2.5時間でした。」

クラウドにおけるスケーラビリティ

「全体として、当初の期限内にデータのアップロード、解析、ダウンロードを完了することができました。これらの解析の費用も当初の計画の範囲内でした。」と冨田博士は語りました。

「Connected Analyticsの使用経験から学んだことは、クラウド環境は素晴らしいということです。私たちのConnected Analytics環境では、50~60 Gbの入力に対するWES解析時間は約50分、130~160 Gbの入力に対するWGS解析時間は約2.5時間でした。このようなコンピューティング環境をオンサイトで構築して維持することは困難ですが、Connected Analyticsを介してクラウド環境でDRAGENパイプラインを実行できることは大きな利点でした。」

冨田博士は、後継のマルチオミクスプロジェクトでサンプルサイズを増やすための資金調達に成功しており、Connected Analyticsの使用を継続する予定です。同氏は、Illumina Connected AnalyticsとDRAGEN解析により、「NGSデータ解析は、研究の律速段階ではなくなるでしょう。」と予測しています。

詳細はこちら

Illumina Connected Analytics この記事のPDFを見る