シーケンスファイル形式

さまざまなデータ解析オプションに対応するシーケンスファイル形式

シーケンスデータの下流の解析のために望ましい形式を選択する

イルミナシーケンスのファイル形式

FASTQファイルなど互換性のあるシーケンスファイル形式へのデータ変換のために、またシーケンスデータの下流の解析のために、多様なオプションを利用できます。イルミナのシーケンサーは、クラウドベースのデータ管理、解析、コラボレーションのためにIllumina Connected AnalyticsとBaseSpace Sequence Hubへと容易にデータを合理化できるように設計されています。

生データファイルは、大規模なコホートの合理化された集約とマイニングのために、標準データ形式と互換性があるか、または容易に変換できるシーケンスファイル形式で提供されます。DRAGEN BioITプラットフォームでは、最新のファイル形式であるFASTQ.ORAを利用できます。FASTQ.ORAは可逆圧縮ファイルであり、サイズの縮小、転送時間の短縮化、保管費用の削減を行えます。

FASTQシーケンスのファイル形式

FASTQは、生のシーケンスデータとクオリティスコアの両方を保存する、テキストベースのシーケンスデータファイル形式です。FASTQファイルは、イルミナのシーケンスシステムNGSのデータを保存する標準形式であり、幅広い二次データ解析ソリューションのための情報として使用できます。

MiniSeqとMiSeqのシーケンスシステムでは、データをBCL形式からFASTQ形式に自動変換するオプションが提供されるため、別個の変換ソフトウェアは不要です。

FASTQファイルの詳細はこちら

FASTQ ORAシーケンスファイル形式

FASTQ ORAは、テキストベースのFASTQシーケンスデータファイル形式をバイナリー圧縮化したファイル形式です。fastq.oraファイルは呼応するfastq.gzファイルよりも最高5倍も小さいファイルですが、データの整合性は損なわれません。すべてのfastq.oraファイルは、こちらで入手できる無料の解凍ソフトウェアを使用して読み取ることができます。インストール後はシンプルなコマンドを使用して、解凍の出力を、BWA1、STAR、2およびBowtie3といった幅広い定評のあるマッピングツールに直接パイプ処理できます。DRAGEN ORA圧縮は、DRAGENサーバーおよびNextSeq1000/2000搭載型で利用できます。

BCLシーケンスファイル形式

バイナリーベースコール(BCL)シーケンスファイル形式をユーザー開発の、または第三者のデータ解析ツールで使用するにはFASTQ形式に変換する必要があります。NextSeqシーケンスシステム、HiSeqシーケンスシステム、およびNovaSeq 6000は、BCL形式で生データファイルを生成します。

DRAGEN Bio-ITプラットフォームでは、そのパイプラインパッケージの一環として、BCL形式からFASTQファイルへの迅速な変換が提供されます。

イルミナはまた、BCLファイルをFASTQファイルに変換するためのスタンドアロンのBCL変換ソフトウェアを提供しています。BCL変換は、下流の解析のためにデータを逆多重化し、BCLファイルを標準FASTQファイル形式に変換するスタンドアロンの変換ソフトウェアソリューションです。

その他のシーケンスファイル形式

FASTQファイルは、シーケンスデータ解析における典型的な開始形式です。しかし、BaseSpace Sequence Hubで、二次解析や三次解析のプログラムで一般的なその他のファイル形式を作成することもできます。

NGSデータの二次解析または三次解析中、イルミナのインフォマティクスプラットフォーム内のソフトウェアプラットフォームやアプリは、多くの場合、解析ワークフローの一環として、生シーケンスファイルをFASTQファイルから他のシーケンスファイル形式(すなわち、.vcf、.bam)に変換します。

ゲノム解析技術に関する最新のニュース、事例研究、情報を提供します。ぜひご登録ください。

電子メールアドレスを入力します。

補足資料

ディベロッパーポータル

ユーザーガイド、リリースノート、追加の技術情報にアクセスできます。

オンライントレーニング

これらの無料のオンラインコースでは、ライブラリー調製、シーケンス、およびデータ解析の一般的なトピックについて学習します。

イルミナDRAGEN Bio-ITプラットフォームトレーニング

正確で超高速な二次解析プラットフォームと、それに付随するパイプラインの詳細をご確認ください。

企業レベルの保護

最も厳しいセキュリティ要件を満たすために、セキュリティとコンプライアンスを中核とするIllumina Connected Analyticsのプラットフォームが構築されました。

参考文献
  1. Li H. and Durbin R. Fast and accurate short read alignment with Burrows–Wheeler transform. バイオインフォマティクス 2009 Jul 15; 25(14): 1754–1760.
  2. Dobin A. et al. STAR: ultrafast universal RNA-seq aligner. バイオインフォマティクス 2013 Jan; 29(1): 15–21.
  3. Langmead B. et al. Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. Genome Biology 2009 10:R25