シーケンスデータの下流の解析のために望ましい形式を選択する
FASTQファイルなど互換性のあるシーケンスファイル形式へのデータ変換のために、またシーケンスデータの下流の解析のために、多様なオプションを利用できます。イルミナのシーケンサーは、クラウドベースのデータ管理、解析、コラボレーションのためにIllumina Connected AnalyticsとBaseSpace Sequence Hubへと容易にデータを合理化できるように設計されています。
生データファイルは、大規模なコホートの合理化された集約とマイニングのために、標準データ形式と互換性があるか、または容易に変換できるシーケンスファイル形式で提供されます。DRAGEN Bio-IT Platformでは、最新のファイル形式であるFASTQ.ORAを利用できます。FASTQ.ORAは可逆圧縮ファイルであり、サイズの縮小、転送時間の短縮化、保管費用の削減を行えます。
FASTQは、生のシーケンスデータとクオリティスコアの両方を保存する、テキストベースのシーケンスデータファイル形式です。FASTQファイルは、イルミナのシーケンスシステムNGSのデータを保存する標準形式であり、幅広い二次データ解析ソリューションのための情報として使用できます。
MiniSeqとMiSeqのシーケンスシステムでは、データをBCL形式からFASTQ形式に自動変換するオプションが提供されるため、別個の変換ソフトウェアは不要です。
FASTQ ORAは、テキストベースのFASTQシーケンスデータファイル形式をバイナリー圧縮化したファイル形式です。fastq.oraファイルは呼応するfastq.gzファイルよりも最高5倍も小さいファイルですが、データの整合性は損なわれません。すべてのfastq.oraファイルは、こちらで入手できる無料の解凍ソフトウェアを使用して読み取ることができます。インストール後はシンプルなコマンドを使用して、解凍の出力を、BWA1、STAR、2およびBowtie3といった幅広い定評のあるマッピングツールに直接パイプ処理できます。DRAGEN ORA圧縮は、DRAGENサーバーおよびNextSeq1000/2000搭載型で利用できます。
バイナリーベースコール(BCL)シーケンスファイル形式をユーザー開発の、または第三者のデータ解析ツールで使用するにはFASTQ形式に変換する必要があります。NextSeqシーケンスシステム、HiSeqシーケンスシステム、およびNovaSeq 6000は、BCL形式で生データファイルを生成します。
DRAGEN Bio-IT Platformでは、そのパイプラインパッケージの一環として、BCL形式からFASTQファイルへの迅速な変換が提供されます。
イルミナはまた、BCLファイルをFASTQファイルに変換するためのスタンドアロンのBCL変換ソフトウェアを提供しています。BCL変換は、下流の解析のためにデータを逆多重化し、BCLファイルを標準FASTQファイル形式に変換するスタンドアロンの変換ソフトウェアソリューションです。
FASTQファイルは、シーケンスデータ解析における典型的な開始形式です。しかし、BaseSpace Sequence Hubで、二次解析や三次解析のプログラムで一般的なその他のファイル形式を作成することもできます。
NGSデータの二次解析または三次解析中、イルミナのインフォマティクスプラットフォーム内のソフトウェアプラットフォームやアプリは、多くの場合、解析ワークフローの一環として、生シーケンスファイルをFASTQファイルから他のシーケンスファイル形式(すなわち、.vcf、.bam)に変換します。
電子メールアドレスを入力してください。
ユーザーガイド、リリースノート、追加の技術情報にアクセスできます。
これらの無料のオンラインコースでは、ライブラリー調製、シーケンス、およびデータ解析の一般的なトピックについて学習します。
正確で超高速な二次解析プラットフォームと、それに付随するパイプラインの詳細をご確認ください。
最も厳しいセキュリティ要件を満たすために、セキュリティとコンプライアンスを中核とするIllumina Connected Analyticsのプラットフォームが構築されました。