シーケンスデータの下流の解析のために望ましい形式を選択する

FASTQファイルなど互換性のあるシーケンスファイル形式へのデータ変換用として、また次世代シーケンサー(NGS)下流の解析用として、多様なオプションを利用できます。イルミナのシーケンスシステムは、データ管理、解析、コラボレーションのためにクラウドベースのインフォマティクスプラットフォームへと容易にデータを合理化できるように設計されています。
生データファイルは、大規模なコホートの合理化された集約とマイニングのために、標準データ形式と互換性がある、または容易に変換できるシーケンスファイル形式で提供されます。
FASTQは、生のシーケンスデータとクオリティスコアの両方を保存する、テキストベースのシーケンスデータファイル形式です。FASTQファイルは、イルミナのシーケンスシステムNGSのデータを保存する標準形式であり、幅広い二次データ解析ソリューションのための情報として使用できます。
MiniSeqとMiSeqのシーケンスシステムでは、データをBCL形式からFASTQ形式に自動変換するオプションが提供されるため、別個の変換ソフトウェアは不要です。
FASTQ ORAは、テキストベースのFASTQシーケンスデータファイル形式をバイナリー圧縮化したファイル形式です。fastq.oraファイルは呼応するfastq.gzファイルよりも最高5倍も小さいファイルですが、データの整合性は損なわれません。すべてのfastq.oraファイルは、こちらで入手できる無料の解凍ソフトウェアを使用して読み取ることができます。インストール後はシンプルなコマンドを使用して、解凍の出力を、BWA1、STAR、2およびBowtie3といった幅広い定評のあるマッピングツールに直接パイプ処理できます。DRAGEN ORA圧縮は、DRAGENサーバーおよびNextSeq1000/2000搭載型で利用できます。
バイナリーベースコール(BCL)ファイルには、イルミナシーケンスシステムで生成された生データファイルが含まれます。BCLシーケンスファイル形式をユーザー開発または第三者のデータ解析ツールで使用するには、FASTQ形式に変換する必要があります。
DRAGEN二次解析では、そのパイプラインパッケージの一環として、BCL形式からFASTQファイルへの迅速な変換が可能です。イルミナはまた、BCLファイルをFASTQファイルに変換するためのBCL Convertソフトウェアを提供しています。BCL Convertは、下流の解析のためにデータを逆多重化し、BCLファイルを標準FASTQファイル形式に変換するスタンドアロンのソフトウェアソリューションです。
FASTQファイルは、シーケンスデータ解析における典型的な開始形式です。しかし、BaseSpace Sequence Hubで、二次解析や三次解析のプログラムで一般的なその他のファイル形式を作成することもできます。
NGSデータの二次解析または三次解析中、イルミナソフトウェアプラットフォームやアプリは、多くの場合、解析ワークフローの一環として、生シーケンスファイルをFASTQファイルから他のシーケンスファイル形式(.vcf、.bamなど)に変換します。
ユーザーガイド、リリースノート、追加の技術情報にアクセスできます。
専門インストラクターによるNGSのハンズオントレーニングを実施しています。ライブ形式または自分のペースで学べるオンラインコース、その他の教育リソースも提供しています。
DRAGEN二次解析パイプラインは、ゲノム、エクソーム、トランスクリプトーム、メチローム研究など、さまざまなNGS実験タイプをサポートします。
ビルトインの高速かつ安全で拡張性を備えたクラウドで、大量のゲノム/NGSデータセットを保存・処理し、共有します。
電子メールアドレスをご入力の上、ご登録ください。