シーケンスファイル形式

さまざまなデータ解析オプションに対応するシーケンスファイル形式

シーケンスデータの下流の解析のために望ましい形式を選択する

イルミナシーケンスのファイル形式

FASTQファイルなど互換性のあるシーケンスファイル形式へのデータ変換用として、また次世代シーケンサー(NGS)下流の解析用として、多様なオプションを利用できます。イルミナのシーケンスシステムは、データ管理、解析、コラボレーションのためにクラウドベースのインフォマティクスプラットフォームへと容易にデータを合理化できるように設計されています。

生データファイルは、大規模なコホートの合理化された集約とマイニングのために、標準データ形式と互換性がある、または容易に変換できるシーケンスファイル形式で提供されます。

FASTQシーケンスのファイル形式

FASTQは、生のシーケンスデータとクオリティスコアの両方を保存する、テキストベースのシーケンスデータファイル形式です。FASTQファイルは、イルミナのシーケンスシステムNGSのデータを保存する標準形式であり、幅広い二次データ解析ソリューションのための情報として使用できます。

MiniSeqとMiSeqのシーケンスシステムでは、データをBCL形式からFASTQ形式に自動変換するオプションが提供されるため、別個の変換ソフトウェアは不要です。

FASTQファイルの詳細はこちら

FASTQ ORAシーケンスファイル形式

FASTQ ORAは、テキストベースのFASTQシーケンスデータファイル形式をバイナリー圧縮化したファイル形式です。fastq.oraファイルは呼応するfastq.gzファイルよりも最高5倍も小さいファイルですが、データの整合性は損なわれません。すべてのfastq.oraファイルは、こちらで入手できる無料の解凍ソフトウェアを使用して読み取ることができます。インストール後はシンプルなコマンドを使用して、解凍の出力を、BWA1、STAR、2およびBowtie3といった幅広い定評のあるマッピングツールに直接パイプ処理できます。DRAGEN ORA圧縮は、DRAGENサーバーおよびNextSeq1000/2000搭載型で利用できます。

BCLシーケンスファイル形式

バイナリーベースコール(BCL)ファイルには、イルミナシーケンスシステムで生成された生データファイルが含まれます。BCLシーケンスファイル形式をユーザー開発または第三者のデータ解析ツールで使用するには、FASTQ形式に変換する必要があります。

DRAGEN二次解析では、そのパイプラインパッケージの一環として、BCL形式からFASTQファイルへの迅速な変換が可能です。イルミナはまた、BCLファイルをFASTQファイルに変換するためのBCL Convertソフトウェアを提供しています。BCL Convertは、下流の解析のためにデータを逆多重化し、BCLファイルを標準FASTQファイル形式に変換するスタンドアロンのソフトウェアソリューションです。

BCL Convertソフトウェアをダウンロードする

その他のシーケンスファイル形式

FASTQファイルは、シーケンスデータ解析における典型的な開始形式です。しかし、BaseSpace Sequence Hubで、二次解析や三次解析のプログラムで一般的なその他のファイル形式を作成することもできます。

NGSデータの二次解析または三次解析中、イルミナソフトウェアプラットフォームやアプリは、多くの場合、解析ワークフローの一環として、生シーケンスファイルをFASTQファイルから他のシーケンスファイル形式(.vcf、.bamなど)に変換します。

BaseSpace Sequence Hubの詳細については、こちらをご覧ください。

補足資料

ディベロッパーポータル

ユーザーガイド、リリースノート、追加の技術情報にアクセスできます。

NGSトレーニング

専門インストラクターによるNGSのハンズオントレーニングを実施しています。ライブ形式または自分のペースで学べるオンラインコース、その他の教育リソースも提供しています。

Illumina DRAGEN二次解析パイプライン

DRAGEN二次解析パイプラインは、ゲノム、エクソーム、トランスクリプトーム、メチローム研究など、さまざまなNGS実験タイプをサポートします。

ゲノムデータの保存とセキュリティ

ビルトインの高速かつ安全で拡張性を備えたクラウドで、大量のゲノム/NGSデータセットを保存・処理し、共有します。

参考文献
  1. Li H. and Durbin R. Fast and accurate short read alignment with Burrows–Wheeler transform. Bioinformatics. 2009 Jul 15; 25(14): 1754–1760.
  2. Dobin A. et al. STAR: ultrafast universal RNA-seq aligner. Bioinformatics. 2013 Jan; 29(1): 15–21.
  3. Langmead B. et al. Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. Genome Biology 2009 10:R25
ゲノム解析技術に関する最新のニュース、ケーススタディ、情報をお届けいたします。

電子メールアドレスをご入力の上、ご登録ください。