次世代シーケンサー(NGS)に関する用語集

NGS用語ガイド

当社の次世代シーケンス用語集を使用して、シーケンスプロジェクトを計画する際に重要な用語と重要な概念を明確にしてください。

NGS用語集

NGSライブラリー調製の一環として、シーケンスライブラリー内の各DNA断片の5’末端と3’末端にライゲーションされた短い配列特異的オリゴ。アダプターは、イルミナフローセルの表面に存在する短いシーケンスを補完するものです。
シーケンスリードをリファレンスゲノムに一致させるプロセス。
イルミナフローセルの表面で発生する増幅反応。フローセルの製造中、表面は“P5”と“P7”と呼ばれる2つの異なるオリゴヌクレオチドの芝生でコーティングされます。ブリッジ増幅の最初のステップでは、一本鎖シーケンスライブラリー(相補的なアダプターエンド付き)がフローセルにロードされます。ライブラリー内の個々の分子は、オリゴの芝生を流れながら相補的なオリゴに結合します。プライミングは、ライゲーションされた断片の反対側の端が曲がり、表面上の別の相補的オリゴに架橋する時に起こります。(PCRに似た)ディネーチャーと伸長サイクルを繰り返すと、フローセル全体で数百万のユニークでクローン性のクラスターに単一分子が局所的に増幅されます。このプロセスはクラスターとも呼ばれ、NGS装置内のオンボードクラスターモジュールで発生します。
起動モーダル
フローセルの表面に結合したテンプレートDNAのクローングループ。各クラスターは単一のテンプレートDNA鎖で播種され、クラスターが約1000コピーになるまでブリッジ増幅によってクローン的に増幅されます。フローセル上の各クラスターは、単一のシーケンスリードを生成します。例えば、フローセル上の10,000クラスターは、10,000シングルリードと20,000ペアエンドリードを生成します。
起動モーダル
各i5インデックスがマトリックス内の各i7インデックスとペアになり、固有のインデックスペアを作成するが、固有の片面インデックスは作成しないインデックスペア。
シーケンスリードのオーバーラップのアライメントによって生成される連続シーケンスインシリコの広がり。
起動モーダル

既知のリファレンス塩基にアラインする、またはカバーするシーケンスされた塩基の平均数。例えば、30×カバレッジでシーケンスされた全ゲノムは、平均してゲノムの各塩基を30回シーケンスしたことを意味します。より高いカバレッジレベルでは、ベースコールはより高い信頼度で行うことができます。

詳細はこちら
所定の深度でゲノムまたはターゲット領域を横切ってシーケンスされた塩基の割合を示す指標(例:95%の塩基が10倍以上のカバレッジでカバーされている)。平均または平均シーケンス深度(例:平均カバレッジの30倍)だけでは、許容限界値未満でシーケンスされた塩基の割合や、シーケンスされなかった塩基の割合は考慮されません。例えば、データセットの"カバレッジ分布が95%と報告され、10×以上のカバレッジがある場合、"これは5%の塩基が10×閾値未満でカバーされていたか、またはまったくカバーされなかったことも示しています。このため、カバレッジ分布はシーケンス結果を説明するために平均カバレッジとともに一般的に使用されます。
起動モーダル
NGS装置の消耗品として使用される、1、2、または8レーンの物理的に分離されたスライドガラスまたはその他の固体表面。シーケンステンプレートはフローセル表面に固定化されており、酵素へのアクセスを容易にしながら、表面結合テンプレートの高い安定性と蛍光標識ヌクレオチドの低い非特異的結合を保証しながら、DNAを提示するように設計されています。固相増幅(クラスター形成)では、近接して各単一テンプレート分子の同一コピーを最大1,000コピー作成できます。1平方センチメートルあたり約1,000万クラスターの密度を達成しています。
すべてのテキストが必要
ライブラリー調製中に各DNA断片に添加されるユニークな短いDNAシーケンス。ユニークなシーケンスにより、多くのライブラリーを一緒にプールし、同時にシーケンスすることができます。プールされたライブラリーからのシーケンスリードは、最終的なデータ解析の前に、そのバーコードに基づいて同定され、計算的にソートされます。ライブラリーマルチプレックスは、小さなゲノムや関心のあるゲノム領域をターゲットにする場合に有用な手法です。バーコードによるマルチプレックスは、1回のランで分析されるサンプル数を飛躍的に増加させ、ランコストやラン時間を大幅に増加させることはありません。
起動モーダル
ライブラリー調製中、サンプルDNAは断片化され、特定のサイズの断片(通常は200~500 bpですが、より大きい場合もあります)は2つのオリゴアダプターの間にライゲーションまたは挿入されます。元のサンプルDNA断片はインサートとも呼ばれます。

ゲノムDNAサンプル(またはcDNAサンプル)をシーケンスライブラリーに変換する分子生物学プロトコールで、NGS装置でシーケンスすることができます。ライブラリー調製の最初のステップは、DNAサンプルのランダムな断片化です。その後、各DNA断片に5’アダプターと3’アダプターをライゲーションします。あるいは、タグメンテーションは断片化反応とライゲーション反応を1つのステップにまとめ、ライブラリー調製プロセスの効率を大幅に向上させます。

詳細はこちら
次世代シーケンスの別名。

ライブラリー調製中に、固有の短いDNAシーケンス、すなわちインデックスを各DNA断片に添加するプロセス。ユニークなシーケンスにより、多くのライブラリーを一緒にプールし、同時にシーケンスすることができます。プールされたライブラリーからのシーケンスリードは、最終データ解析の前に、同定され、計算的にソートされます。ライブラリーマルチプレックスは、小さなゲノムや関心のあるゲノム領域をターゲットにする場合に有用な手法です。マルチプレックスは、ランコストやラン時間を大幅に増やすことなく、1回のランで分析されるサンプル数を飛躍的に増加させることができます。

詳細はこちら
起動モーダル

シーケンスライブラリー内のすべてのDNA断片にわたり、各塩基位置にA、C、G、およびTヌクレオチドの比率が等しいこと。イルミナのシーケンスシステムで効果的な画像解析を行うには、カラーバランスが必要です。したがって、ほとんどのイルミナのライブラリー調製ワークフローにはランダムな断片化ステップが含まれており、ライブラリーの各塩基位置で必要なシーケンスの多様性を生成します。

記事を読む
起動モーダル

同じランでDNA断片の両端からシーケンスするプロセス。

詳細はこちら
起動モーダル

NGSのメトリクスで、ベースコーリングにおけるエラーの可能性を予測または推定します。クオリティスコア(Qスコア)は、非常に小さなエラー確率を伝えるためのコンパクトな方法です。高いQスコアは、ベースコールの信頼性が高く、正しくない可能性が低いことを意味します。

詳細はこちら
リファレンスゲノムは、新しいシーケンスリードがアライメントされ比較される足場として機能する、完全にシーケンスされ組み立てられたゲノムです。通常、シーケンスランから生成されたリードは、データ解析の最初のステップとしてリファレンスゲノムにアライメントされます。参照ゲノムの例には、hg19およびhg38が含まれます。
SBSテクノロジーは、蛍光標識された4つのヌクレオチドを使用して、フローセル表面上の数千万のクラスターを並行してシーケンスします。各シーケンスサイクル中に、単一標識デオキシヌクレオチド三リン酸(dNTP)が核酸鎖に添加されます。ヌクレオチドラベルは重合の可逆ターミネーターとして機能します。dNTPの取り込み後、蛍光色素はレーザー励起とイメージングによって識別され、酵素的に切断されて次の取り込みを可能にします。ベースコールは、各サイクル中のシグナル強度測定から直接行われます。4つの可逆性ターミネーター結合dNTP(A、C、T、G)はすべて、単一の別個の分子として存在するため、自然競合は、組み込みバイアスを最小限に抑えます。
起動モーダル
特定のサンプル内の特定のバリアントを検出する能力を指します。アリル頻度が低いほど、検出に必要な感度は高くなります。次世代シーケンサーは、毛細血管電気泳動よりも高い感度を提供し、まれな変異を検出する能力を提供します。
シーケンスリードの開始点を示すアダプターシーケンスに隣接するPCRプライマー。シーケンスプロセス中、プライマーはテンプレート鎖上のシーケンスアダプターの一部にアニールします。DNAポリメラーゼ酵素は、この部位に結合し、相補的ヌクレオチド塩基を塩基ごとに成長する反対鎖に組み込みます。
シーケンスライブラリーの各DNA断片に対応するA、T、C、G塩基のデータ文字列。イルミナのテクノロジーでは、ライブラリーがシーケンスされると、各DNA断片がフローセルの表面上にクラスターを生成し、各クラスターが単一のシーケンスリードを生成します。(例えば、フローセル上の100万クラスターでは、100万のシングルリードと200万のペアエンドリードが生成されます。) リード長は、アプリケーションのニーズに応じて25 bp~300 bp以上の範囲になります。
基質に付着する蛍光色素の明るさ。合成によるシーケンスでは、各サイクル中のシグナル強度測定から直接ベースコールを行います。
イルミナはシングルインデックスとデュアルインデックスを含むいくつかのインデックス手法をサポートしています。シングルインデックスでは、最大48のユニーク6塩基インデックスを使用して、最大48のユニークにタグ付けされたライブラリーを生成できます。デュアルインデックスにより、最大24のユニーク8塩基インデックス1シーケンスと最大16のユニーク8塩基インデックス2シーケンスを組み合わせて使用して、最大384のユニークタグ付きライブラリーを生成できます。
二本鎖DNAが同時に断片化され、イルミナのアダプター配列とPCRプライマー結合部位でタグ付けされる迅速な酵素反応。混合反応により、ライブラリー調製中の個別の機械的せん断ステップが不要になります。
起動モーダル
ターゲットリシーケンス実験におけるすべてのターゲット領域の合計サイズ。ターゲットサイズは、事前に設計されたパネルやカスタムパネルによって異なります。(例えば、22のターゲット領域のパネルでは、各ターゲット領域が100 kbであり、合計ターゲットサイズは2200 kbになります。)
次世代シーケンス装置によって生成されるデータ量。通常、メガベース(Mb)またはギガベース(Gb)で定義されます。
1メガ塩基=1,000,000塩基。
1ギガベース=1,000,000,000塩基。

すべてのi5インデックスとすべてのi7インデックスが1回のみ使用されるようなインデックスのペア。独自のデュアルインデックスにより、インデックス付きホップリードを同定してフィルタリングできるため、マルチプレックスサンプルの信頼性が向上します。

記事を読む

ゲノムのタンパク質コード領域(エクソーム)のみをターゲットとする広く使用されているシーケンス法。

詳細はこちら

ゲノム全体の塩基ごとのビューを提供する包括的な手法。

詳細はこちら

NGS実験デザイン

 

リード長、シーケンスカバレッジなど、最初のシーケンスランに必要なすべてについて学びます。

計画の開始

お問い合わせ

当社製品やNGSの開始方法についてご質問がありますか? イルミナの担当者にお問い合わせください。

関連資料

NGSの詳細な概要

この詳しい概要では、大きな技術的進歩やイルミナシーケンスケミストリーの基礎知識などについて説明します。

オンライントレーニング

すべてのトレーニングコースを表示します。または近日開催予定のウェビナーに登録できます。

技術報告書

テクニカルサポートチームによるシーケンスのヒントとコツの詳細をご覧ください。

イルミナ iSchool Online

製品、技術、サイエンスの知識を強化する技術教育コース開催中!

詳細はこちら
イルミナ iSchool Online