Skip to content

用語集

NGS用語ガイド

シーケンスプロジェクトを計画する際には、主要な用語と重要な概念を明確にする次世代シーケンス用語集をご利用ください。

NGS用語集

NGSライブラリー調製の際に、シーケンスライブラリー内にある各DNA断片の5'末端と3'末端に結合させる短い配列特異的オリゴ。アダプターはイルミナのフローセル表面に存在する短い塩基配列と相補的です。
シーケンスリードをリファレンスゲノムと照合するプロセス。
イルミナのフローセル表面で生じる増幅反応。フローセルの製造時に、その表面を2種類の異なるオリゴヌクレオチドの叢でコーティングしています。これらは「P5」と「P7」と呼ばれます。ブリッジ増幅の第1ステップで、一本鎖シーケンスライブラリー(相補的なアダプター末端配列持つ)がフローセルにロードされます。ライブラリー内の個々の分子が、オリゴ叢を横切って「流れ」ていく際に相補的なオリゴと結合します。結合した断片の反対側の末端が大きく曲がって表面上にある別の相補的なオリゴに「架橋(ブリッジ)」することでプライミングが起こります。変性および伸長サイクルが何度も繰り返されて(PCRに類似)単一分子の局所的増幅がフローセル全体で生じ、何百万もの固有のクローンクラスターとなります。「クラスタリング」とも呼ばれるこのプロセスはNGS装置に搭載されたクラスターモジュールで行われます。
モーダルの起動
フローセルの表面に結合したテンプレートDNAのクローン集団。各クラスターはテンプレートの一本鎖DNAから成長したもので、クラスターが約1,000コピーになるまでブリッジ増幅によってクローン増幅します。フローセル上の各クラスターは1つのシーケンスリードを作出します。例えば、フローセル上にある10,000個のクラスターからは10,000個のシングルリードと20,000個のペアエンドリードが生じます。
モーダルの起動
すべてのi5インデックスがマトリックス内の各i7インデックスとペアになって固有のインデックスペアを作るが、固有の片側インデックスにはならないようなインデックスのペア。
in silicoでオーバラップするシーケンスリードをアライメントして作成した一続きの連続配列。
モーダルの起動

既知のリファレンス塩基にアライメントされる(塩基を「カバー」する)シーケンスした塩基数の平均値。例えば、全ゲノムを30×カバレッジでシーケンスした場合、ゲノム内の各塩基を平均で30回シーケンスしたことを意味します。カバレッジレベルが高くなるほど、信頼度の高いベースコールが行われます。

詳細はこちら
任意の深度でゲノムまたはターゲット領域にわたってシーケンスした塩基の割合を表すパラメーター(例、10×カバレッジ以上でカバーされた95%の塩基)。平均シーケンス深度(例、30×平均カバレッジ)では、許容限界値を下回るシーケンスした塩基の割合、または全くシーケンスされなかった塩基の割合は考慮されません。例えば、データセットで「10×カバレッジ以上でカバレッジ分布95%」と報告された場合は、塩基の5%が10×カバレッジの限界値未満でカバーされている、または全くカバーされていないことを示しています。そのため、一般にカバレッジ分布は平均カバレッジとともに用いられてシーケンス結果を説明します。
モーダルの起動
スライドガラスまたは他の固体表面に物理的に隔離した1本、2本、または8本のレーンを備えたもので、NGS装置の消耗品として用いられます。シーケンステンプレートがフローセルの表面に固定されており、酵素がアクセスしやすい一方で表面に結合したテンプレートの高い安定性が維持され、蛍光標識ヌクレオチドの非特異的結合が少なくなる形でDNAが固定化されるように設計されています。固相増幅(クラスター形成)では、近接した位置にある単一のテンプレート分子がそれぞれ同一のコピーを最大1,000個作り出します。密度は1 cm2あたり1,000万クラスター程度に達します。
必要なテキスト内容を変更
ライブラリー調製時に各DNA断片に付加する固有の短いDNA塩基配列。この固有の配列があるため、多数のライブラリーを1つにまとめて同時にシーケンスすることができます。1つにまとめられたライブラリーのシーケンスリードは、最終的なデータ解析の前にそのバーコードに基づきコンピューター処理によって識別され選別されます。ライブラリーのマルチプレックスは、スモールゲノムを扱う際や目的とするゲノム領域をターゲット化する場合に有効なテクニックです。バーコードを付けてマルチプレックスを行う場合、1回のランで解析するサンプル数が指数関数的に増えますが、費用や時間が大幅に増加することはありません。
モーダルの起動
ライブラリー調製時にサンプルDNAを断片化して、その特定サイズの断片(通常200~500 bp、より大きい場合もある)を2個のオリゴアダプターの間にライゲート、すなわち「インサート」します。元のサンプルDNA断片を「インサート」と呼ぶこともあります。

ゲノムDNAサンプル(またはcDNAサンプル)をシーケンスライブラリーに変換する分子生物学プロトコールです。これによってNGS装置でシーケンスできるようになります。ライブラリー調製の最初のステップはDNAサンプルのランダムな断片化で、その後各DNA断片に5'または3'アダプターをライゲーションします。代替法の「タグメンテーション」は、断片化反応とライゲーション反応を1つのステップにまとめたもので、ライブラリー調製プロセスの効率を大幅に向上します。

詳細はこちら
次世代シーケンスの別名。

ライブラリー調製時に、固有の短いDNA塩基配列(「インデックス」)を各DNA断片に付加するプロセス。この固有の配列があるため、多数のライブラリーを1つにまとめて同時にシーケンスすることができます。1つにまとめられたライブラリーのシーケンスリードは、最終的なデータ解析の前にコンピューター処理によって識別され選別されます。ライブラリーのマルチプレックスは、スモールゲノムを扱う際や目的とするゲノム領域をターゲット化する場合に有効なテクニックです。マルチプレックスを行う場合、1回のランで解析するサンプル数が指数関数的に増えますが、費用や時間が大幅に増加することはありません。

詳細はこちら
モーダルの起動

シーケンスライブラリーの全DNA断片にまたがり各塩基位置でヌクレオチドA、C、G、Tの割合が等しいもの。カラーバランスはイルミナのシーケンスシステムでイメージ解析を効率的に行うために必要です。そのため、ほとんどのイルミナライブラリー調製ワークフローにはランダム断片化ステップが含まれており、ライブラリー内の各塩基位置で必要な塩基多様性を生成します。

報告書を見る
モーダルの起動

同一のランで1つのDNA断片を両端からシーケンスするプロセス。

詳細はこちら
モーダルの起動

ベースコールにおけるエラー確率を予測または推定するNGSのパラメーター。クオリティスコア(Qスコア)は非常に小さなエラー確率を伝えるための方法になります。Qスコアが高いほど、ベースコールの信頼性が高く不正確さが少ないことを意味します。

詳細はこちら
リファレンスゲノムとは完全にシーケンスとアセンブルが終了したゲノムのことで、新規のシーケンスリードをアライメントして比較する際の基準となります。通常、データ解析の最初のステップで、シーケンスランから生じたリードをリファレンスゲノムとアライメントします。リファレンスゲノムの例としてhg19とhg38が挙げられます。
SBSテクノロジーでは4種類の蛍光標識ヌクレオチドを使用してフローセル表面にある数千万のクラスターを並行してシーケンスします。1回のシーケンスサイクルで、1種類の標識デオキシヌクレオチド三リン酸(dNTP)を核酸鎖に付加します。ヌクレオチド標識は伸長反応の「可逆的ターミネーター」になります。dNTPが結合した後、レーザー励起とイメージングにより蛍光色素を識別し、続けて次の結合ラウンドに入れるように酵素切断します。各サイクル中にシグナル強度の測定値からベースコールを直接行います。可逆的ターミネーターを結合した全4種類のdNTP(A、C、T、G)が個々に単独分子として存在するため、自然の競合により結合バイアスは最小限になります。
モーダルの起動
あるサンプル中に存在する特定のバリアントを検出する能力です。アリル頻度が低いほど、バリアントの検出に必要とされる感度は高くなります。次世代シーケンスはキャピラリー電気泳動よりも感度が高いため、希少変異を検出することができます。
シーケンスリードの開始点を示すアダプターシーケンスに隣接したPCRプライマー。シーケンスプロセス中に、このプライマーはテンプレート鎖上のシーケンスアダプター部分にアニーリングします。DNAポリメラーゼ酵素がこの部位に結合し、塩基単位で相補的なヌクレオチドを反対側の伸長している鎖に結合させます。
シーケンスライブラリー内にある各DNA断片に対応する塩基A、T、C、Gのデータ列。イルミナテクノロジーでは、ライブラリーをシーケンスすると各DNA断片がフローセルの表面でクラスターを形成し、各クラスターから単一のシーケンスリードが得られます。(例えば、フローセル上にある100万のクラスターからは100万のシングルリードと200万のペアエンドリードが作出されます。)リード長は、アプリケーションニーズに応じて25~300 bp、またはそれ以上に及びます。
基質に結合している蛍光物質の明るさ。Sequencing by Synthesisでは、各サイクル中にシグナル強度の測定値から直接ベースコールが行われます。
イルミナは、シングルインデックス、デュアルインデックスなどの複数のインデックス法に対応しています。シングルインデックスを用いる場合、最大48個の固有の6塩基インデックスを使用して、最大48個の固有の特異的にタグ付けしたライブラリーを作成できます。デュアルインデックスを用いる場合、最大24個の固有の8塩基インデックス1配列と最大16個の固有の8塩基インデックス2配列を併用して、最大384個の固有の特異的にタグ付けしたライブラリーを作成できます。
二本鎖DNAの断片化およびイルミナアダプターシーケンスとPCRプライマー結合部位のタグ付けを同時に行う高速の酵素反応。複合反応であるため、ライブラリー調製時に機械的断片化ステップを別に行う必要がなくなります。
モーダルの起動
ターゲットリシーケンス実験における全ターゲット領域の合計サイズ。ターゲットサイズはさまざまな固定パネルやカスタムパネル間で異なります。(例えば、22箇所のターゲット領域があるパネルで各ターゲット領域が100 kbの場合、合計ターゲットサイズは2200 kbになります。)
次世代シーケンス装置が生成するデータ総量。通常メガベース(Mb)またはギガベース(Gb)の単位で定義されます。
1メガベース = 1,000,000ベース。
1ギガベース = 1,000,000,000ベース。

すべてのi5インデックスとすべてのi7インデックスが1回限り使用されるようなインデックスペア。ユニークデュアルインデックスを用いると、インデックスホッピングがあるリードを識別して抽出できるため、マルチプレックスサンプルの信頼度がより高くなります。

報告書を見る

ゲノムのタンパク質コーディング領域(エクソーム)のみをターゲットにした広く利用されているシーケンス法。

詳細はこちら

ゲノム全体を塩基単位で把握する包括的な方法。

詳細はこちら

NGSの実験計画

 

リード長、シーケンスカバレッジなど、最初のシーケンスランに必要なものすべてをご覧いただけます。

計画を開始する

お問い合わせ

製品やNGSをどのようにはじめるかご質問がありますか?イルミナ営業部からご連絡します。

関連資料

NGSの詳細な概要

この詳しい概要では、大きな技術的進歩やイルミナシーケンスケミストリーの基礎知識などについて説明します。

オンライントレーニング

すべてのトレーニングコースを表示します。または近日開催予定のウェビナーに登録できます。

技術報告書

テクニカルサポートチームによるシーケンスのヒントとコツの詳細をご覧ください。