シーケンス精度の測定

クオリティスコア(Qスコア)とシーケンスランにおけるその意義を理解する

シーケンスクオリティスコア

シーケンスクオリティスコアは、ベースコールのエラー率を測定します。 Sequencing by Synthesis(SBS)テクノロジーでは、本来サンガーシーケンス法に開発されたものとほぼ同じPhredのようなアルゴリズム1,2により、各リードに含まれる各塩基に対してクオリティスコアが割り当てられます。

シーケンステクノロジーのビデオ
シーケンステクノロジーのビデオ

イルミナのSBSの原理についてはこちら。

任意の塩基のシーケンスクオリティスコア(Q)は、以下の式により定義されます:

Q = -10log10(e)

この式において、eはベースコールが正しく行われない確率推定値を表します。

  • Q値が高いほどエラーの確率が低いことを意味します。
  • Q値が低いほど、そのリードは使用できない部分が大きくなります。 また、偽陽性のバリアントコールも増加し、結果の精度が低下する恐れがあります。

以下に示すように、クオリティスコアが20であれば、エラーの確率は100分の1、コール精度は99%となります。

SBSテクノロジーの概要

イルミナのテクノロジーは、最適化されたSBSケミストリーを用いて大規模同時シーケンスを実現します。

詳細はこちら
シーケンスクオリティスコアとベースコール精度の関係
クオリティスコアベースコールが正しく行われない確率推定ベースコール精度
10(Q10)10分の190%
20(Q20)100分の199%
30(Q30)1000分の199.9%
複数のシーケンスアプリケーションに対応する柔軟性

強力かつ柔軟性のあるNextSeqシリーズで、全ゲノム、エクソーム、トランスクリプトームなどをシーケンスできます。

NextSeqアプリケーションはこちら
NextSeqシステム

イルミナのシーケンスケミストリーは、大多数の塩基でQ30を超えるクオリティスコアが得られる高い精度を実現しています。 このレベルの精度は、臨床研究をはじめとするさまざまなシーケンスアプリケーションに最適です。

シーケンスクオリティスコアに関する詳細については、以下のテクニカルノートをご覧ください。

電子メールにて最新のニュース、事例研究、アプリケーション情報をご提供します。ぜひご登録ください。
参考文献
  1. Ewing B, Hillier L, Wendl MC, Green P. (1998): Base-calling of automated sequencer traces using phred. I. Accuracy assessment. Genome Res. 8(3):175-185
  2. Ewing B, Green P. (1998): Base-calling of automated sequencer traces using phred. II. Error probabilities. Genome Res. 8(3):186-194