NovaSeq Xシリーズの出荷開始により、イルミナの次世代ハイスループットプラットフォームでXLEAP-SBS ケミストリーが利用可能になりました。さらに25Bフローセルが利用可能になり、NovaSeq Xシリーズソフトウェアアップデート1.2は、デュアルフローセルシーケンスランで最大16テラ塩基を生成できるようになりました。ソフトウェアアップデート1.3は、データ品質と装置のロバスト性が大幅に改善されており、NovaSeq Xプラットフォームの進化を続けています。
この記事では、以下の点に重点を置いています。
- 多様性の低い条件下でのフローセルの収量、サンプルのデマルチプレックス法、精度の大幅な改善を含む、シーケンスデータの品質の向上
- DRAGEN v4.3へのアップグレード、 BCL Convertランタイムの短縮、より柔軟な構成オプションなど、NGS二次解析の強化
- 多様性の低いアプリケーションにおけるPhiX添加要件の軽減、RNAアプリケーション用の特別なレシピの排除、LIMSとのターンキー統合によるユーザビリティの向上
シーケンスデータ品質の向上
より高い収量:
ソフトウェアアップデート1.3では、シーケンスプロセスを促進する一連のイベントであるシーケンスレシピの最適化により、より高い収量を実現し、フローセルナノウェルから発せられるシグナルが増強されました。速度や滞留時間の調整など、サーマルステップとフルイディクスステップの変更によって改善を達成しました。 クラスター化プロトコールの主要なステップは、より明るく、よりロバストなクラスターを成長させるために最適化されました。ポストランウォッシュは、ラン間のフルイディクスシステムの洗浄をより効率的に行うために改善されました。これらの変化により、SN比が高くなることで、収量とクオリティスコアが向上しました。
レシピの改善に加えて、NovaSeq Xソフトウェアアップデート1.3では、イルミナがより高いデータ品質を追求するにあたって不可欠となる画像処理アルゴリズムも改善されました。ハイスループットフローセルでは、パターン化フローセルのウェル位置へのイメージピクセルのアライメントは特に困難です。これは、ウェル位置の推定がジッターや歪みの影響を受ける可能性があるためです。ジッターは通常、意図しないカメラの動き、装置の振動、または画像の再配置によって発生し、歪みはカメラレンズの形状によって誘発されます。ソフトウェアアップデート1.3では、フローセル上の空間的エラーを排除することで、ピクセルとウェルの位置の同期において優れた性能を示す新しいアプローチが実装されています。改善点を図1に示します。円はウェル内のクラスターの実際の位置を示し、Xマークは推定位置を示します。ヒートマップは、フローセルのセクション上のx方向(水平方向) の空間的エラーを示しており、ソフトウェア1.3アルゴリズムが適用された後に有意な減少が観察されます。

図1:ソフトウェア1.3アップデート前後の空間的ウェル位置エラー

図2:3種類のフローセルタイプに対応するNovaSeq Xソフトウェア1.2のパスフィルター分布

図3:3種類のフローセルタイプに対応するNovaSeq Xソフトウェアアップデート1.3のパスフィルター分布

図4:3種類のNovaSeq Xフローセルすべてについて、Q30を超える割合の平均が改善
サンプルのデマルチプレックス法の改善:
使用可能な収量は、フローセルパスフィルター上のクラスター数だけでなく、適切なサンプルにデマルチプレックスされたリード数にも依存します。
サンプルのデマルチプレックス法は、インデックスサイクル中のベースコーリング精度に依存しており、これはランで使用されるレーンあたりのサンプル数であるプレキシティにによって異なる場合があります。インデックスサイクル中のミスコールが測定され、ランのミスマッチ率が0、1、2塩基で報告されます。NovaSeq Xソフトウェア1.2は、デマルチプレックス効率が比較的低い(ミスマッチ率が高い)ため、一部のサンプル、特に低プレックスのラン(レーンあたり4~10サンプル)ではスループットが失われます。ソフトウェア1.2では、一部のインデックスは予想強度のサイクル依存的な低下を示し、そのインデックスのミスコール率が高くなるため、全体的なデマルチプレックス効率が低下します。
NovaSeq Xソフトウェアアップデート1.3では、この問題を軽減するための改善が行われました。これで、強度の予想レベルが適応的に学習され、インデックスサイクル中に情報がベースコーリングアルゴリズムに伝達されます。結果として得られる改善を図5Aに示します。NovaSeq Xソフトウェアアップデート1.3により、特に低プレックスの条件下で、1つのミスマッチ率の顕著な減少を示しています。さらに、図5Bは、インデックス依存性ミスマッチ率がソフトウェア1.3で大幅に改善されたことを示しています。

図5A:IDPFとTSPFのミスマッチ率とサンプルプレキシティの比較
図5B:IDPFとTSPFのミスマッチ率 とインデックスシーケンスの比較

図6:NovaSeq Xソフトウェアアップデート1.3の使用可能な収量の向上
低多様性条件における強化:
一部のシーケンスライブラリーでは、4つの塩基タイプはそれぞれ、特定のサイクルでシーケンスされたクラスターのプールに十分に存在しません。多様性が低いランとは、データ集団で4つの塩基のうち1つ以上が著しく少ないランのことです。多様性の低い条件下で高いデータ品質とベースコーリング精度を維持することは、リアルタイムベースコーリングにおいて困難です。多様性の低いアプリケーションをご利用のお客様は、NovaSeq Xソフトウェア1.2では、多様性の高いライブラリーであるPhiXを実際のシーケンスサンプルとともに十分なレベルで添加することをお勧めします。十分なレベルの添加PhiX(15%など)を使用する場合、ライブラリーの低多様性の性質は下流のアルゴリズムでマスクされ、高多様性ライブラリーと同等のデータ品質を維持します。しかし、この添加要件には、PhiXライブラリーが占有していたスループット(この例では15%)を失う可能性が伴います。
NovaSeq Xソフトウェアアップデート1.3は、多様性の低い設定でベースコールの性能を向上させることで、PhiXの添加率(5%)の要件を大幅に低減します。(多様性のレベルがサイクルごとに大きく異なるライブラリーについては、PhiXの添加率15%という以前のガイドラインを引き続き適用してください。) 性能の向上を図7Aおよび7Bに示します。これは、PhiXの添加率が低くても、NovaSeq Xソフトウェアアップデート1.3における低多様性ライブラリーで高いレベルのパスフィルターの割合とQ30を超えるデータ品質を維持できることを示しています。

図7A:PhiX添加率に対するパスフィルターの割合
図7B:PhiX添加率に対するQ30を超えるデータ品質の割合
強化された二次解析
DRAGEN v4.3へのアップグレード:
DRAGEN v4.3へのアップグレードは、マルチゲノムマッパーとパンゲノムリファレンスの更新により、精度を大幅に向上させます。パンゲノムリファレンスでは、サンプル集団を128まで拡張し、26の異なる祖先をカバーしています。マルチゲノムマッパーの進歩により、新しいリファレンスがより有効になり、DRAGEN v4.1と比較して、集団全体でSNP 偽陽性(FP)と偽陰性(FN)が平均で49.0%、Indel FP + FNが平均で19.6%減少しました。これらの改善は図8に示されており、HG001~HG007サンプルセット全体で35%~50%の減少を示しています。ヨーロッパの祖先サンプルのエラーも、DRAGEN v4.1のパンゲノムリファレンスと比較して40.2%減少し、ヨーロッパ以外のサンプルでは47.0%減少しました。

図8:DRAGEN v4.1.23およびv4.3.13のSNPおよびIndel偽陽性+偽陰性カウント
BCL Convertの迅速化:
データ品質の向上に加えて、装置内バージョンまたはBaseSpace Sequence Hubアプリケーションのいずれかを使用した場合、BCL Convertが迅速化されました。図9Aは、新しくリリースされた装置内のDRAGEN v4.3.13のランタイムがDRAGEN v4.1.23と比較して約5分の1に短縮されたことを示しています。ランタイムの短縮は、装置内の迅速化とより柔軟な構成オプションの組み合わせによって実現しています。例えば、以前に提供されたORA設定に加えて、レーン分割なし(NLS)やFASTQCメトリクス 生成などです。25Bフローセルの構成オプションおよび対応するランタイムを図9Bに示します。

図9A:25BフローセルのBCL Convertランタイム改善(時間)
図9B:構成パラメーターに対するBCL Convertランタイム
より柔軟な構成:
ランタイムの短縮に加えて、DRAGEN BCL Convert v4.3.13は追加の構成オプション(サンプルプロジェクトやレーン分割なしなど)にも対応できるようになりました。さらに、フローセル構成にさらに柔軟性が高まりました。DRAGEN v4.3.13は、シングルフローセルで最大12のワークフロー / ゲノムペアをサポートし、ワークフロー / ゲノムペアごとに最大32の固有の構成をサポートします。柔軟性の向上を表1に要約します。
DRAGENのバージョン | ワークフロー / ゲノムペア | ペアごとの構成 |
---|---|---|
v4.1.23 | 3 + BCL Convert | 8 |
v4.3.13 | 12 + BCL Convert | 32 |
表1:DRAGEN v4.1.23とDRAGEN v4.3.13の構成柔軟性
クラウドへのBAM/CRAM転送:
NovaSeq Xシステムのユーザーの多くは、DRAGENを使用して装置上でマッピングとアライメントを直接実行し、特殊な後処理(カスタムバリアントコーリングなど)をオフラインで実行します。このアプローチにより、マッピングとアライメントが、次のシーケンスランが始まる前に完了するため、ユーザーはDRAGENの高速な処理時間を活用することができます。ソフトウェアアップデート1.3によって、こうしたユーザーはFASTQ/ORAおよびBAM/CRAMをBaseSpace Sequence Hubに直接送信できるようになりました。
NovaSeq XのDRAGEN v4.3.13の詳細については、このリンクのリリースノートを参照してください。
ユーザビリティの向上
特別なレシピなしでのRNA処理:
一部のライブラリー調製法にアダプターを追加すると、シーケンスランの最初のサイクル内で塩基の多様性が低くなります(T塩基のみなど)。これに対しては従来、「ダークサイクル」のカスタムレシピ、つまりイメージングが実行されないサイクルを使用して対処されてきました。ただし、これらのカスタムレシピは、同じフローセルで、最初のサイクルでイメージングを必要とする他のライブラリーと互換性がない場合があります。
NovaSeq Xソフトウェアアップデート1.3における改善により、これらのユニークなライブラリーのシーケンスにカスタムダークサイクルレシピが不要になりました。その結果、これらのライブラリーを同じフローセル上でマルチプレックス化することで、マルチオミクスのユースケースをより柔軟に実現することができます。改善点を表2に示します。これは、ダークサイクルレシピなしのソフトウェア1.2(フォース故障状態)、カスタムダークサイクルレシピありのソフトウェア1.2、初期設定(ダークサイクルなし)レシピありのNovaSeq Xソフトウェアアップデート1.3の3つの条件下でのRNAライブラリーのシーケンスの主要メトリクスを比較したものです。予測通り、フォース故障状態では、結果として得られるシーケンス品質は低く、高いエラー率とクラスターパスフィルターの割合(%PF)は低くなっています。ソフトウェア1.3でダークサイクルレシピを使用しない場合、シーケンス品質が向上し、ソフトウェア1.3レシピの%PF改善により、ダークサイクルレシピでソフトウェア1.2に匹敵するエラー率とパスフィルターメトリクスがさらに向上します。ダークサイクルレシピの使用を継続したい方のために、ソフトウェア1.3では%PFレシピの改善も組み込んだカスタムダークサイクルレシピも提供します。

表2:ダークサイクルなしのソフトウェア1.3のクラスターパスフィルター改善率とエラー率

図10:高いTPMの一致率:ダークサイクルありのソフトウェア1.2とダークサイクルなしのソフトウェア1.3
Illumina Clarity LIMSの統合:
Illumina Run Managerは、Clarity LIMSとNovaSeq Xシステム間のターンキー統合を、完全にオンプレミスの顧客に提供します。
主な特徴には以下があります:
- プーリング、希釈、変性などに関するステップバイステップのガイダンスを備えた、すぐに使えるNovaSeq Xワークフロー
- シーケンスランと解析計画
- シーケンスランのステータスとメトリクスの追跡
- サンプルシートのバリデーション
- 解析ランのステータスとメトリクスの追跡
APIを介したサードパーティLIMSサポート:
最新のアップデートにより、NovaSeq Xユーザーは、ロバストなAPI機能を通じて、サードパーティ製または自家製LIMSをこれまで以上に簡単に統合できるようになりました。これらの機能強化により、LIMSワークフローがいかに簡素化され、合理化されるかをご紹介します。
- ベアラトークンによる安全な承認:ユーザーは認証クライアントを作成し、認証情報を安全に生成し、それらを使用してベアラトークンを取得できるようになりました。このトークンにより、イルミナランマネージャー(IRM)エンドポイントとのシームレスで安全なやり取りが可能になります。
- Webhookによるリアルタイム通知:イベントトリガー通知で最新の情報を把握できます。ユーザーは、IRMで特定のイベントが発生するたびに、外部ウェブサーバーに更新を自動的に配信するようにWebhookをセットアップできるため、タイムリーで効率的なモニタリングが可能になります。
- ラン管理の自動化:認定クライアントがLIMSから直接計画されたランを作成できるAPIにより、運用を簡素化します。これらのランは装置上で選択および開始できるため、手動操作を減らし、時間を節約できます。
よりシンプルなディスク容量管理:
NovaSeq Xシステムはハイスループットのため、大量のデータを管理するという課題に直面します。NovaSeq Xソフトウェアアップデート1.3では、2つの新しいデータ管理機能を提供することでデータ管理を簡素化します。第一に、ユーザーは、データが装置外の保管場所に正常に転送されると、装置から二次解析データを自動的に削除するようにシステムで設定することができます。第二に、一次解析データを装置内に保存する十分なスペースがある場合、ユーザーは2回目のシーケンスランを開始できます。第二の機能では、ユーザーはシーケンスランの終了前にいつでも装置から前のランのデータを削除できます。二次解析が開始するも、容量が不十分な場合、二次解析ランは自動的にキャンセルされます。
今後の展開
段階的な処理の開始: ユーザーは、最初のフローセルが進行中の間に、2番目のフローセルでランを開始できます。
ファイルベースのLIMS統合:初めて消耗品をローディングした後、ランの自動化を提供することで、オペレーターのミスを最小限に抑え、クリニカル分野やバイオ医薬品分野のお客様向けにトレーサビリティを強化します。
1.5B 600 Cycle キット:ショットガンメタゲノミクス、免疫レパートリープロファイリング、アンプリコンシーケンスなどのアプリケーションのためのハイスループットティアを解放し、1回のランでより深いカバレッジと長いリード長を実現します。
データ品質の向上:データ品質をさらに向上させ、お客様のワークフローの正確性と信頼性を高めます。
結論
NovaSeq Xシリーズのソフトウェアアップデート1.3により、データ品質と装置のユーザビリティの両方を大幅に改善できます。高いデータ品質の面では、シーケンスレシピの変更、画像処理アルゴリズム、および低多様性の強化によって、サンプルあたりの収量の向上が実現しています。さらに、二次解析はDRAGEN v4.3へのアップグレードで強化され、BCL Convertランタイムはより高速に、構成オプションはより柔軟になっています。最後に、ユーザビリティの面では低多様性アプリケーションに対するPhiX添加要件の低減、RNAアプリケーション用の特別なレシピの排除、およびLIMSとのターンキー統合といった改善を実現しました。