初心者のためのバイオインフォマティクス

初心者のためのバイオインフォマティクス

イルミナなら、より速く、より簡単に、よりお手頃な価格で

NGSデータとバイオインフォマティクスの解析

NGSデータの解析を簡単に

バイオインフォマティクスの使用には、不安がつきまとうものです。最近まで、シーケンサーのデータを解析するには、バイオインフォマティクスの高度な経験が必要とされていました。多くのラボでは、限られた社内外のバイオインフォマティシャンに依存しており、長いターンアラウンドタイムを強いられていました。NGSデータの解析と解釈は、洞察を得るために苦心する多くのラボにとって、引き続き主要な阻害要因となっています。幸いなことに、使いやすい市販の解析および解釈ツールが多数用意されており、NGSデータ解析も容易です。

バイオインフォマティクスを始める

バイオインフォマティクスソリューションの評価では、いくつか考慮すべき事項があります。

  • 統合と互換性:シーケンス装置、ソフトウェア、ワークフローとシームレスに統合できれば、データ転送の問題が軽減され、解析と探索のプロセスが合理化されます。業界標準のフォーマットやプロトコルとの互換性があれば、他のツールやリソースとの相互運用性が保証されます。
  • 正確性とイノベーション:市販のソフトウェアを購入する場合も、独自のインフォマティクスワークフローを構築する場合も、アルゴリズム、データベース、パイプラインが包括的で堅牢である必要があります。ゲノム発見の速度が急速に高まっているなか、一貫して高品質の結果を得るには、最新のパイプラインとイノベーションでワークフローを簡単に更新できる能力が必要です。商用ソリューションの場合は、発表論文、顧客の声、および独立した評価を通じて、データ精度が高いことを確認します。
  • 複数のアプリケーションとユースケースのサポート:具体的な研究要件を満たすソフトウェアの能力を評価します。プロジェクト固有の課題に対処するためには、研究の複数の領域、設定可能なワークフロー、データ形式、および複数の展開オプションにわたるアプリケーションをサポートする能力が不可欠です。
  • スケーラビリティ:ニーズの拡大に合わせてシームレスに拡張できるように、バイオインフォマティクスのインフラが現在のデータ量に対応していることを確認します。大規模なデータセットをタイムリーに解析・処理するには、スケーラブルなプラットフォームが不可欠です。

バイオインフォマティクスの詳細については、遺伝子発現と制御のeBookをダウンロードしてください

イルミナのデータ解析ツールの利点

イルミナは、シーケンサーを簡単に接続できる、直感的で使いやすいソフトウェアを提供します。稼働し始めて間もないラボ向けには、単一サンプルのレポート作成、バイオマーカーの探索、集団研究向けにカスタマイズされたサービスを提供しています。当社のツールは、シーケンスランが完了した直後に起動するようにセットアップでき、自動洞察やレポートにすぐに戻ることができます。イルミナは、使いやすい視覚化ツールと最も正確な二次解析¹を提供し、信頼性の高い洞察をより迅速に得るのに役立ちます。

受賞歴を誇る精度

当社の解析ソフトウェアは、「PrecisionFDAの真実への挑戦」で見せた最高の精度と全体的な精度で業界の課題を勝ち取り、データ精度の基準を改めました。1Illumina Genomeは、イルミナのシーケンサーと組み合わせることで市場で最高の精度を提供しています。

包括的

研究室や臨床検査室向けのさまざまなユースケースとアプリケーションをサポートするデジタルソリューションを拡張したスイート。

エンドツーエンドのコネクテッド(Connected)なワークフロー

Illumina Connected Softwareは、ラボやサンプル管理から解釈まで、NGSワークフローのあらゆるステップに対応する統合ソリューションを提供します。手動タッチポイントを減らし、より深い洞察をより迅速に得られます。

使いやすい

厳選された包括的なポイント アンド クリック分析アプリケーションのメニューと、使いやすいグラフィカル インターフェースを活用して、直感的なガイド付き解析を行います。

セキュアで共有可能

セキュリティとプライバシーは、イルミナのソフトウェアの中核をなす要素です。エンタープライズクラウドソリューションとオンプレミスソリューションの両方が、世界および地域の規制を考慮した上で構築されています。機密性の高いゲノムデータなら、イルミナにお任せください。

研究に合わせて拡張

当社のソリューションは、単一サンプル解析のサポートから集団全体の解析まで、規模の拡大に合わせて拡張できます。研究者は、単一サンプルまたは複数のソースからの集約データを解釈して、遺伝的傾向を把握し、集団規模で発見することが可能です。

「BaseSpace Sequence Hubにより、バイオインフォマティクススタッフやサーバーを必要とせずに、データの解析、保存、および配布を可能にします。BaseSpaceがなければ、これだけのデータ出力と運用効率を得るには時間もコストももっとかかっていたことでしょう。」

注目のイルミナソフトウェア
注目のソフトウェアツール 研究のタイプと規模 バイオインフォマティクス体験
Clarity LIMS
自動化されたサンプル追跡、ワークフロー、データ管理のためのラボ情報管理システム(LIMS)。

規模拡大を目指す規制準拠ラボ

初心者から専門家まで

BaseSpace Sequence Hub
ラン管理、モニタリング、バイオインフォマティクス解析を簡素化。

小規模研究:探索研究

初心者

Illumina Connected Analytics
イルミナのシーケンスシステムのNGSデータを高精度、包括的、超効率的に二次解析する強力なバイオインフォマティクスソフトウェア スイート。

集団研究や臨床研究などの大規模研究

中級から専門家まで

DRAGEN Secondary Analysis
DRAGENプラットフォームは、NGSデータを処理し、洞察の取得に向け三次解析を行う二次解析ソフトウェアスイートです。

小規模から大規模の探索研究、臨床研究、集団研究

初心者から専門家まで

Emedgene
WGS、WES、バーチャルパネル、ターゲットパネルのドライラボワークフローを合理化できるAI優先順位付けを備えた自動洞察ソリューション。

生殖系列研究におけるサンプル解析のための運用可能なワークフローを求める小規模および大規模ラボをサポート

初心者から専門家まで

Illumina Connected Insights
幅広いアプリケーションやバリアントタイプに対応するバリアント解釈をサポートする包括的な洞察と自動化。

腫瘍学研究におけるサンプル解析のための運用可能なワークフローを求める小規模および大規模ラボをサポート

初心者から専門家まで

ロースループット装置とミッドスループット装置を使用する、定評のあるアプリケーション向けのソフトウェア解析パイプライン
注目のDRAGENパイプラインとソフトウェアツール 定評のあるアプリケーション 推奨装置
DRAGEN RNA
RNAリードのマッピングとアライメント、RNAの量化、遺伝子融合検出、および小バリアントコーリングを実行します。

遺伝子発現プロファイリング

発現差解析

バイオマーカーの発見

ロースループットとミッドスループットのベンチトップシーケンサー。NextSeq 1000および2000は、データ解析内蔵です。
MiSeqシステム
NextSeq 1000および2000システム

DRAGEN Targeted Microbial
BaseSpaceを数回クリックするだけで、イルミナ ウイルス濃縮パネルまたはタイル アンプリコン キット(COVIDSeq、IMAP)を解析可能。コンセンサスゲノムとカバレッジプロットとの最適な一致や同定を提供します。

微生物/ウイルスシーケンス

ロースループットのベンチトップシーケンサー。
iSeq 100
MiniSeq
MiSeqシステム*

DRAGEN Enrichment
DRAGEN Enrichment Pipelineは、DRAGENの生殖細胞系と体細胞系のコーラーを、エンリッチメントサンプルの解析専用に設計されたパイプラインにまとめたものです。エンリッチメントメトリクスとレポート作成一式が含まれます。

エクソームシーケンス

データ解析内蔵のミッドスループットベンチトップシーケンサー。
NextSeq 1000および2000システム

Partekフロー
使いやすいインターフェース、ロバストな統計アルゴリズム、情報豊富な視覚化、ゲノムツールを備えたマルチオミクス解析ソリューション。ユーザーのスキルに関わらず、信頼性の高いデータ解析が可能です。

マルチオミクス

データ解析内蔵のミッドスループットベンチトップシーケンサー。
NextSeq 1000および2000システム

Correlation Engine
Correlation Engineはインタラクティブなオミクスの知識ベースで、プライベートなオミクスデータを生物学的コンテキストにおいて、高度にキュレーションされた公開データに当てはめます。

マルチオミクス

データ解析内蔵のミッドスループットベンチトップシーケンサー。
NextSeq 1000および2000システム

*内蔵データ解析サービスは装置によって異なります。

バイオインフォマティクスのよくある質問

NGSデータ解析ソフトウェアの設定とメンテナンスには、相当な専門知識と労力が必要ですが、多くのユーザーが費用を計算する際にその問題を考慮していません。こうした費用は高額になり、ソフトウェアのライセンスやサブスクリプション料金を上回ることがよくあります。
高品質の商用ソフトウェアでは、最も正確な解析を実現するために、専門家のチームがパイプラインを継続的に改善、テスト、更新しています。また、分かりやすい説明書を備え、専任のサポートチームを利用可能な商用メンテナンス付きソフトウェアであるため、最も必要なときにサポートを利用することができます。グラフィカルユーザーインターフェース(GUI)などの機能と組み合わせることで、バイオインフォマティクスの複雑さが概念化されるため、一貫した結果に迅速にアクセスできます。
ライブラリーが作成され、シーケンスされた後で、シーケンスシステム上のリアルタイム解析(RTA)ソフトウェアにより、ベースコールと関連するクオリティスコアが提供されます。

次に、シーケンサーから出力されたデータは、二次解析で処理され、シーケンスリードが整列され組み立てられます。これにより、サンプルの完全なシーケンスが提供され、DNAバリアントコールまたはRNA転写カウントが提供されます。

DNAバリアントコールを生成するプロセスでは、通常、数千から数百万のバリアントが明らかになり、三次解析と呼ばれるNGSワークフローの最終ステップで解釈され、生物学的洞察が導き出されます。三次解析またはバリアント解釈により、ユーザーはバリアントコールファイル(VCF)を取り込み、遺伝子発現/定量プロファイル、ヒートマップ、バイオマーカー発見のための視覚化、研究目的の単一サンプルレポートなど、アプリケーションに応じて下流解析を実行できます。
データ解析費用は、選択したインフラストラクチャとデプロイメントオプションに加えて、ソフトウェアの選択によって異なる場合があります。例えば、オープンソースのソフトウェアを使用する場合、ライセンスやサブスクリプション料金は必要ないことが多いですが、クラウドやオンプレミスでのコンピューティングや、パイプラインの開発とメンテナンスに関連するリソースにかかる費用が高くなる可能性があります。市販の解析ソフトウェアでは、ソフトウェアのライセンスやサブスクリプションの購入が必要ですが、多くの場合、より高い精度、より高速な実行時間、コンピューティングの削減が実現し、より優れたサポートを受けることができます。
イルミナのDRAGEN二次解析は、イルミナのシーケンスデータに対して最も正確で包括的な二次解析を提供します1。通常、30~35xヒト全ゲノムの解析には、クラウド(Illumina BaseSpace Sequence HubまたはIllumina Connected Analytics)の場合は6~10ドルかかり、コンピューティング集約型のパイプライン構成の場合、より高額になる可能性があります。ヒトの全エクソームまたはトランスクリプトームのサンプル1つあたりの費用はおよそ1.5~2.5ドルです。大量のデータを扱うプロジェクトでは、DRAGEN ORA可逆圧縮(DRAGENサーバーおよびDRAGEN内蔵装置で利用可能)により、データ転送費用とストレージ費用を最大80%削減できます1

イルミナでは、クラウドでデータを解析して保存することを選択した顧客に対して、計算コストとストレージ費用を追跡・監視できるようアカウント情報への明確で透明なアクセスを提供しています。データを長期にわたって保存する組織の場合、数か月以上アクセスする予定のないデータをアーカイブし、古いデータを削除することでも、データストレージにかかる費用を削減できます。

1イルミナ社内データ、2024年
LIMS、つまりラボ情報システムは、ラボデータとサンプルデータを効果的に管理するために使用するツールです。ゲノムラボでは、シーケンスデータの量と複雑さを管理するためにゲノムに固有のLIMSが特に重要になります。ラボで実行するサンプルが多いほど、ゲノムLIMSを使用して、正確かつ効率的でコンプライアンスに準拠したウェットラボデータ管理を行うことが重要になります。LIMSを実装すると、ワークフローの標準化、自動化、アクセシビリティを通してデータの完全性を強化することで、下流の解析に多大な影響を与えることができます。LIMSは、ラボが正確な記録を維持し、ワークフローを合理化し、品質管理を確保し、チーム間のコラボレーションを向上させるのに役立ちます。

LIMSがラボで何を実現するかの詳細については、こちらをご覧ください。
はい。イルミナは、お客様に幅広いトレーニングオプションを提供しています。お客様のアプリケーション領域とテストメニューに最適なソフトウェアソリューションを選択後に、イルミナが実装とトレーニングのニーズを調査いたします。トレーニングはイルミナのソフトウェア実装パッケージの一部として組み込まれており、ウォークスルーコンサルティング、プラットフォームとフィルターの設定、データ入力設定、プロジェクト管理、レポートのカスタマイズ、その他の主要なソフトウェア機能に関するトレーニングをご利用いただけます。また、イルミナのサポートサイトにアクセスして、オンラインコースやインストラクターによるトレーニングを通じてベストプラクティスや最新の手法を学習していただくことも可能です。
データセキュリティとプライバシーは、NGSの実験を設定する前に考慮すべき重要な要素です。データをローカルに保管するか、クラウドに保管するかについて最もよく理解しているのはお客様自身です。イルミナは、どの場所を選択しても、両方の展開オプションを備えたソフトウェアを提供しています。考慮すべき要素には、地域や組織にデータ保管要件や厳格なコンプライアンスポリシーがあるかどうかなどがあります。データをローカルに保存する場合、組織がデータをどのようにセキュアに保護するかについて考慮することが重要です。ほとんどの組織では、プロジェクトの規模とデータ量に応じて、初期の設備投資を必要とする専用の施設とストレージが求められます。

Amazon Web Services (AWS) やGoogle Cloud Provider (GCP) などのエンタープライズクラウドにデータを保存すると、クラウドセキュリティとプライバシーの専門家で構成された専任チームにアクセス可能で、クラウド環境内で保存およびアクセスされるデータが暗号化され、セキュアに保護されます。データがすでにクラウドに保存されているため、従業員同士のコラボレーションもセキュアに効率化されます。

詳細については、ゲノムデータの保存とセキュリティをご覧ください。
インフォマティクスのリソース
顧客の動画 Helixでのインフォマティクスを簡単にする
Helixでのインフォマティクスを簡単にする

Helixのバイオインフォマティクス担当バイスプレジデントのWilliam Lee氏とイルミナのソフトウェアエンジニアリング担当ディレクターのJessica Gordon氏の二人が、HelixがBaseSpace Sequence Hubを使用することで世界最大規模のヒトエクソームシーケンスオペレーション企業へと急速に成長できた理由について説明します。

顧客の動画 創薬におけるインフォマティクスとゲノミクスの役割
創薬におけるインフォマティクスとゲノムの役割

アストラゼネカの創薬科学ゲノム研究センター(Centre for Genomics Research, Discovery Sciences, R&D)の責任者であるSlavé Petrovski氏に、創薬におけるインフォマティクスとゲノミクスの役割について伺いました。

DRAGENバリアントコール
DRAGENによる生殖系列の小バリアントコーリングの精度向上

本アプリケーションノートでは、真理値セットと比較して測定したDRAGENプラットフォームによる生殖系列の小バリアントコールの精度における最近の進歩について説明します。

事例研究
合理化されたワークフロー管理により大規模なシーケンスが可能

Rapid Novorは、BaseSpace Clarity LIMSソフトウェアの導入により、成長を続けるラボの今後のオペレーションに備えています。

バイオインフォマティクスに関する他のご質問があれば

どうぞお問い合わせください。当社のスペシャリストが、バイオインフォマティクスやデータ解析に関するご質問にお答えいたします。

製品情報のリクエスト

参考文献
  1. Illumina DRAGEN Secondary Analysisは、PrecisionFDA v2 Truth Challenge Benchmark Dataに基づき、99.83%の精度を達成した最初の単一プラットフォームです。詳細はこちら