NGSにおけるマルチプレックスとキャプチャー

執筆 IDT株式会社 浜本雄次

次世代シーケンシング(NGS)プラットフォームのスペックは驚異的な速度で向上しており、各ライブラリをプールしてシーケンスを行う、マルチプレックスとして知られる手法が一般的になりました。

マルチプレックス法では、各ライブラリにインデックス配列またはバーコード配列と呼ばれる既知の配列を付加し、各ライブラリをプールします。
プールされた各ライブラリは、シーケンス後のデータからインデックス配列を指標に割り当てることで、一度のシーケンスで多サンプルを解析できるようになります。その結果、各サンプルあたりのシーケンスコストを大幅に下げることが可能です。

図1.シーケンスの際のマルチプレックス
またNGSの実験コストを下げる方法として、目的の配列のみを濃縮してシーケンスを行う、ターゲットシーケンスの手法があります。
ターゲットシーケンスとして代表的なエクソームシーケンスでは、ゲノム中の3%のエクソンを濃縮することで、既知の疾患関連変異の約85%が解析できる効率の良い手法です。

図2. ターゲットキャプチャーによる目的配列のみの取得
しかしながら、プローブキャプチャーによるターゲットシーケンスでは、​濃縮のための追加試薬コストが懸念と考えている方もいらっしゃいます。​
実際はプローブキャプチャーによる濃縮の際も、各ライブラリにインデックス配列が付加されているため、プールして濃縮することが可能です。
一度に多サンプルを濃縮できますので、処理可能なサンプル数を増やし、​各サンプルあたりの試薬コストを大幅に下げることが可能です。

図3. ターゲットシーケンスの際のマルチプレックス

例)12サンプルをマルチプレックスして、Exome panel(16 rxn*、480,000円)でキャプチャーした場合​

*rxn = キャプチャー回数​
処理可能サンプル数:12サンプル × 16 rxn = 192サンプル​
1サンプルあたりの価格:480,000円 ÷ 192サンプル = 2,500円​

またプローブによるマルチプレックスでは、各ライブラリあたりのデータへの影響も懸念されます。​
IDT社では、マルチプレックスでプローブキャプチャーを行った際のデータへの影響を検討致しました。

図4. ライブラリ量とduplicate %の関係
各ライブラリ500 ngでプールした場合と、各ライブラリの総量が500 ngでプールした場合のdupicate %を比較しました。
プローブはxGen® Acute Myeloid Leukemia Cancer Panelを使用し、NextSeq® System (Illumina)でシーケンス後、Picard’s HsMetricsを用いて解析を行いました。

図5. 500 ng/ライブラリをマルチプレックスした場合、均一性の高いデータを取得可能
図1と同様の条件で実験を行い、各ライブラリ500 ngでプールした場合のターゲット配列のカバレッジ[bases covered at >X(%)] をPicard’s HsMetricsを用いて解析しました。

図4、5より、各ライブラリを500 ng 用いることで、データの質に影響がないことが分かりました。
高いカバレッジ均一性を保ったまま、マルチプレックスを用いたシーケンスを行うことが出来るため、​試薬コストを抑えながら十分なシーケンスデータを取得可能です。

マルチプレックスを行ってもデータの質を維持できるのは、弊社独自の個別合成方法により、​高品質なプローブ合成が出来ているためです。
» xGen®製品の特徴について詳しくはこちらをご覧下さい。​

またFFPEなどの希少サンプルで、十分なライブラリ量を調製することが難しい場合は、duplicate % 等へのシーケンスデータへの影響を考慮して実験計画を準備することが重要です。

References