次世代シーケンスのコントロールとしての人工遺伝子合成(gBlocks)
各実験において結果を保証するにはコントロールが必要ですが、次世代シーケンス実験でも、合成DNA断片を用いることで評価できます。
本記事では、次世代シーケンスのコントロールとして、gBlocks Gene Fragmentsの便利な利用方法をご紹介します。
本記事では、次世代シーケンスのコントロールとして、gBlocks Gene Fragmentsの便利な利用方法をご紹介します。
多検体取り扱い時の注意点
次世代シーケンス(NGS)には、未知配列の決定と解析、既知配列に起こった変化と多型の検出、遺伝子発現の定量など、幅広い利用方法があります。NGSの強みの一つは、多数の検体のシーケンスと解析を同時にできることです。
ライブラリ調製では、各検体から抽出したDNAをまず断片化し、既知のインデックス配列をライゲーションします。インデックス配列によりタグ付けした各ライブラリは、プールおよびマルチプレックス化し、シーケンスに用います。
一度に多検体のマルチプレックスを行うために、2万種類ものインデックスを使用することもできます[1]。
しかしながら、一度に多検体の処理を行うと、クロスコンタミネーションや検体取り違えのリスクが生じ、データ解析エラーやリードのアサインミスにつながります[2、3]。
これらの確認や実験パラメーターの検証に、NGSスパイクインコントロールとして、プラスミドや合成オリゴヌクレオチド断片の使用が推奨されています[2-6]。
ライブラリ調製では、各検体から抽出したDNAをまず断片化し、既知のインデックス配列をライゲーションします。インデックス配列によりタグ付けした各ライブラリは、プールおよびマルチプレックス化し、シーケンスに用います。
一度に多検体のマルチプレックスを行うために、2万種類ものインデックスを使用することもできます[1]。
しかしながら、一度に多検体の処理を行うと、クロスコンタミネーションや検体取り違えのリスクが生じ、データ解析エラーやリードのアサインミスにつながります[2、3]。
これらの確認や実験パラメーターの検証に、NGSスパイクインコントロールとして、プラスミドや合成オリゴヌクレオチド断片の使用が推奨されています[2-6]。
任意の二本鎖DNA断片を合成できるgBlocks
gBlocks Gene Fragmentsは、カスタム設計可能な直鎖状の二本鎖DNA断片です。
gBlocksをコントロールとして用いると、ターゲット配列と同じ実験条件で、検体の追跡、実験パラメータの測定、品質管理の確認や検証に使用できます。
gBlocks断片は125〜3000 bpの配列長で、ターゲットDNA配列と非相同性かつ、ライブラリのインサート長やGC含量は同じレベルになるように設計することができます。
またコントロール配列には、プライマーが結合する配列など、特定の配列も含むことができます。
gBlocks断片をスパイクインコントロールとして用いる場合、これらの断片を特定のコピー数(既知の濃度)となるよう調製し、DNA抽出前や断片化後、あるいはライブラリ調製後の検体に追加することができます。
検体に追加したコントロールの濃度やコピー数を測定し、gBlocks断片のシーケンスデータが実験自体のデータに影響を与えないようにすることが大切です。
本記事では、全ゲノムやターゲットシーケンスにおける、gBlocksコントロールの便利な利用法をご案内します。
gBlocksをコントロールとして用いると、ターゲット配列と同じ実験条件で、検体の追跡、実験パラメータの測定、品質管理の確認や検証に使用できます。
gBlocks断片は125〜3000 bpの配列長で、ターゲットDNA配列と非相同性かつ、ライブラリのインサート長やGC含量は同じレベルになるように設計することができます。
またコントロール配列には、プライマーが結合する配列など、特定の配列も含むことができます。
gBlocks断片をスパイクインコントロールとして用いる場合、これらの断片を特定のコピー数(既知の濃度)となるよう調製し、DNA抽出前や断片化後、あるいはライブラリ調製後の検体に追加することができます。
検体に追加したコントロールの濃度やコピー数を測定し、gBlocks断片のシーケンスデータが実験自体のデータに影響を与えないようにすることが大切です。
本記事では、全ゲノムやターゲットシーケンスにおける、gBlocksコントロールの便利な利用法をご案内します。
検体のトラッキング
ライブラリ作製等の処理に、クロスコンタミネーションや検体の取り違えが起きると、リードのアサインミスにつながる恐れがあります[2-6]。
このリスクを抑えるために、既知のgBlocksコントロール断片を各検体に追加して使用すると、データ解析においてコントロール断片を指標にクロスコンタミや取り違えを確認することができます。
検体トラッキング用のコントロールは、検体の断片化前と同じ条件であれば断片化前に、断片化後と同程度の配列長となれば断片化後に、検体に追加することが出来ます。
あるいは、アダプター配列をgBlocks中の配列に組み込むんでおけば、ライブラリ調製後にgBlocksをコントロールとして追加することもできます。なお、マルチプレックスで解析を行う場合は、調製後のライブラリにそれぞれのgBlocksを追加し、ライブラリプールを作製します。
設計時に考慮すべきこと:
このリスクを抑えるために、既知のgBlocksコントロール断片を各検体に追加して使用すると、データ解析においてコントロール断片を指標にクロスコンタミや取り違えを確認することができます。
検体トラッキング用のコントロールは、検体の断片化前と同じ条件であれば断片化前に、断片化後と同程度の配列長となれば断片化後に、検体に追加することが出来ます。
あるいは、アダプター配列をgBlocks中の配列に組み込むんでおけば、ライブラリ調製後にgBlocksをコントロールとして追加することもできます。なお、マルチプレックスで解析を行う場合は、調製後のライブラリにそれぞれのgBlocksを追加し、ライブラリプールを作製します。
設計時に考慮すべきこと:
- gBlocksコントロールはターゲットと相同な配列があってはなりません。
- 複数の検体を追跡するために、複数のgBlocksコントロールを用いる場合は、各コントロール配列に相同性がないことを必ず確かめる必要があります。
- 断片化前にコントロールを追加する場合は、コントロールを設計する際に断片化の方法(物理的または酵素的)を考慮する必要があります。GC含量の高い配列等、複雑な配列の場合は、酵素による断片化に影響を及ぼすことがあります。
- 検体がセルフリーDNA由来である場合は、検体の配列長(125~250 bp)にあわせたgBlocksコントロールを設計することができ、断片化は不要です。
- ハイブリダイゼーションキャプチャーを用いたターゲットシーケンスの場合は、gBlocksコントロール配列に対して設計されたプローブをパネルに追加する必要があります。
ハイブリダイゼーションキャプチャーにおけるキャプチャー効率の評価
xGen Lockdown Probe Poolsなど、ハイブリダイゼーションキャプチャーを用いるターゲットシーケンス法では、gBlocksコントロールを用いてキャプチャー効率の偏りを調べることができます。
目的の配列をもつコントロールは、ライブラリ調製前に既知の濃度・コピー数で検体に追加でき、キャプチャー後にqPCRによる定量でターゲット配列とコントロール配列の相対キャプチャー効率を評価できます。
各種の実験条件を検証(例えばGC含有量:20%、40%、60%、80%のコントロール使用)するため、キャプチャー効率を評価できるコントロールを設計することもできます。
設計時に考慮すべきこと:
目的の配列をもつコントロールは、ライブラリ調製前に既知の濃度・コピー数で検体に追加でき、キャプチャー後にqPCRによる定量でターゲット配列とコントロール配列の相対キャプチャー効率を評価できます。
各種の実験条件を検証(例えばGC含有量:20%、40%、60%、80%のコントロール使用)するため、キャプチャー効率を評価できるコントロールを設計することもできます。
設計時に考慮すべきこと:
- コントロールとターゲット配列の相同性が高い場合は、コントロールに対する別のプローブを、プローブのパネルやプールに追加する必要はありません。
- コントロールが実験条件の評価用など、ターゲット配列との相同性が低い場合は、コントロールに相補的なプローブをパネルやプールに追加する必要があります。
- 検体とパネルにそれぞれ追加するgBlocksコントロールとプローブは、ターゲット配列自体のキャプチャーに影響を与えてはいけません。
- コントロールとその相補プローブの相対コピー数が、ターゲットとその相補プローブと同程度になることを必ず確かめる必要があります。
アンプリコンシーケンスにおけるSNPの検出
検体のトラッキングは、rhAmpSeqシステムなどのアンプリコンシーケンス手法による、一塩基多型(SNP)の検出を行う場合にも用いることが出来ます。
この場合gBlocksコントロールは、SNPに隣接する領域をコードする設計や、マーカーとしてSNPの代わりに既知のバーコード配列や変異配列を組み込むこともできます。このバーコード配列や変異配列がコントロールリードとターゲットリードを区別します。
設計時に考慮すべきこと:
この場合gBlocksコントロールは、SNPに隣接する領域をコードする設計や、マーカーとしてSNPの代わりに既知のバーコード配列や変異配列を組み込むこともできます。このバーコード配列や変異配列がコントロールリードとターゲットリードを区別します。
設計時に考慮すべきこと:
- SNP領域を増幅するプライマーの結合配列を、gBlocks断片にも用いることで、同じプライマーセットを用いてターゲットとコントロールの両方を増幅することができます。
- gBlocksコントロールの配列長とGC含量の割合は、ターゲットのアンプリコン配列と同程度である必要があります。
アンプリコンシーケンスにおけるインプット量の正規化
アンプリコンシーケンスで用いるコントロールは、配列長やGC含量が様々なターゲット間で、PCR増幅率の差を確認することが出来ます。
各gBlocksコントロールを既知のコピー数で追加し、ターゲット配列と同時に増幅します。コントロールを定量して、複数のターゲット間でシーケンスに必要なインプット量を正規化することもできます。
設計時に考慮すべきこと:
各gBlocksコントロールを既知のコピー数で追加し、ターゲット配列と同時に増幅します。コントロールを定量して、複数のターゲット間でシーケンスに必要なインプット量を正規化することもできます。
設計時に考慮すべきこと:
- gBlocksコントロール配列は、ターゲットのアンプリコン配列と相同であってはいけません。
- ターゲット配列のプライマー結合部位を、gBlocksコントロール配列に含める必要があります。
- コントロールの配列長とGC含量は、ターゲットのアンプリコン配列と同程度にする必要があります。
ライブラリの調製中におこるエラー率の算出
gBlocksコントロールは、ライブラリ増幅中に起こるエラーの割合も確認できます。
gBlocksコントロール由来のリードに生じたエラーやミスマッチを、ターゲット配列由来のリードで発生する可能性のあるエラーとして、評価します。コントロール配列は、ターゲットと相同であってはなりませんが、配列長とGC含量は同程度にする必要があります。
シーケンス前のqPCRにより、コントロールをアダプターライゲーション効率の評価に用いることもできます。gBlocksコントロールは、断片化したターゲットの平均サイズと、同程度のサイズになるように設計します。
TruSeq™-Compatible Full-length AdaptersなどのTAライゲーションによるアダプターを付加する場合、コントロールを断片化後のターゲット検体に追加し、末端修復およびAテーリング工程を行うことで、コントロールも評価ができます。
各種シーケンサーのアダプターから、ターゲットシーケンス用のxGen製品まで、お客様の研究をサポートする高性能なNGS製品をご用意しております。今後NGSにおいて実験条件を評価する際には、検体の追跡や品質チェック、あるいはコントロールとして、gBlocks Gene Fragmentsをご検討ください。
またgBlocks断片のカスタマイズ設計とコピー数計算については、製品ページをご覧ください。
gBlocksコントロール由来のリードに生じたエラーやミスマッチを、ターゲット配列由来のリードで発生する可能性のあるエラーとして、評価します。コントロール配列は、ターゲットと相同であってはなりませんが、配列長とGC含量は同程度にする必要があります。
シーケンス前のqPCRにより、コントロールをアダプターライゲーション効率の評価に用いることもできます。gBlocksコントロールは、断片化したターゲットの平均サイズと、同程度のサイズになるように設計します。
TruSeq™-Compatible Full-length AdaptersなどのTAライゲーションによるアダプターを付加する場合、コントロールを断片化後のターゲット検体に追加し、末端修復およびAテーリング工程を行うことで、コントロールも評価ができます。
各種シーケンサーのアダプターから、ターゲットシーケンス用のxGen製品まで、お客様の研究をサポートする高性能なNGS製品をご用意しております。今後NGSにおいて実験条件を評価する際には、検体の追跡や品質チェック、あるいはコントロールとして、gBlocks Gene Fragmentsをご検討ください。
またgBlocks断片のカスタマイズ設計とコピー数計算については、製品ページをご覧ください。
References
原文:Tips for designing spike-in controls for next generation sequencing analysis
著者:Unnati Dev, MBIOT, Synthetic Biology Applications Specialist, IDT.
翻訳・監修:浜本 雄次
著者:Unnati Dev, MBIOT, Synthetic Biology Applications Specialist, IDT.
翻訳・監修:浜本 雄次
- Costea PI, Lundeberg J, et al. (2013) TagGD: fast and accurate software for DNA tag generation and demultiplexing. PloS One 8(3):e57521.
- Tourlousse DM, Ohashi A, et al. (2018) Sample tracking in microbiome community profiling assays using synthetic 16S rRNA gene spike-in controls. Sci Rep. 8(1):9095.
- Quail MA, Smith M, et al. (2014) SASI-Seq: sample assurance spike-ins, and highly differentiating 384 barcoding for Illumina sequencing. BMC Genomics 15:10.
- Jennings LJ, Arcila ME, et al. (2017) Guidelines for validation of next-generation sequencing-based oncology panels: a joint consensus recommendation of the Association for Molecular Pathology and College of American Pathologists. J Mol Diagn. 19(3):341–365.
- Sims DJ, Harrington RD, et al. (2016) Plasmid-based materials as multiplex quality controls and calibrators for clinical next-generation sequencing assays. J Mol Diagn. 18(3):336–349.
- Kim J, Park WY, et al. (2017) Good laboratory standards for clinical next-generation sequencing cancer panel tests. J Pathol Transl Med. 51(3):191–204.
製品フォーカス
xGen® 製品の特徴
xGen® 製品は、高品質なプローブを1本ずつ合成し、全てのプローブに品質管理及び納品量の標準化を行っています。SNPs、インデル、CNV、LOH、および転移の高感度の検出に有用で、既存のパネルを拡張したり、完全にカスタマイズされたパネルを作成したりする柔軟性も持ち合わせています。GC含量の多い領域が取得しにくいのはプローブの合成が難しいためですが、IDTでは、プローブ1本ずつに品質管理を行っているため、納品したプローブプール内に各プローブが確実に必要量含まれています。そのため、GCリッチな領域を含むターゲット領域全体を均一に取得可能です。
» xGen®製品の特徴について詳しくはこちらをご覧下さい。
診断用のxGen Lockdownプローブも利用できます。 詳細は、japan-cc@idtdna.comにお問い合わせください。
xGen® Lockdown® Probes
新規プローブセットの作製や、お手持ちのプローブセットの拡張・補填など実験目的に合わせたプローブセットをご購入いただけます。各遺伝子から目的の遺伝子をお選びいただくプレデザイン品と、ご希望のプローブ配列を合成するカスタム品をご用意しております。» xGen® Lockdown® Probesの詳細についてはこちらをご覧ください。
xGen® Lockdown® Panels
- エクソームおよび各疾患用に最適化されたプローブセットです。
- ・ xGen® Exome Research Panel - エクソームシーケンス用プローブセット
- ・ xGen® Acute Myeloid Leukemia Cancer Panel - AML(急性骨髄性白血病)用プローブセット
- ・ xGen® Pan-Cancer Panel - 12種のがんに共通して変異が見られる127遺伝子のプローブセット
- ・ xGen® Inherited Diseases Panel - HGMD®(Human Gene Mutation Database)に基づいた遺伝性疾患に関わる領域及びSNPsのプローブセット
- ・ xGen® Human ID Research Panel - ヒトDNAの識別用に設計されたプローブセット
- ・ xGen® Human mtDNA Research Panel - ヒトミトコンドリアDNAを網羅的に解析可能なプローブセット
- ・ xGen® CNV Backbone Panel—Tech Access - ヒトゲノム全体のCNV(コピー数多型)を解析するプローブセットで
» xGen® Lockdown® Panelsの詳細については、こちらをご覧ください。
xGen® Universal Blocking Oligos
アダプター配列同士の結合を防ぐブロッキングオリゴです。xGen® Universal Blockers – TS MixはIllumina社のインデックスアダプター用に設計されており、シングルインデックスとデュアルインデックス用のどちらのタイプにもready-to-useで使用可能です。3’末端のC3スペーサー付加など非特異な配列の結合・増幅を防ぐ修飾がされており、オンターゲット率を大幅に向上させます。» xGen® Universal Blockers – TS Mixの詳細については、こちらをご覧ください。
Additional reading
xGen® Dual Index UMI Adaptersによるインデックスホッピングの解消と低頻度変異の検出
インデックスホッピングや低頻度変異の検出に有用なDual Index Apadtersについての説明と、このアダプターを用いて得られた具体的なで実験データを開示しています。NGSにおけるマルチプレックスとキャプチャー
プローブキャプチャー法でマルチプレックスを行った際に、一度にマルチプレックスするサンプル数によるデータの品質がどのように影響するか、を実際の実験データを用いて紹介しています。また、サンプル量により、得られるデータの品質がどのように変わるかも併せて紹介しています。