第三代測序技術是指單分子測序技術。DNA測序時,不需要經過PCR擴增,實現了對每一條DNA分子的單獨測序。
長讀長:定位準確,拼接效率提高,簡化生物信息學處理用「有限」的覆蓋度finishing genome。三代測序的讀長最長可以達到40kb以上。
高精確:99.999% consensus accuracy,此外,三代測序的誤差為隨機誤差,可以通過測序深度自身矯正(當測序深度大於30X左右時,其準確度可以達到99.999%),以及二代數據進行矯正。從下圖可以看出,illumina平臺為系統誤差,錯誤出現在固定的地方(左圖);而pacbio的誤差為隨機誤差(右圖)。
可以將基因組拼接和甲基化修飾同時進行分析(4-c和6-a)
下圖為SMRT技術鹼基修飾基本原理圖,在上半部分,TCGAT中的A有甲基化修飾,在下半部分,沒有TCGAT中的A沒有甲基化修飾。比較兩者的催化速度圖像,可以看出,甲基化的A導致後一個鹼基T的催化起始時間延長,具體表現為更長的螢光脈衝信號間距持續時間IPD(InterPulse Duration)。
三代測序(Pacbio RS II)是在一個SMRT cell上面進行,每個SMRT cell包含有15萬個 zero-mode waveguides(零模波導孔)。三代測序的上樣方法為磁珠上樣,磁珠連接文庫後,在SMRT cell上進行滾動,滾動過程中連接在磁珠上的文庫會掉入到零模波導孔中(掉進去一條文庫的孔為有效孔,沒有掉進去文庫或者大於一條文庫,則該孔的數據不可用,因此,理論上講有效空的個數為5萬個)。掉入零模波導孔的文庫會與底部的DNA聚合酶和模板結合,4色螢光標記 4 種鹼基(即是dNTP),在鹼基配對階段,不同鹼基的加入,會發出不同光,根據光的波長與峰值可判斷進入的鹼基類型。如果DNA中含有多糖等黏性物質則會影響磁珠的滾動,最終導致測序數據量降低;此外,一些金屬陽離子等可能會影響酶的活性,從而導致測序失敗。因此,三代測序的樣本準備是一個非常關鍵的步驟。
策略:PacBio RS II 平臺+ illumina HiSeq 平臺(3代+2代),測序文庫: 10 kb SMRT bell 文庫
數據量:PacBio RS II 平臺:不低於100X的測序深度;Illumina HiSeq平臺:不少於2G(根據物種的基因組大小而定,如果樣本為真菌,則需要加大數據量)
樣本製備
由於三代測序對樣本DNA的要求比較高,所以在樣本收集這塊給大家以下建議:
1、避免使用複雜或者豐富的培養基進行培養。
2、儘量收集對數早期和對數中期的菌體。
3、進行小體積抽提,避免一次抽提過大體積的樣本。
4、收集菌至 15 mL 離心管中,3,000 rpm,4℃離心後棄上清,用 1.0 mL PBS(或其他符合要求的緩衝液)溶液洗三遍。棄上清保留沉澱。液氮速凍後,-80℃冰箱保存,乾冰運輸。
5、在DNA抽提後一定要對DNA進行純化(可以使用MoBio Power Clean Pro DNA Clean-Up Kit)