測了那麼多數據,你知道測序的原理嗎?
註:測序過程
Illumina分成了四步:
1. sample prep,樣本準備
2. cluster generation,簇的生成
3. sequencing,測序
4. data analysis,數據分析
1. sample prep
樣品準備的方法很多,而所有的方法都是在DNA的末端添加adaptors。通過循環擴增的減少,另外的motif被引入,例如測序結合位點,index以及與flowcell互補結合的區域。
註:左右兩端顏色不同的序列就是新加入的adaptor,index等
2. Cluster generation
成簇是每個分子被等溫擴增的過程。Flowcell是帶有lane流通槽的玻璃板,而每個lane上固定了兩種寡核苷酸。
註:這就是flowcell
雜交發生在兩種寡核苷酸中的一種。
註:紫色為分子片段和lane上的寡核苷酸結合
這個寡核苷酸與一個分子片段的adapter區域結合,聚合酶生成雜交片段的互補片段。雙鏈分子變性,原始模板被洗去,剩下的鏈通過橋式擴增進行克隆擴增。在這個過程中,鏈發生了摺疊,並且adapter與flowcell中的另一種寡核苷酸雜交。聚合酶產生互補鏈,形成雙鏈橋。
註:雙鏈橋的形成過程
該橋被變性,形成2個固定在flowcell上的單鏈分子。
註:解鏈為單鏈
這個過程被反覆的重複,形成數百萬個cluster,從而使所有片段被克隆擴增。橋式擴增後,反向鏈被切斷洗去,留下正向鏈。3『端被鎖住以防止非特異性結合。
3. Sequencing
測序從第一個測序引物的延伸生成第一個read開始。在每個循環過程中,帶有螢光標記的的核苷酸競爭性的加入生長鏈。基於模板序列,只有一個核苷酸被加入。在每添加一個核苷酸後,簇被光源激發,並發射出特異螢光信號,這個過程被稱為邊合成邊測序。循環的次數取決於read的長度。發射波長和信號強度一起,決定了鹼基的call。對於給定的cluster,所有相同的read被同時讀出。在大規模並行的過程中,數以千萬計的簇被測序。在第一個read結束後,read產物被洗去。
註:測序的過程
在這個步驟中,index1的引物被引入並與模板雜交,類似於第一個read,這個read被產生。在index read完成後,read的產物被洗掉,模板3』端被去保護後發生摺疊,並結合在flowcell上的第二個寡核苷酸。Index2和index1一樣被讀取,聚合酶延伸第二個flowcell上的寡核苷酸,形成一個雙鏈橋。然後雙鏈DNA分子被線性化,並將3『端鎖住。原始正向鏈被切除並洗去。只留下反向鏈。Read 2從read2測序引物開始被讀取,和read1一樣,測序步驟被重複,直到達到預期的讀段長度,然後將read2產物洗去。
4. Data Analysis
註:測出的序列
測序的過程產生數百萬的reads,代表著所有分子片段,基於在樣品準備過程中引入獨特的index,來自樣品庫的序列被分離。
註:被分開的序列
對於每個樣品,具有相似延伸的鹼基被成簇。正向和反向reads被配對生成連續序列,這些序列和參考基因組比對,用於突變的確定。
註:map的過程
配對信息被用於解決有歧義的比對。基因組數據可以在BaseSpace Sequence Hub被安全的轉化,儲存和分析和分享。
這就是illumina測序的過程。
推薦視頻:https://www.bilibili.com/video/av13107081
歡迎關注個人公眾號:生物信息學習。