測序產生了那麼多數據,你知道測序的原理嗎?

2021-02-25 生物信息學習

測了那麼多數據,你知道測序的原理嗎?

 


註:測序過程

 

Illumina分成了四步:

1.    sample prep,樣本準備

2.    cluster generation,簇的生成

3.    sequencing,測序

4.    data analysis,數據分析

 

 

1.   sample prep

樣品準備的方法很多,而所有的方法都是在DNA的末端添加adaptors。通過循環擴增的減少,另外的motif被引入,例如測序結合位點,index以及與flowcell互補結合的區域。

註:左右兩端顏色不同的序列就是新加入的adaptor,index等

2.   Cluster generation

成簇是每個分子被等溫擴增的過程。Flowcell是帶有lane流通槽的玻璃板,而每個lane上固定了兩種寡核苷酸。

註:這就是flowcell

雜交發生在兩種寡核苷酸中的一種。

註:紫色為分子片段和lane上的寡核苷酸結合

這個寡核苷酸與一個分子片段的adapter區域結合,聚合酶生成雜交片段的互補片段。雙鏈分子變性,原始模板被洗去,剩下的鏈通過橋式擴增進行克隆擴增。在這個過程中,鏈發生了摺疊,並且adapter與flowcell中的另一種寡核苷酸雜交。聚合酶產生互補鏈,形成雙鏈橋。

註:雙鏈橋的形成過程

該橋被變性,形成2個固定在flowcell上的單鏈分子。

註:解鏈為單鏈

這個過程被反覆的重複,形成數百萬個cluster,從而使所有片段被克隆擴增。橋式擴增後,反向鏈被切斷洗去,留下正向鏈。3『端被鎖住以防止非特異性結合。

3.   Sequencing

測序從第一個測序引物的延伸生成第一個read開始。在每個循環過程中,帶有螢光標記的的核苷酸競爭性的加入生長鏈。基於模板序列,只有一個核苷酸被加入。在每添加一個核苷酸後,簇被光源激發,並發射出特異螢光信號,這個過程被稱為邊合成邊測序。循環的次數取決於read的長度。發射波長和信號強度一起,決定了鹼基的call。對於給定的cluster,所有相同的read被同時讀出。在大規模並行的過程中,數以千萬計的簇被測序。在第一個read結束後,read產物被洗去。

註:測序的過程

在這個步驟中,index1的引物被引入並與模板雜交,類似於第一個read,這個read被產生。在index read完成後,read的產物被洗掉,模板3』端被去保護後發生摺疊,並結合在flowcell上的第二個寡核苷酸。Index2和index1一樣被讀取,聚合酶延伸第二個flowcell上的寡核苷酸,形成一個雙鏈橋。然後雙鏈DNA分子被線性化,並將3『端鎖住。原始正向鏈被切除並洗去。只留下反向鏈。Read 2從read2測序引物開始被讀取,和read1一樣,測序步驟被重複,直到達到預期的讀段長度,然後將read2產物洗去。

 

4.   Data Analysis

註:測出的序列

測序的過程產生數百萬的reads,代表著所有分子片段,基於在樣品準備過程中引入獨特的index,來自樣品庫的序列被分離。

註:被分開的序列

對於每個樣品,具有相似延伸的鹼基被成簇。正向和反向reads被配對生成連續序列,這些序列和參考基因組比對,用於突變的確定。

註:map的過程

配對信息被用於解決有歧義的比對。基因組數據可以在BaseSpace Sequence Hub被安全的轉化,儲存和分析和分享。

這就是illumina測序的過程。

推薦視頻:https://www.bilibili.com/video/av13107081

歡迎關注個人公眾號:生物信息學習

相關焦點

  • 如果想了解NGS測序原理,那麼首推
    troubleshooting,通過本次講座,您將知道理想文庫的條帶分布,能夠識別異常文庫條帶分布並分析其原因,同時了解如何防止異常文庫的出現。通過本次講座,您將了解到RNA-seq的建庫原理、流程、數據分析步驟以及數據結果等相關內容。講座內容適用於所有使用Illumina測序平臺的用戶。查看視頻
  • 單細胞測序技術原理
    一.基本原理 單細胞測序首先不是僅僅對一個細胞進行測序,而是說該項技術能對單一細胞的基因組或轉錄組進行測序,可以理解為單細胞水平上的測序。 在介紹基本原理之前先讓我們嘗試著回答一下:為什麼要進行單細胞測序?
  • 基因組測序原理及其發展歷程
    第一節 NGS測序技術在真正開始數據分析之前先知道我們是如何將那些原本存在於細胞中的DNA信息獲取出來的——也就是測序的原理,總是有益的。測序,簡單來說就是將DNA化學信號轉變為計算機可處理的數位訊號。 它從1977年的第一代Sanger技術發展至今,已經足有40年時間。
  • 三代基因組測序技術原理簡介
    測序技術的每一次變革,也都對基因組研究,疾病醫療研究,藥物研發,育種等領域產生巨大的推動作用。在這裡我主要對當前的測序技術以及它們的測序原理做一個簡單的小結。由於雙次檢測,這一技術的原始測序準確性高達99.94%,而15x覆蓋率時的準確性更是達到了99.999%,應該說是目前第二代測序技術中準確性最高的了。但在螢光解碼階段,鑑於其是雙鹼基確定一個螢光信號,因而一旦發生錯誤就容易產生連鎖的解碼錯誤。
  • illumina、Sanger、第三代和第四代測序技術原理
    測序反應在存在全部四種終止核苷酸的條件下進行時,最終將得到一組逐個鹼基測定和分離的DNA片段。最後,您將得到一個通過不同顏色電泳圖譜表示DNA序列的數據文件啦。在BigDye terminators,,BigDye primers和BigDye Direct中,使用的螢光染料具有更窄的發射光譜和較少的螢光光譜重疊,可以產生較低的背景噪音。
  • 基因測序會帶來更好的未來嗎?
    文|東方亦落 近兩年,基因測序逐漸成為備受矚目的話題。通過這種手段,可以知道你的祖先是誰,你有患何種病的風險,你有什麼方面的天賦等等,總之就是能夠從生物科技的角度全方位地了解自己。 自人類誕生以來,了解自己的欲望就從未停止。我們曾將希望寄託於算命、星座、塔羅等頗具玄學色彩的方法之上,也曾迷戀於心理測試等有現實依據的手段。
  • 測序數據的解析:Fastq與FastQC
    二代測序平臺獲得的原始數據為fastq(或為壓縮文件fq.gz)格式,包含雙末端測序所得的正向和反向兩個文件(通常用「1」和「2」來區分),如下所示
  • 【周日文獻精讀】NGS高通量測序的原理及流程解析
    高通量測序技術(High-throughputsequencing)又稱「下一代」測序技術("Next-generation"sequencing
  • 測序平臺之Ion Torrent
    Ion Torrent的測序原理是:每個dNTP分子都有3個磷酸基團,當dNTP被聚合酶結合到DNA鏈上 時,會掉下來一個分子的焦磷酸,1個焦磷酸分子會被酶再進一步分解成2個磷酸分子。這樣在測序的微環境中,就會多出兩個酸性分子。一個珠子上有幾千、幾百條DNA鏈,每次發生聚合反應,就會多出幾千、幾百個酸分子。這樣,這個為緩解的PH值就會短暫地下降。
  • 新一代測序技術即將加速前進?
    該報導內容主要圍繞以下幾個方面展開:那些曾經或現在致力於實現「100美元基因組」的新老玩家們分子電子學測序技術能顛覆整個測序行業嗎?這個領域有哪些玩家?基因測序行業技術的重大革新一定是依託新的測序技術嗎?正文開始
  • 高通量DNA測序數據的生物信息學方法
    北京大學生物醫學工程系,北京 100871摘要:高通量測序技術產生的DNA序列數據長度較短,而且數據量非常巨大。分析了高通量測序環境下大數據的挑戰和機遇,總結並討論了數據壓縮、宏基因組數據序列拼接、宏基因組數據序列分析方面的算法和工具等研究成果。最後,展望了高通量測序下DNA短讀序列數據研究的發展趨勢。
  • 各代測序技術簡介
    經過數據不斷的技術開發和改進,以Roche公司的454技術、Illumina公司的Solexa,Hiseq技術,ABI公司的Solid技術為標記的第二代測序技術誕生,後起之秀ThermoFisher的Ion Torrent技術近年來也殺入歷史舞臺[5]。 3.2 焦磷酸測序焦磷酸測序技術(圖1B)是由4種酶催化的同一反應體系中的酶級聯化學發光反應。
  • DNA 測序技術的發展:第三代測序法
    本文作為DNA測序的最終章,就和大家聊一聊最新一代的DNA測序技術。不相同於上兩篇文章中提到的桑格法測序和SBS高通量測序,小編並沒有給第三代測序法一個簡單的概括性命名。原因是第三代測序的發展方向太多,不好直接概括為某一特定方法。具體來說,在第二代測序的基礎上,人們還希望提高測序效率、提高測序通量、提高測序準確率、避免PCR擴增和避免螢光檢測等等。
  • 16S擴增子測序數據分析介紹
    其實只是給我看到微生物組這個領域的入場券,在正式工作後加入了微生物組這個領域,我發現自己有多渺小,之前學的東西是那麼的微不足道,微生物組學是一個非常偉大的領域,有永遠挖不完的寶藏。在這個領域裡工作的越久越會發現他有多麼深不可測,而且你越會發現自己有太多的東西不知道。
  • 三代測序數據簡單分析
    今天給大家介紹一下之前所做的mtDNA三代測序數據組裝。因為也是初次接觸數據組裝操作,有不全面的地方請讀者見諒,也可在留言區留言指正。1,數據比對首先拿到測序數據,如果已經有標準的參考基因組(例如mtDNA現在使用的是早期組裝的英國人的一條序列rCRS作為參考),我們可以使用李恆編寫的三代測序數據比對軟體minimap2將原始數據GZ.fq比對到參考基因組reference.fa上。
  • 真有黑科技可以激發測序的極限潛能?
    Roche 454 LifeSciences和ThermoFisher Ion Torrent的測序系統即採用該技術,但這是並不意味著它們在MPS領域獲得了很大優勢,兩者的測序原理(SNA)導致其測序系統在核苷酸多聚物的讀取精度上遇到了很大的挑戰(具體原因在此不再贅述)。
  • RNA-seq測序基本知識
    ,那麼具體的情況中自然而然就要問應該選擇哪個平臺。1 選擇RNA-seq平臺和測序模式的八項基本原則如果目標是檢測RNA種類中的SNPs或單核苷酸編輯事件,那麼我們必須選擇一個錯誤率較低的平臺,實際上我們應該能夠區分真正的SNPs和測序錯誤。在人類SNP頻率約1/800的情況下,這對應於99.9%的準確率。只有SOLID平臺宣稱準確率超過了這個水平,有些平臺則差得多。
  • 全基因組測序(WGS)流程及實踐
    第四行:測序read的質量值,它描述的是每個測序鹼基的可靠程度,用ASCII碼表示,越大說明測序的質量越好。公式:Q = -10log(p_error)。即,質量值是測序錯誤率的對數(10為底數)乘以-10(並取整)。比如,如果該鹼基的測序錯誤率是0.01,那麼質量值就是20(俗稱Q20)。為什麼要用ASCII碼來代表,直接用數字不行嗎?行!但很難看🙂。
  • 基因測序行業研究報告
    這類企業目前投資機會和風險主要在於如果產品核心競爭力很強,那麼未來具有很大的成長性;如果產品競爭力不強,那麼未來面臨被淘汰的風險;所以核心是判斷企業核心競爭力的優劣;   (3)目前處於初創階段的研髮型企業,重磅產品尚未獲批上市銷售,但是有一定的開發能力,數據資源處於變現爆發前,如:吉因加、思路迪等。這類企業收入規模較小,適合於A、B輪及更早期投資。
  • 三代測序在微生物基因組測序中的應用
    第三代測序技術是指單分子測序技術。DNA測序時,不需要經過PCR擴增,實現了對每一條DNA分子的單獨測序。