01DNA測序定義
DNA是記錄遺傳信息的載體,可以說是一本生命的秘籍,要想看到這本書可不容易,畢竟太小了(分子水平),即便是拿著顯微鏡也看不到,目前只有通過DNA測序技術來實現「看書」的願望。DNA測序是確定DNA 分子中核苷酸序列的過程。每個生物體的DNA都由獨特的核苷酸序列組成。確定序列可以幫助科學家比較不同生物之間的DNA,進而確定不同生物之間的親緣關係。
02DNA測序概述
大家都知道DNA(英文DeoxyriboNucleic Acid,縮寫為DNA)是核酸的一種,由鹼基、脫氧核糖和磷酸構成,其中鹼基有4種:腺嘌呤(A)、鳥嘌呤(G)、胸腺嘧啶(T)和胞嘧啶(C)。通過對一段DNA進行測序,將有可能知道該核酸分子中四個核苷酸鹼基出現的順序。
弗朗西斯·克裡克(Francis Crick,英國生物學家,物理學家,及神經科學家)的理論首先明確了DNA測序的必要性,也就是DNA分子內核苷酸的序列直接影響蛋白質的胺基酸序列。對DNA序列的完全了解,將促進生物學以及醫學的質的飛躍。
現代DNA測序由高通量方法組成,可在數小時內完成整個DNA序列的測定工作。隨著技術的不斷發展,測序成本也在不斷地降低,現在已經有很多以高通量技術為依託的產品面向市場,比如基因體檢、無創產前篩查、腫瘤的用藥指導等,為很多家庭提供了DNA的測試。通過測試我們往往會發現很多的基因突變,但這僅僅是在特定環境和特定個體之下的結果,也就是存在基因多態性的可能,未來科學家還需要測定更多的個體來詳細的闡述基因多態性,以及測定更多的物種,以便發現分子層面的物種進化關係。
03DNA測序實例
二十世紀90年代啟動的人類基因組計劃(Human Genome Project,HGP),6個國家花費數年時間,花費了約30億美元才完成了人體2.5萬個基因的30億個鹼基對的測定,而現在某些公司幾天就可以完成人基因組的測序,同時成本控制在了1,000美元以內。
這裡有必要介紹一下單核苷酸多態性(single nucleotide polymorphism,SNP),人與人的基因序列中有99.9%以上的序列都是相同的,僅有0.1%不同,也就是1000個鹼基中有1個不同,這些不同的基因位點就是SNP,其廣泛地分布於染色體上,常用於遺傳性疾病相關基因的鑑定、藥物靶點設計和測試以及生物學領域的基礎研究等,是DNA測序的一個重要應用。
目前許多公司都能夠對單核苷酸多態性進行測試,通過檢測獲得重要位點的遺傳信息,並與專業的資料庫(如DGV、OMIM等)進行比對,從而找到各種疾病、新陳代謝以及身體特質等方面的特質,進而預測遺傳因素是否會或者將會對你生活的產生影響。
04DNA測序方法
目前對於DNA的測序方法有三種主要的類型:經典的Sanger測序技術,也叫一代測序技術,是目前很多臨床檢測的金標準;可以快速處理大量DNA分子的較新方法統稱為高通量測序(HTS)技術或下一代測序(NGS)技術;不需要經過PCR擴增,能夠對每一條DNA分子的單獨測序的單分子測序技術,也稱為三代測序技術。
1. Sanger測序
Sanger測序法依賴於特異性引物與模板DNA分子的結合,通過DNA聚合酶的催化作用,將不同的原料dNTP添加到引物之後,通過脫氧核糖糖分子的3'碳原子與下一個核苷酸的5'碳原子之間形成共價鍵進而形成新合成鏈。
如果對原材料dNTP進行一下修飾,使其2'或者3'缺少氧原子(雙脫氧核糖核苷酸),從而由於缺少反應性羥基而無法形成共價鍵,將提前終止DNA聚合反應,由於這種「終止」是隨機的,因此在龐大數量的產物中會產生不同長度的分子,也就是按照順序一個一個確定了鹼基序列。
具體操作過程可以簡單概括為:首先使用已經標記過的引物擴增模板DNA分子,然後將其分成四個試管,每個試管僅具有一種ddNTP類型。即,每種反應混合物將僅具有一種可能引起鏈終止的修飾核苷酸。四個反應完成後,通過鏈終止產生的DNA分子混合物將在聚丙烯醯胺凝膠上進行電泳,並根據其長度進行分離。
在上圖中,左側泳道的第一列是ddATP的產物,其中的每條線代表特定長度的DNA分子,這是通過添加ddATP核苷酸而終止的聚合反應的結果。第二,第三和第四列分別包含ddTTP,ddGTP和ddCTP。
隨著科技的不斷發展,目前對該方法進行了改進,為每個ddNTP加上不同的螢光標記,而引物不再進行放射性標記或帶有螢光標籤。該方法使用了四種不重疊發射光譜的染料,每種ddNTP都使用一種。該圖顯示了標記的引物,dNTP和染色的終止子NTP之間的差異。
上圖顯示了染料終止劑測序的示意圖。單一反應混合物中帶有DNA延伸所需的所有要素(模板、酶、緩衝液等),此外還包含少量的四個ddNTP,每個ddNTP具有不同的螢光標籤,完成的反應通過毛細管電泳進行分,然後通過分析凝膠上每個DNA條帶的發射光譜獲得結果。
2.高通量測序
Sanger測序對於確定較長DNA片段的序列仍然有用,尤其是對於小樣本量的情況。然而,當大量分子需要快速測序時,Sanger測序就顯得有點捉襟見肘。具有諷刺意味的是,儘管當需要測定的DNA分子變得越來越長時,傳統的染料終止劑方法依然很有用,但高通量方法已被更廣泛地使用,尤其是當需要對整個基因組進行測序時。
與Sanger方法相比,有三個主要變化。首先是開發用於克隆DNA片段的無細胞系統。傳統上,首先需要將測序的DNA片段克隆到原核質粒中,然後在細菌(如大腸桿菌)中擴增,再進行提取和純化。高通量測序或下一代測序技術不再依賴於此勞動密集型且耗時的過程。
其次,二代測序能夠使數百萬個測序反應同時進行,在技術上實現了巨大的進步。最初的方法需要八種不同的反應混合物產生一個可靠的核苷酸序列。序列的延伸和檢測一起進行,鹼基序列信息在此過程中被識別。儘管NGS降低了成本、節約了時間,但產生的「reads」相對較短,但這也導致後期組裝整個基因組時需要大量的計算。
NGS的出現極大地擴展了基因組學的應用,現在DNA測序已成為基礎科學、轉化研究、醫學診斷和法醫學的重要組成部分。
3.單分子測序
第三代測序技術也叫分子實時DNA測序,以其長度長測序的特點越來越受到科學家的重視。主要分為兩類:單分子實時(SMRT)測序和納米孔DNA測序。
SMRT測序(single molecule realtime),特殊脫氧核苷酸採用不同的螢光進行標記,當被摻入到合成的DNA鏈時,通過高解析度光電模塊可以實時記錄反應的螢光變化,進而判斷DNA序列。當摻入的dNTP結合形成穩定的化學鍵後,它的螢光基團就被參與反應的DNA聚合酶切除(具有3』-5』外切酶活性),螢光信號消失。這種螢光標記的dNTP不影響聚合酶的活性,並且螢光基團被切除之後,新合成的DNA鏈和原始天然的DNA鏈是一樣的。
納米孔測序法(nanopore sequencing)藉助電泳驅動單個分子逐一通過納米孔來實現測序的。由於納米孔的直徑非常小,僅允許單個核酸分子通過,而ATCG四種鹼基的電荷屬性不同,通過電信號的差異來判斷鹼基類別,從而實現測序。
05DNA測序的用途
現在Sanger測序主要用於DNA分子的從頭測序,以獲得生物或基因的一級序列數據。NGS反應產生的相對較短的「reads」,僅憑NGS方法很難創建生物的整個基因組。有時,還需要Sanger測序來進行結果的驗證。
另一方面,NGS能夠幫助我們更好的理解單核苷酸多態性(最常見的一種遺傳變異),這對於進化生物學以及檢測可能導致疾病的突變基因尤其重要。例如,肺腺癌的樣品中的序列變異檢測能夠讓醫生發現可能的罕見突變,進而實現靶藥的精準使用。
總體而言,DNA測序已成為許多應用領域不可分割的一部分,發揮著重要的作用。
1.伴隨診斷
NGS在增進對腫瘤的了解方面起著重要作用。癌症基因組圖譜和國際癌症基因組聯合會已對大量腫瘤進行了測序,並證明了這些腫瘤的變異情況可能相差很大,這也促使醫生能夠更好的因病施治。例如,乳腺癌基因組的測序確定了兩個基因-BRCA1和BRCA2-其致病變異對罹患乳腺癌的可能性具有巨大影
響。
2.分子生物學
現在,DNA測序已成為大多數生物實驗室不可或缺的一部分,用於檢測基因克隆的結果,發掘特定基因的作用。NGS技術用於研究實驗中的質粒,細菌,酵母,線蟲甚至哺乳動物的遺傳成分的變異。例如,源自乳腺癌組織的一種稱為HeLa 的細胞系已在世界各地的許多實驗室中使用,並且被認為是代表人類乳房組織的一種可靠的細胞系。最近的測序結果表明,不同來源的HeLa細胞基因組存在很大差異,這些差異可能會降低在細胞和分子生物學中的研究價值。
DNA測序可以檢測每個細胞基因組中的調控元件,以及它們在不同細胞和個體的活性變化。例如,特定基因可能在某些組織中永久關閉,而在其他組織中組成性表達。類似地,那些易患特定疾病的人對基因的調節可能與先天性免疫的人群不同。DNA調控區域的這些差異可以通過測序找到,並可以為表型提供依據。
3.法證
使用低濃度的DNA獲得可靠的測序讀數的能力對法醫非常有用,因為犯罪現場通常包含多個人的遺傳物質,而每個人的遺傳物質非常有限,這就導致常規的方式具有非常大的局限性。NGS在許多取證實驗室中被逐漸用於人類識別,如法醫科學家可以對人的死亡後的外顯子組進行測序,確定死亡原因,比如中毒導致的死亡將顯示受影響器官中外顯子組的變化。
06總結
DNA測序技術在最近幾年獲得了長足的發展,已經從上遊實驗室進入了臨床的應用,幫助醫生迅速精準的找到病因,減少的試錯周期,提高生活質量;同時也在基礎研究方面,如分子生物學、進化生物學、病毒學等諸多領域發光發熱,成了了科研工作者的神兵利器。未來隨著光學、機械、微流控等領域的持續發展,會有更多更好的測序產品問世,增加檢測精準度,降低測序成本,屆時會推動整個生物醫學的進一步發展。