在第二代測序技術的協助下,個人基因組圖譜正在如火如荼地繪製中。但第二代測序技術很快就遇上了強勁的對手——第三代測序技術,也被稱為「下、下一代的測序(next-next-generation sequencing)」。第三代測序技術是基於納米孔(nanopore)的單分子讀取技術,有著更快的數據讀取速度,應用潛能也勢必超越測序。
2012年2月5日,基因組科學家們齊聚美國佛羅裡達州的基因組生物和技術進展會議,來了解哪家公司的第三代測序技術能實現人類基因組的3分鐘測序或以5000美元的價格出售。儘管科學家們對公布的數據表示謹慎樂觀,但他們對於此類測序儀的優越之處仍心存疑慮。
Complete Genomics
在2008年10月,美國加利福尼亞州的Complete Genomics公司曾宣稱他們將在2009年以5000美元的價格售賣人類基因組,但當時沒有公布支持數據。在這次會議上,該公司公布了一個人類基因組,據稱是用9臺儀器在8天內完成的。
該公司的CEO,Clifford Reid表示,他們將254GB的數據拼接成草圖,覆蓋某個匿名男性基因組的92%,每個鹼基平均讀取了91次。與目前應用中的高速測序,即第二代測序類似,Complete Genomics也產生短的DNA讀長。通過對每個鹼基的多次測序,它的目標是排除悄悄混入的可能錯誤。Reid認為這項技術非常準確,鹼基錯誤的概率低於0.33%。這與目前的測序儀相當。
Complete Genomics並不出售測序儀,但用自己的測序儀來完成所有的內部工作。這讓某些科學家質疑,但另一些卻深受鼓舞。
速度和費用成為Complete Genomics的最大賣點。該公司並沒有透露基因組測序的確切費用,但據稱每個基因組的原材料費用低至1000美元。它的目標是在上個月推出市場,今年對1000個基因組進行測序,明年測序數量達到20000個。
Pacific Biosciences
在Complete Genomics做報告前的一小時,Pacific Biosciences的首席技術官Stephen Turner展示了大腸桿菌的完整基因組,並稱每個鹼基的平均讀取了38次,準確率大於99.9999%。
Pacific Biosciences利用了單分子技術和DNA聚合酶,在反應的同時讀取測序產物。儘管目前儀器的讀取速度僅為3 鹼基/秒,但它的目標是在2013年前實現三分鐘讀完人類基因組。它還有望實現更長的讀長。Tuner表示大腸桿菌基因組的平均讀長是586 bp,有些能達到2805 bp。某些科學家期望長讀長能排除錯誤,讓他們了解到難以讀取的部分。
Pacific Biosciences打算在明年正式推向市場。同時,目前的測序技術,如Illumina、Applied Biosystems和Roche也正以驚人的速度製造數據,在單次幾天的運行中產生相當於多個人類基因組的數據。速率不斷增長的同時,費用也在下降。例如,Illumina在會議中表示它在今年年底能實現10000美元的人類基因組測序。
要實現單分子實時測序,有三個關鍵的技術。
第一個是螢光標記的脫氧核苷酸。顯微鏡現在再厲害,也不可能真的實時看到「單分子」。但是它可以實時記錄螢光的強度變化。當螢光標記的脫氧核苷酸被摻入 DNA鏈的時候,它的螢光就同時能在DNA鏈上探測到。當它與DNA鏈形成化學鍵的時候,它的螢光基團就被DNA聚合酶切除,螢光消失。這種螢光標記的脫氧核苷酸不會影響DNA聚合酶的活性,並且在螢光被切除之後,合成的DNA鏈和天然的DNA鏈完全一樣。
第二個是納米微孔。因為在顯微鏡實時記錄DNA鏈上的螢光的時候,DNA鏈周圍的眾多的螢光標記的脫氧核苷酸形成了非常強大的螢光背景。這種強大的螢光背景使單分子的螢光探測成為不可能。Pacific Biosciences公司發明了一種直徑只有幾十納米的納米孔[zero-mode waveguides (ZMWs)],單分子的DNA聚合酶被固定在這個孔內。在這麼小的孔內,DNA鏈周圍的螢光標記的脫氧核苷酸有限,而且由於A,T,C,G這四種螢光標記的脫氧核苷酸非常快速地從外面進入到孔內又出去,它們形成了非常穩定的背景螢光信號。而當某一種螢光標記的脫氧核苷酸被摻入到DNA鏈時,這種特定顏色的螢光會持續一小段時間,直到新的化學鍵形成,螢光基團被DNA聚合酶切除為止(見圖)。
第三個是共聚焦顯微鏡實時地快速地對集成在板上的無數的納米小孔同時進行記錄。由於我對顯微原理的物理知識匱乏,而Pacific Biosciences公司又沒有非常強調在這方面的發明,不做進一步探討。
他們還對這一技術進行進一步的優化。
第一個是把雙鏈DNA環化反覆測序。人們可以在雙鏈DNA的兩頭連上髮夾結構的DNA adaptor,從而使DNA環化。而DNA聚合酶就能夠以環化的DNA作為模板滾環複製,反覆測一段DNA序列。這種反覆測序,糾正了偶爾出現的複製錯誤,從而使測序精度非常高。
第二個是激發光中斷測序法。DNA聚合酶雖然很穩定,但是在強大的激發光作用下酶也是有一定壽命的。如果把激發光中斷一段時間,在這段時間內DNA聚合酶繼續複製DNA,當激發光重新開啟以後,人們就可以測到長DNA鏈後面的序列。
第三代測序技術非常可怕。1、它實現了DNA聚合酶內在自身的反應速度,一秒可以測10個鹼基,測序速度是化學法測序的2萬倍。2、它實現了DNA聚合酶內在自身的 processivity(延續性,也就是DNA聚合酶一次可以合成很長的片段),一個反應就可以測非常長的序列。 二代測序現在可以測到上百個鹼基,但是三代測序現在就可以測幾千個鹼基。這為基因組的重複序列的拼接提供了非常好的條件。3、它的精度非常高,達到 99.9999%。
此外,它還有兩個應用是二代測序所不具備的。
第一個是直接測RNA的序列。既然DNA聚合酶能夠實時觀測,那麼以RNA為模板複製DNA的逆轉錄酶也同樣可以。RNA的直接測序,將大大降低體外逆轉錄產生的系統誤差。
第二個是直接測甲基化的DNA序列。實際上DNA聚合酶複製A、T、C、G的速度是不一樣的。正常的C或者甲基化的C為模板,DNA聚合酶停頓的時間不同。根據這個不同的時間,可以判斷模板的C是否甲基化。
Pacific Biosciences公司預計2010年或者2011年就會推出商業化的測序儀器。在不遠的將來,如果他們能和二代測序一樣集成100萬個納米微孔,那麼一臺儀器15分鐘就能夠準確地測出一個人的基因組。以後每個人的基因組測序成本將變成100美元,人人都可以消費得起。想想人類基因組計劃耗資30億美元,費時十幾年,無數科學家參與其中,技術的革新意義是多麼重大啊!
Helicos Biosciences
並不是每家測序公司都這麼幸運。Helicos Biosciences製造的第三代測序儀就被測序錯誤所困擾。就在會議前幾天,Helicos透露它的第一名顧客已經將測序儀退還。在這次會議上,該公司表示它已經拼接了線蟲的基因組。但是它的歷史問題和高昂的儀器費用,即使降低至99.9999萬美元,與其他測序儀的50萬美元左右的價格相比,仍然讓許多科學家望而卻步。
在會議前的研討會上,來自多倫多安大略癌症研究所的John McPherson說出了大家的心聲:「Helicos是單分子測序的先鋒,但我認為他們還沒有達到預定的目標。」但Helicos的首席技術官 William Efcavitch卻不認同這種說法,「關於我們不行的傳聞太誇張了」。
許多科學家希望他是對的,他們期待著Helicos與其他公司繼續競爭,以更低的價格獲得更多的數據。一位科學家表示:「這種競爭是良性的。無論這些公司幹得多好,我們都期望更多。」
基於納米孔的單分子讀取技術,英國牛津納米孔公司成功研發出第三代基因測序技術。該測序技術讀取數據更快、有望大大降低測序成本,改變個人醫療的前景。
當前,基因測序工作費時且昂貴,測序時,分子必須進行多次複製(這一步被稱為擴增),同時進行螢光示蹤標記,這一過程會帶來錯誤,因此,一個基因要被測序多次才能得到值得信賴的結果。此外,購買和操作測序儀器的費用也不菲,目前,測定一個完整的基因組需要上萬美元。
在納米孔測序技術中,DNA分子依靠被稱為核酸外切酶的蛋白質以一次一個鹼基的速度通過小孔。這個酶能清楚地區分出4個DNA鹼基編碼:A、C、G、T,也可以檢測出該鹼基是否被甲基化,一個單孔能在大約70天左右測定一個完整的基因序列。
納米孔技術不需要螢光標記物並且很可能不需要進行擴增,能直接並快速「讀」出DNA,同時足夠廉價,使進行大量重複實驗成為可能。
納米孔公司已經研發出包含幾百個納米孔的晶片,該晶片可以用在一臺機器上,快速且廉價地給大量DNA進行排序。
基因測序於上世紀70年代由弗雷德·桑格爾發明,他因此獲得了諾貝爾獎,第一份人類基因草圖於2001年繪製成功,花費了40億美元。
納米孔公司總裁戈登·桑赫納說,該技術預示了基因測序領域的一個跳躍變化,花費不到1000美元就可以完成一個基因測序。藉助該技術,在未來5年內,測序費用將有可能降至500美元。到那時,基因測序可以成為英國國民健康保險制度的一部分,民營保險公司也支付得起。該技術也可以讓醫生使用DNA來預測並且預防諸如心臟病、糖尿病等疾病,更加有效地開藥。
世界著名基因測序公司Illumina的總裁傑伊·弗拉特利稱,10年後,每一個新生嬰兒都會被「配備」完整的基因排序,費用不超過5000美元。
最早的Sanger測序在人類基因組計劃中立下赫赫戰功,但也給基因組測序貼上了數億美元的價格標籤,讓人生畏。這兩年發展迅猛的第二代測序儀—— Illumina的Genome Analyzer、Roche 454的GS系列以及ABI的SOLiD系統——讓人類基因組重測序的費用蹭地降低到10萬美元以下。現在,能對單個DNA分子進行測序的第三代測序儀也加入到這場比賽中,讓競爭更加激烈。
目前,第三代測序主要有三種技術平臺。兩種通過摻入並檢測螢光標記的核苷酸,來實現單分子測序。 Helicos的遺傳分析系統已上市,而Pacific Biosciences準備在明年推出單分子實時(SMRT)技術。第三種Oxford Nanopore的納米孔(nanopore)測序還尚未有推出的時間表,但有可能是這三種當中最便宜的。納米孔測序的優勢在於它不需要對DNA進行標記,也就省去了昂貴的螢光試劑和CCD照相機。
最近,Oxford Nanopore Technologies的Hagan Bayley及他的研究小組正致力於改善納米孔。根據他們之前的工作,他們以a-溶血素來設計納米孔,並將環式糊精共價結合在孔的內側(下圖)。當核酸外切酶消化單鏈DNA後,單個鹼基落入孔中,它們瞬間與環式糊精相互作用,並阻礙了穿過孔中的電流。每個鹼基ATGC以及甲基胞嘧啶都有自己特有的電流振幅,因此很容易轉化成DNA序列。每個鹼基也有特有的平均停留時間,它的解離速率常數是電壓依賴的,+180 mV的電位能確保鹼基從孔的另一側離開。
a-溶血素納米孔(剖面圖)以及共價結合的環式糊精(淺藍色)瞬間結合落入孔中的鹼基(紅色)。
以往對甲基胞嘧啶進行測序,都要先進行重亞硫酸鹽轉化,而納米孔技術能直接讀出這第五種鹼基。這對表觀基因組測序的研究人員來說可謂是個好消息。
納米孔測序預計能滿足大部分測序用戶的需求:99.8%的準確性相當高,且錯誤很容易通過計算來糾正。均聚物延伸也沒有問題,因為納米孔記錄每一個鹼基,而不管其前後的鹼基。讀長也會很長。Bayley認為:「它有可能讀取數千個鹼基,序列質量也不會下降。即使中途有一些小差錯,它也可以重新開始。」
但是,Oxford Nanopore的測序儀仍面臨兩個重要的技術問題。一是如何將核酸外切酶更好地附著在孔上,讓它每次只掉入一個鹼基,這是一個大挑戰。另一個是並行化。這個問題可能簡單一些。他們可以開發出一個晶片,上面有數萬個孔,來確保整個測序過程更快速。
在納米孔測序技術的推動下,實現千元基因組的目標指日可待了。
參考文獻:
Clarke, J. et al. Continuous base identification for single-molecule nanopore DNA sequencing. Nat. Nanotechnol. advance online publication 22 February, 2009.