撰文:Eric D. Green, Edward M. Rubin & Maynard V. Olson
原文以The future of DNA sequencing為標題發布在2017年10月11日的《自然》評論上。
原文作者:Eric D. Green, Edward M. Rubin & Maynard V. Olson
Eric D. Green、Edward M. Rubin和Maynard V. Olson 從執法到數據儲存等多方面思考了未來40年DNA測序技術的應用。
40年前,兩篇論文第一次詳細介紹了測定DNA長鏈中鹼基序列的簡易方法。在此之前,分子生物學家們只能對DNA小片段進行測序。
DNA測序方法以前所未有的速度從當年的尚不發達發展到現在的高通量輸出。在2007年以前,DNA測序數據呈指數增長,而近十年則更是達到了超指數增長。快速累積的數據催生了DNA測序在多個領域的運用,不僅僅是基礎生物學,還包括考古學、犯罪調查、產前診斷等。
那麼,未來40年DNA測序又能為我們帶來什麼呢?
我們對於何種技術,或者說哪些應用最具顛覆性所進行的預判往往都是錯誤的。在網際網路發展早期,很少有人預測到電子郵件將被如此廣泛使用。相似的,華爾街的交易員以及矽谷的投資人也沒能預見電腦遊戲、在線視頻流和社交媒體將會成為網際網路的主導。
很難說我們對於DNA測序的預測比以前更準確。所以,我們只是為如何看待DNA測序提供一個基本框架。我們的核心觀點是,決定DNA測序未來走向的不是技術,而是應用。
進一步增加市場需求
技術的進步可能正向或負向地影響市場需求。微軟聯合創始人比爾•蓋茨曾引用子午輪胎來證明技術提升可能減低市場需求:因為改進後的輪胎比以往更耐用,輪胎需求降低從而導致了輪胎行業萎縮。
我們認為DNA測序技術的發展將遵循計算機技術和攝影技術的模式,而不是輪胎模式。隨著DNA測序技術價格降低且愈加方便易得,其應用將會進一步增加,從而促進需求的增長(見「更優質、更廉價、更快捷」)。DNA測序技術的應用範圍從科研領域拓展到臨床、消費品及其他領域,將進一步證明「多供多需」這一規律。
SOURCE: National Human genome research Institute研究人員對DNA測序數據的需求永遠難以滿足。20世紀90年代,要完成一個人的基因組測序看起來似乎是不可能的;而如今,遺傳學家希望能夠得到地球上每一個人的基因序列,不同發育階段每個組織內每個細胞的DNA序列(包括表觀遺傳修飾),無論是健康狀態還是疾病狀態。他們還希望通過對信使RNA的互補DNA進行測序,更全面地了解基因表達。
同時,考古學家也開始重構人類祖先基因的傳遞過程,正如他們以往對語言、文化學行為及物品所做的推斷一樣。分類學家、生態學家、微生物學家和演化生物學家也試圖對所有現存的(以及已經滅絕的)物種,甚至是整個生態系統進行測序。
很顯然,對DNA測序數據的持續需求是建立在測序結果能夠被準確理解的基礎上的。目前,分析和解讀DNA序列數據仍處在瓶頸階段。但是正如新的信息學方法和大規模數據集極大地優化了翻譯和圖片識別,我們認為,研究人員能夠利用大量的DNA序列數據集,輔以表型信息推斷出基因組序列所編碼的生物學功能。
此外,解讀測序數據所必需的許多基礎科學已經成熟,例如細菌基因組的高質量參考序列或某基因通路在健康人群中的運作規則,它們將服務於日益增長的實際應用,包括識別環境或臨床無偏調查樣本中的微生物DNA序列,鑑定與已知生物學效應相關的基因組變化。
殺手級應用
多年來,DNA測序方法已經發生了巨大的變化(詳見「DNA測序的多種方法」)。然而其他一些似乎永遠有需求的技術,例如手機、網際網路、數碼照相的發展軌跡暗示真正重要的是技術的應用,而非新技術。
DNA測序的多種方法
在過去40年裡,DNA的測序方法在不斷更新。
1985年以前,幾乎所有的DNA測序都是通過Sanger雙脫氧鏈終止法完成的。反應產物用螢光標記,在丙烯醯胺凝膠上電泳分離,並通過自動射線照相術進行檢測(通過X射線或照相軟片檢測螢光標記的樣本片段)。
而到2000年,四色螢光標記法成為主流,反應產物用鏈終止核苷酸類似物標記,在充滿膠凍樣的毛細管中電泳分離,通過能量轉移螢光染色劑識別。
到2010年,DNA測序的方法進一步多樣化。主要方法是基於聚合酶群落(大量複製的單個DNA模板)的大量平行分析和合成-測序化學(依賴於可逆的鏈終止子)。
從現在開始,每種DNA測序方法將為其應用服務。在腫瘤學和醫學遺傳學中,DNA測序的目標往往是準確識別每一個鹼基及每一個基因片段可能存在的變異。有時候我們需要的是簡單的「是」或「不是」的答案,例如物種識別,在這種情況下,方便快捷可能比準確性更重要。
另外一個可能發生改變的是集中DNA測序和多點DNA測序的相對需求。希望實時鑑定獅子山某村居民到底感染了何種病毒的流行病學家可能需要廉價且可攜帶的DNA測序設備。
而對於那些樣本量巨大的機構來說,將樣本統一交給專門公司進行集中測序可能更為方便,性價比也更高,尤其是要求檢測實驗室達到嚴格的質控標準,並能對樣本進行準確追蹤的時候,例如醫院進行基因檢測時。
我們相信DNA測序將會給醫學領域帶來變革。
就檢測數量而言,如今DNA測序在臨床中的「突破性」應用是產前診斷。產前診斷旨在識別染色體數量異常,例如3條21號染色體,即唐氏症候群。目前,該檢測依賴於母體血液內少量的胎兒DNA。即使是在人類基因組計劃結束的時候,人類也未曾想像到DNA測序可以被如此廣泛應用,產前診斷被譽為「醫學史上發展最快的基因檢測」。
事實上,業內專家估計每年全世界約有400萬到600萬孕婦接受產前檢查,而這個數字將在未來10年內超過1500萬(該信息由D. Bianchi、D. Lo和D. Zhou在私下交流中提供)。產前診斷的某些特點似乎也為DNA測序在初級護理中的應用提供了思路:無創、操作簡單,對具體核苷酸序列準確性要求低(染色體計數無需考慮核苷酸序列的變異)。
在高收入國家,基因組測序已經常規性地應用於患有難以診斷的先天疾病的兒童。對DNA序列進行分析能夠找到其中約30%病人的致病突變——這個比例隨著基因數據解讀能力的上升會進一步提高。在一些病人中,通過基因測序得到的診斷能夠顯著提高醫療質量。通常情況下,基因測序能夠縮短診斷時間,提供更清晰的臨床信息,這對於醫生和患者家庭來說都是有益的。
在腫瘤學中,大量資金被投入到液體活檢技術的發展中。不難想像,這項基於測序的腫瘤檢測技術將像巴氏塗片和腸鏡一樣成為常規篩查項目。隨著靶向具體突變而非腫瘤類型的癌症療法的出現,液體活檢甚至可以在僅有血樣本中DNA序列標記物提示腫瘤存在的時候,指導實施幹預措施。
除了臨床以外,我們還能預見到DNA測序的其他應用,尤其是可攜式DNA測序儀。流行病學家以及農村地區的衛生醫務人員可以使用這類儀器檢測空氣、水、食物、動物及帶菌昆蟲,更不用提人類的咽拭子及體液了。事實上,低中收入國家DNA測序技術的普及已經幫助了多個項目展開,例如全球病毒組計劃。該計劃旨在通過測定環境中的大量DNA樣本,鑑定絕大部分能夠傳播給人類並導致疾病的病毒。
同時,公共衛生學家也開始討論如何通過測定所有城市廢水排放口的所有微生物的DNA序列來儘早判斷疾病的爆發。海洋生物學家正在探索依靠系統宏基因組研究來監測海洋健康狀況。
在街道上,可攜式設備能夠使DNA分析走出犯罪實驗室,成為前線警務工具。警方在未來或許能夠像現在檢查車牌或者身份證明一樣「讀取」人們的DNA。不過,DNA測序在多大程度上為大範圍監控提供了可能性,近來引起了人權團體的關注。
在家裡,DNA測序儀器或許將成為繼煙霧報警器及恆溫裝置的下一個「智能」或「連接」設備。甚至有評論家認為衛生間將是利用實時DNA測序檢測家庭成員健康的理想場所。
打破限制
那麼阻礙DNA測序進一步發展的障礙有哪些呢?
在過去的短短40年間,將細胞的分子學信息轉化為實際應用這一核心目標已經從一個信息學挑戰轉變為一個元信息學挑戰。
以DNA測序數據的臨床應用為例。很快,DNA測序將被作為體液分析的常規檢測服務於臨床。但只有基於數百萬人的多年病史資料,建立大規模的有序數據系統才能夠幫助決定應該針對哪些DNA測序結果採取幹預手段。
在醫學方面,我們贊同顧問團體,例如美國國家研究委員會精準醫學分委員會的建議,即建立大範圍「信息共享」,將分子及臨床數據與數百萬個體的基因序列整合起來進行綜合分析。這些群體尺度的大規模體系正在建立中,例如英國的生物樣本庫資源及美國的全人類研究計劃。
關於DNA未來的發展,最準確的預測就是意外是必然的。事實上,幾十年後,(如今儲存在硬碟驅動器及雲端)的大部分數據將很可能儲存在DNA裡。DNA測序之所以能夠繼續發展,不是因為人類要對抗疾病,而是因為對數據儲存的野心永遠無法滿足。
《知識分子》是由饒毅、魯白、謝宇三位學者創辦的移動新媒體平臺,致力於關注科學、人文、思想