來源:知識分子
作者:陳抒寧
圖源:pixabay
● ● ●
人類基因組計劃啟動於1990年,如今已匆匆過去30年光景。從2000年人類基因組草圖宣告完成後的二十年間,人類參考基因組不斷更新迭代。即便如此,其中依然存在數以百計的空缺,尚無一條染色體被真正完成 [1]。
如今,科學家首次完成了一條 「從頭到尾」 真正完整的人類染色體測序。7月14日,《自然》雜誌上刊載了美國加利福尼亞大學聖克魯茲分校的 Karen Miga 教授團隊的研究成果[2]。該團隊使用最新的納米孔測序技術,首次完成了從端粒到端粒、完整無缺的人類X染色體序列。這或許意味著,真正完成人類基因組測序的時代已經觸手可及。
1
霰彈槍、拼圖與地圖上的空缺
過去,人類基因組計劃使用的測序方法只能用來測定較短的DNA序列,長度在100到1000個鹼基對間。因此,較長的序列被剪切成末端重複的碎片,並依靠這些重複的部分將碎片重新組裝成完整的序列。這種測序方法也被形象地稱為 「霰彈槍測序法」。
這種方法重建基因組的最大挑戰在於如何區分重複的序列[3]。人類基因中有大量重複的序列,這使得測定出來的許多短鏈幾乎一模一樣,既難以拼接,也難以判斷到底存在多少個重複區段。就像拼圖中我們往往把天空或湖水的部分留到最後,因為在大片的同色色塊裡,我們便難以確認具體某塊拼圖的位置一樣。
現在參考基因組中的空缺包括核糖體DNA序列,著絲粒(在細胞分裂時連接兩條染色體單體的部位,它們將染色體分為長臂和短臂)中高度重複的DNA序列,此外,還有一些富含重複片段的區域,這些重複片段動輒有超過數十萬鹼基對,重複率超過98% [2]。「目前基因組圖譜上缺失的部分,也恰是在人群中序列變異最多的部分,也因此為基因生物學和人類疾病的研究提供了未經探索的序列。完整的基因組圖譜有潛力加深我們對遺傳疾病的了解。而我們選擇X染色體的研究正是因為它和無數的疾病有關,其中包括血友病,慢性肉芽腫性疾病和杜氏肌營養不良。」 Miga 教授告訴《知識分子》。
2
基因的 「安檢儀」
要應對黑暗區域的挑戰有兩種途徑:要麼測的序列長到可以覆蓋一整個重複部分;要麼測序足夠精確,可以通過區分獨特的變量來區分重複的序列[4]。最新的納米孔測序技術為超長測序提供了可能。
圖1:DNA通過納米孔,隨著G、A、T、C鹼基以不同的序列通過,電流也產生不同的變化(來源:參考文獻5)
在實驗中,研究人員讓DNA鏈通過一個嵌在電阻膜上的納米孔,就像行李通過X光安檢儀一樣,「掃描」 出DNA上的鹼基序列。在測序時,電阻膜被浸入電解質溶液中,並讓離子電流通過納米孔,當DNA鏈上不同的鹼基通過納米孔時,會對這個電流產生幹擾。通過解碼這些電流信號,研究人員就可以測得特定的DNA或RNA片段。
納米孔技術不僅可以實時分析長DNA片段,而且理論上不再有DNA的長度限制。Miga 教授告訴《知識分子》,「如果你能讓一條百萬鹼基對長的DNA通過納米孔,它就能識別整條序列。使用了這種超長測序技術後,我們可以獲得一個非常非常長鏈的(超過十萬鹼基對)、高覆蓋率的資料庫,從而幫助我們跨越和準確拼裝富含重複序列的安檢儀。」
3
新的裡程碑
Miga 教授和她的團隊完成的X染色體序列完整無缺,且估算有至少99.99%的準確率,這意味著平均每1萬鹼基對才有一個錯誤。在對X染色體的研究中,Miga教授和她的團隊重建了約2.8兆鹼基對的著絲粒中的DNA序列,並且填補了X染色體所剩的29個空缺部分,包括擬常染色體區域和CT抗原基因家族中的新序列,CT抗原基因家族是一種腫瘤特異性抗原,有望用作癌症的免疫治療[2]。
加利福尼亞大學聖克魯茲分校的助理研究科學家 Jain Miten 告訴《知識分子》,「端粒到端粒的完整染色體測序是基因組學裡程碑式的時刻,而超長測序的技術和算法的發展是使之得以實現的主要因素之一。了解這些曾是未知的『黑暗區域』的序列結構和表觀基因序列圖譜,會為生物學帶來新的視角。同時,這也是一個分階段的,端粒到端粒的,完整基因組時代到來的界標。」
接下來,Miga 教授和她的團隊將繼續致力於從人類基因組剩餘的 「處女地」 上捕捉新的序列和表觀基因的變異。Miga 教授表示:「我們目前已經有了巨大的進展,並且希望可以在不遠的未來和公眾分享。我們發現有一些特定的染色體比其他的更容易組裝(比如8號和6號)。最難的染色體是帶著幾乎相同的核糖體DNA序列的近端著絲粒染色體如13、14、15、21和22號。同時我們也需要開發新的技術來面對1號、9號和16號染色體上大型人類衛星DNA序列的挑戰。」
參考資料
[1] Jain, Miten, S Koren, J Quick, Ac Rand, Ta Sasani, Jr Tyson, Ad Beggs, et al. 「Nanopore Sequencing and Assembly of a Human Genome with Ultra-Long Reads.」 Nature Biotechnology, 2017. https://doi.org/10.1101/128835.
[2] Miga, Karen H., Sergey Koren, Arang Rhie, Mitchell R. Vollger, Ariel Gershman, Andrey Bzikadze, Shelise Brooks, et al. 「Telomere-to-Telomere Assembly of a Complete Human X Chromosome.」 Nature, July 14, 2020. https://doi.org/10.1038/s41586-020-2547-7.
[3] Staden, R. 「A Strategy of DNA Sequencing Employing Computer Programs.」 Nucleic Acids Research 6, no. 7 (June 11, 1979): 2601–10. https://doi.org/10.1093/nar/6.7.2601.
[4] Nagarajan, Niranjan, and Mihai Pop. 「Sequence Assembly Demystified.」 Nature Reviews Genetics 14, no. 3 (2013): 157–67. https://doi.org/10.1038/nrg3367.
[5] Deamer, David, Mark Akeson, and Daniel Branton. 「Three Decades of Nanopore Sequencing.」 Nature Biotechnology 34, no. 5 (May 6, 2016): 518–24.