20年磨一劍:納米技術完全測序人類X染色體

2020-11-25 騰訊網

來源:知識分子

作者:陳抒寧

圖源:pixabay

●  ●  ●

人類基因組計劃啟動於1990年,如今已匆匆過去30年光景。從2000年人類基因組草圖宣告完成後的二十年間,人類參考基因組不斷更新迭代。即便如此,其中依然存在數以百計的空缺,尚無一條染色體被真正完成 [1]。

如今,科學家首次完成了一條 「從頭到尾」 真正完整的人類染色體測序。7月14日,《自然》雜誌上刊載了美國加利福尼亞大學聖克魯茲分校的 Karen Miga 教授團隊的研究成果[2]。該團隊使用最新的納米孔測序技術,首次完成了從端粒到端粒、完整無缺的人類X染色體序列。這或許意味著,真正完成人類基因組測序的時代已經觸手可及。

1

霰彈槍、拼圖與地圖上的空缺

過去,人類基因組計劃使用的測序方法只能用來測定較短的DNA序列,長度在100到1000個鹼基對間。因此,較長的序列被剪切成末端重複的碎片,並依靠這些重複的部分將碎片重新組裝成完整的序列。這種測序方法也被形象地稱為 「霰彈槍測序法」。

這種方法重建基因組的最大挑戰在於如何區分重複的序列[3]。人類基因中有大量重複的序列,這使得測定出來的許多短鏈幾乎一模一樣,既難以拼接,也難以判斷到底存在多少個重複區段。就像拼圖中我們往往把天空或湖水的部分留到最後,因為在大片的同色色塊裡,我們便難以確認具體某塊拼圖的位置一樣。

現在參考基因組中的空缺包括核糖體DNA序列,著絲粒(在細胞分裂時連接兩條染色體單體的部位,它們將染色體分為長臂和短臂)中高度重複的DNA序列,此外,還有一些富含重複片段的區域,這些重複片段動輒有超過數十萬鹼基對,重複率超過98% [2]。「目前基因組圖譜上缺失的部分,也恰是在人群中序列變異最多的部分,也因此為基因生物學和人類疾病的研究提供了未經探索的序列。完整的基因組圖譜有潛力加深我們對遺傳疾病的了解。而我們選擇X染色體的研究正是因為它和無數的疾病有關,其中包括血友病,慢性肉芽腫性疾病和杜氏肌營養不良。」 Miga 教授告訴《知識分子》。

2

基因的 「安檢儀」

要應對黑暗區域的挑戰有兩種途徑:要麼測的序列長到可以覆蓋一整個重複部分;要麼測序足夠精確,可以通過區分獨特的變量來區分重複的序列[4]。最新的納米孔測序技術為超長測序提供了可能。

圖1:DNA通過納米孔,隨著G、A、T、C鹼基以不同的序列通過,電流也產生不同的變化(來源:參考文獻5)

在實驗中,研究人員讓DNA鏈通過一個嵌在電阻膜上的納米孔,就像行李通過X光安檢儀一樣,「掃描」 出DNA上的鹼基序列。在測序時,電阻膜被浸入電解質溶液中,並讓離子電流通過納米孔,當DNA鏈上不同的鹼基通過納米孔時,會對這個電流產生幹擾。通過解碼這些電流信號,研究人員就可以測得特定的DNA或RNA片段。

納米孔技術不僅可以實時分析長DNA片段,而且理論上不再有DNA的長度限制。Miga 教授告訴《知識分子》,「如果你能讓一條百萬鹼基對長的DNA通過納米孔,它就能識別整條序列。使用了這種超長測序技術後,我們可以獲得一個非常非常長鏈的(超過十萬鹼基對)、高覆蓋率的資料庫,從而幫助我們跨越和準確拼裝富含重複序列的安檢儀。」

3

新的裡程碑

Miga 教授和她的團隊完成的X染色體序列完整無缺,且估算有至少99.99%的準確率,這意味著平均每1萬鹼基對才有一個錯誤。在對X染色體的研究中,Miga教授和她的團隊重建了約2.8兆鹼基對的著絲粒中的DNA序列,並且填補了X染色體所剩的29個空缺部分,包括擬常染色體區域和CT抗原基因家族中的新序列,CT抗原基因家族是一種腫瘤特異性抗原,有望用作癌症的免疫治療[2]。

加利福尼亞大學聖克魯茲分校的助理研究科學家 Jain Miten 告訴《知識分子》,「端粒到端粒的完整染色體測序是基因組學裡程碑式的時刻,而超長測序的技術和算法的發展是使之得以實現的主要因素之一。了解這些曾是未知的『黑暗區域』的序列結構和表觀基因序列圖譜,會為生物學帶來新的視角。同時,這也是一個分階段的,端粒到端粒的,完整基因組時代到來的界標。」

接下來,Miga 教授和她的團隊將繼續致力於從人類基因組剩餘的 「處女地」 上捕捉新的序列和表觀基因的變異。Miga 教授表示:「我們目前已經有了巨大的進展,並且希望可以在不遠的未來和公眾分享。我們發現有一些特定的染色體比其他的更容易組裝(比如8號和6號)。最難的染色體是帶著幾乎相同的核糖體DNA序列的近端著絲粒染色體如13、14、15、21和22號。同時我們也需要開發新的技術來面對1號、9號和16號染色體上大型人類衛星DNA序列的挑戰。」

參考資料

[1] Jain, Miten, S Koren, J Quick, Ac Rand, Ta Sasani, Jr Tyson, Ad Beggs, et al. 「Nanopore Sequencing and Assembly of a Human Genome with Ultra-Long Reads.」 Nature Biotechnology, 2017. https://doi.org/10.1101/128835.

[2] Miga, Karen H., Sergey Koren, Arang Rhie, Mitchell R. Vollger, Ariel Gershman, Andrey Bzikadze, Shelise Brooks, et al. 「Telomere-to-Telomere Assembly of a Complete Human X Chromosome.」 Nature, July 14, 2020. https://doi.org/10.1038/s41586-020-2547-7.

[3] Staden, R. 「A Strategy of DNA Sequencing Employing Computer Programs.」 Nucleic Acids Research 6, no. 7 (June 11, 1979): 2601–10. https://doi.org/10.1093/nar/6.7.2601.

[4] Nagarajan, Niranjan, and Mihai Pop. 「Sequence Assembly Demystified.」 Nature Reviews Genetics 14, no. 3 (2013): 157–67. https://doi.org/10.1038/nrg3367.

[5] Deamer, David, Mark Akeson, and Daniel Branton. 「Three Decades of Nanopore Sequencing.」 Nature Biotechnology 34, no. 5 (May 6, 2016): 518–24.

相關焦點

  • 20年磨一劍:納米技術完全測序人類X染色體
    1990年,如今已匆匆過去30年光景。從2000年人類基因組草圖宣告完成後的二十年間,人類參考基因組不斷更新迭代。即便如此,其中依然存在數以百計的空缺,尚無一條染色體被真正完成 [1]。 如今,科學家首次完成了一條 「從頭到尾」 真正完整的人類染色體測序。7月14日,《自然》雜誌上刊載了美國加利福尼亞大學聖克魯茲分校的 Karen Miga 教授團隊的研究成果 [2]。
  • 科學家首次完成對人類X染色體的完整測序
    據外媒報導,儘管科學家已經完成了整個人類基因組的測序但仍有一些空白。現在,遺傳學家在一項具有裡程碑意義的新研究中帶來了一個重要的基因序列,即對整個人類X染色體從頭到尾進行測序並覆蓋了300多萬個此前沒有被繪製出來的鹼基對。
  • 科學家首次完成對人類X染色體的完整測序
    據外媒報導,儘管科學家已經完成了整個人類基因組的測序但仍有一些空白。現在,遺傳學家在一項具有裡程碑意義的新研究中帶來了一個重要的基因序列,即對整個人類X染色體從頭到尾進行測序並覆蓋了300多萬個此前沒有被繪製出來的鹼基對。人類基因組計劃是有史以來最雄心勃勃的科學事業之一。
  • 科學家第一次實現了人類X染色體的完整測序
    X染色體之所以出現這麼多的缺口,是因為以前的基因測序技術一次只能讀取DNA的一個小片段,然後再將這些片段拼湊起來。問題在於人類基因組中有許多重複的片段,當讀取到許多重複小片段的時候,很難精確還原真正的基因組,畢竟誰也說不清楚到底是基因組是如何重複的。
  • 科學家第一次實現了人類X染色體的完整測序
    科學家通過納米孔測序技術,結合其他改進和驗證的互補技術,實現了對葡萄胎CHM13全基因組進行的高覆蓋、超長讀取。首次嘗試重點是人類X染色體,科學家重建了長度為310萬鹼基對的著絲粒衛星DNA陣列,填補了現有文獻中的29個缺口,其中包括人類偽常染色體區域和癌睪丸擴增基因家族的新序列。新的序列將被整合到未來的人類參考基因組中。嘗試是成功的,完成整個人類基因組已經觸手可及。
  • 首次獲得人類X染色體的完整序列
    大多測序技術只能製造出長度很小的「短片段讀取」,重複序列就會導致許多看起來幾乎完全相同的短片段出現。這就好像在拼圖中出現了一大片藍天,這裡的每一塊看起來並沒有什麼不同,但又沒有線索告訴我們這些片段是如何拼接在一起的,也沒有線索說明片段重複了多少次。這就帶來了許多「缺口」,也就是「丟失」的信息。 在這項新研究中,團隊沒有選擇測序正常人類細胞中的X染色體。
  • X染色體首度完全測序,距離擁有完整人類基因組串行也許已不遠
    雖然人類的參考基因組(human reference genome)是目前最準確、最完整的脊椎動物基因組,但即使經過20年改進,完整的DNA串行始終存在缺口。現在,一組國際遺傳學團隊首次確定了人類X染色體從頭到尾(端粒到端粒)的完整串行,沒有空缺且準確性達到空前水準。
  • 人類基因組X染色體被無死角解碼
    耗資30億美元、於1990年啟動的人類基因組計劃,經過十年努力,在2000年繪製出首個人類基因組工作草圖。這是有史以來最準確、最完整的脊椎動物基因組序列。但是,承載人類遺傳密碼的「密卷」並未被百分之百地破譯,仍然存在大量未知的缺口。這些缺口為什麼遲遲不能補上?這次幫助科學家獲得X染色體完整序列的是什麼基因測序技術?剩餘的基因序列空白,能夠順利補上嗎?
  • Nature發布首個人類X染色體完成圖,長讀長測序盡顯優勢
    而人類基因組完成圖則有望幫助我們加深對染色體功能和人類疾病的理解,對基因組變異的全面了解將改善目前使用短讀取映射到參考基因組的生物醫學中的驅動技術。在人類基因組測序組裝發展歷程中,科學家們陸陸續續發布一系列參考基因組版本。2001年人類基因組計劃公布了首個人類參考基因組,2009年,基因組參考聯盟(GRC)發布了人類參考基因組版本GRCh37。
  • 人類X染色體被無死角解碼,最大功臣是它
    耗資30億美元、於1990年啟動的人類基因組計劃,經過十年努力,在2000年繪製出首個人類基因組工作草圖。這是有史以來最準確、最完整的脊椎動物基因組序列。但是,承載人類遺傳密碼的「密卷」並未被百分之百地破譯,仍然存在大量未知的缺口。這些缺口為什麼遲遲不能補上?這次幫助科學家獲得X染色體完整序列的是什麼基因測序技術?剩餘的基因序列空白,能夠順利補上嗎?
  • 裡程碑式成就,科學家首次獲得人類X染色體完整序列
    經過科學家近二十年的努力,人類染色體基因組序列迄今為止是最準確和完整的脊椎動物基因組序列,但仍有數百個未知的空白或缺失的DNA序列。這些缺口通常包含重複的DNA片段,非常難以測序,但是這些重複片段卻是控制人類遺傳信息變異最豐富的區域之一,可能隱藏著理解人類生物學和疾病很重要的信息。
  • 人類基因組草圖再添細節 X染色體被無死角解碼
    耗資30億美元、於1990年啟動的人類基因組計劃,經過十年努力,在2000年繪製出首個人類基因組工作草圖。這是有史以來最準確、最完整的脊椎動物基因組序列。  但是,承載人類遺傳密碼的「密卷」並未被百分之百地破譯,仍然存在大量未知的缺口。這些缺口為什麼遲遲不能補上?這次幫助科學家獲得X染色體完整序列的是什麼基因測序技術?剩餘的基因序列空白,能夠順利補上嗎?
  • 人類基因組草圖再添細節X染色體被無死角解碼
    由於測序技術只能完成短片段讀取,重複序列就會導致許多看起來幾乎完全相同的短片段出現。「這就好比拼圖中的藍天、草原,其中的每一小塊都是藍色或綠色,但又沒有線索告訴我們這些片段如何拼接在一起。」汪強虎說,這就帶來了許多缺口。
  • 人類基因組草圖再添細節 X染色體被無死角解碼
    耗資30億美元、於1990年啟動的人類基因組計劃,經過十年努力,在2000年繪製出首個人類基因組工作草圖。這是有史以來最準確、最完整的脊椎動物基因組序列。但是,承載人類遺傳密碼的「密卷」並未被百分之百地破譯,仍然存在大量未知的缺口。這些缺口為什麼遲遲不能補上?這次幫助科學家獲得X染色體完整序列的是什麼基因測序技術?剩餘的基因序列空白,能夠順利補上嗎?
  • 人類基因組草圖再添細節 X染色體被無死角解碼---中國科學院
    耗資30億美元、於1990年啟動的人類基因組計劃,經過十年努力,在2000年繪製出首個人類基因組工作草圖。這是有史以來最準確、最完整的脊椎動物基因組序列。  但是,承載人類遺傳密碼的「密卷」並未被百分之百地破譯,仍然存在大量未知的缺口。這些缺口為什麼遲遲不能補上?這次幫助科學家獲得X染色體完整序列的是什麼基因測序技術?剩餘的基因序列空白,能夠順利補上嗎?
  • 基因組學新紀元:科學家首次完成人類X染色體的完整組裝序列
    目前的人類參考基因組是迄今為止最準確和最完整的脊椎動物基因組,但即使經過了20年的改進,DNA序列上仍然存在空白。該研究的主要作者、加州大學聖克魯茲基因組學研究所的研究科學家凱倫·米加(Karen Miga)說,這個項目之所以能夠完成,是因為新的測序技術使「超長讀取(ultra-long reads)」成為可能,比如加州大學聖克魯茲分校首創的納米孔測序技術。
  • Genome Research:研究生發現更全面染色體測序方法
    測序技術自454 Life Sciences的新型基因組測序儀Genome Sequencer20(GS20,見[測序新產品]GS20 升級版)得以越來越多的應用之後獲得了新的發展,7月1日的《Nature》提及了一種DNA測序新技術,繪製出胚胎幹細胞(ES細胞)和來自ES細胞的兩個細胞系的全基因組染色質圖譜,並發現一組以染色質為基礎的特殊代碼
  • WLA年度發布 | 首次獲取完整的X染色體序列,人類越來越了解自己了
    這一成果意味著創造出精確到鹼基的完整人類染色體已經成為現實,基因組學研究或許將邁入新的時代,人類離揭秘遺傳信息又進了一步。2020年,由中、美、英、法、日、德等多國科學家參與的人類基因組計劃,公布了人類基因組工作草圖。人類基因組非常長,包含約60億個鹼基。
  • 納米孔PromethION測序+Shasta完成人類基因組端粒到著絲粒的高效...
    團隊在2019年利用初代Shasta分析流程對納米孔測序數據進行從頭組裝、矯正和Hi-C拼接Scaffold(圖1),使用一臺納米孔PromethION測序設備在9天內完成了11個人類基因組測序,研究成果發表在《Nature Biotechnology》, DOI:高通量數據:共生成2.4 Tb序列數據,10kb及以上讀長序列的覆蓋度中位數約為55X,100 kb及以上的超長讀長序列覆蓋深度中位數約為
  • 納米孔測序技術可同時分析人類細胞的染色質可及性和甲基化
    納米孔測序技術可同時分析人類細胞的染色質可及性和甲基化 作者:小柯機器人 發布時間:2020/11/26 11:40:11 美國約翰霍普金斯大學Winston Timp課題組利用納米孔測序實現對人類細胞系染色質可及性和甲基化的同時檢測