2020年7月21日訊 /
生物谷BIOON /——美國國家衛生研究院(NIH)下屬的國家人類基因組研究所(NHGRI)的研究人員製造出了第一個人類染色體的端到端DNA序列。近日發表在《自然》(Nature)雜誌上的研究結果表明,精確地生成人類染色體的鹼基序列現在是可能的,這將使研究人員能夠生成完整的人類基因組序列。
"這一成就開啟了
基因組學研究的新時代,"美國國家基因組研究所主任、醫學博士Eric Green說道。"產生真正完整的染色體和基因組序列的能力是一項技術壯舉,它將幫助我們獲得對基因組功能的全面理解,並為在醫療保健中使用基因組信息提供信息。"
經過近二十年的改進,人類基因組參考序列是迄今為止最準確和完整的脊椎動物基因組序列。然而,其中仍然還有數百個未知的空白或缺失的DNA序列。
圖片來源:Nature
這些缺口通常包含重複的DNA片段,非常難以測序。然而,這些重複片段包括可能與人類健康和疾病相關的基因和其他功能元素。
因為人類基因組非常長,由大約60億個鹼基組成,DNA測序機無法一次讀取所有鹼基。取而代之的是,研究人員將基因組切成更小的片段,然後分析每一個片段,每次產生幾百個鹼基的序列。這些較短的DNA序列必須被重新組合在一起。
國家人類基因組研究所(NHGRI)的資深作者Adam Phillippy博士將這個問題比作解決一個謎題。
"想像一下,我們要重建一個拼圖遊戲。如果你用的是更小的碎片,每一塊都包含了更少的背景來找出它的來源,特別是在拼圖中沒有任何獨特線索的部分,比如藍天。人類基因組測序也是如此。直到現在,這些片段都太小了,沒有辦法把基因組拼圖中最難的部分拼在一起。"
在24條人類染色體(包括X和Y)中,研究作者Phillippy和Karen Miga博士選擇先完成X染色體序列,因為它與許多疾病有關,包括血友病、慢性肉芽腫病和杜氏肌營養不良。
人類有兩套染色體,分別來自父母。例如,女性從生理上繼承了兩條X染色體,一條來自母親,另一條來自父親。然而,這兩條X染色體並不完全相同,它們的DNA序列會有許多不同之處。
在這項研究中,研究人員沒有對來自正常人類細胞的X染色體進行排序。相反,他們使用了一種特殊的細胞類型--有兩個相同的X染色體。這樣的細胞比只有一個X染色體副本的男性細胞提供更多的DNA進行測序。它還避免了分析一個典型女性細胞的兩個X染色體時遇到的序列差異。
作者和他們的同事們利用了新技術,可以對長段DNA進行測序。他們沒有準備和分析小的DNA片段,而是使用了一種保持DNA分子基本完整的方法。然後用兩種不同的儀器分析這些大的DNA分子。每一種機器都能產生很長的DNA序列,這是以前的儀器無法完成的。
在以這種方式分析了人類的X染色體後,Phillippy和他的團隊使用他們新開發的電腦程式將生成的序列的許多片段組合起來。Miga的研究小組致力於縮小X染色體上最大的剩餘序列空隙,也就是染色體中間部分被稱為著絲粒的約300萬個重複DNA鹼基。
對於研究人員來說,沒有"黃金標準"來批判性地評估組裝這種高度重複的DNA序列的準確性。為了幫助確認所生成序列的有效性,Miga及其合作者執行了幾個驗證步驟。
"實際上,我們以前從未在我們的基因組中看到過這些序列,也沒有很多工具來測試我們的預測是否正確。這就是為什麼讓
基因組學領域的專家參與進來並確保最終產品的質量是重要的。"
這是
端粒到
端粒(T2T)聯盟更廣泛倡議的一部分,部分由NHGRI資助。該聯盟的目標是生成一份完整的人類基因組參考序列。
圖片來源:Nature
T2T聯盟仍在繼續研究剩餘的人類染色體,目標是在2020年生成完整的人類基因組序列。
研究人員表示還不知道在新發現的序列中會發現什麼,但這是令人興奮的未知發現。這是一個全基因組序列的時代,他們正全心全意地擁抱它。
潛在的挑戰依然存在。例如,1號染色體和9號染色體具有比X染色體大得多的重複DNA片段。
Miga說:"我們知道,我們基因組中這些以前未繪製的位點在個體之間有很大的不同,但重要的是要開始弄清楚這些差異是如何影響人類生物學和疾病的。"Phillippy和Miga都認為,加強測序方法將繼續在人類
遺傳學和
基因組學領域創造新的機會。(生物谷Bioon.com)
參考資料: