全文共1539字,預計學習時長4分鐘

2003年,人類基因組計劃結束了13年長跑,成功測序人體90%以上的基因,但其餘部分仍難以解碼。
近年來,DNA讀取技術不斷改善,這些空缺被逐步填滿,研究人員得以進一步繪製完整的人類基因組圖譜。但還是有百餘個區域未得完成,其中就包括X染色體上的幾個部分。
而近期發表於Nature的一項研究顯示,科學家首次確定從端粒到端粒的X染色體的完整序列,此成就能幫助科學家進一步了解多種遺傳條件。
測序X染色體及其它染色體的區域難倒了科學家,因為這些部位包含大量重複的DNA片段,令測序變得棘手,片段上有著重複了成千上萬次的DNA字母(即鹼基)。
加利福尼亞大學加州聖克魯斯分校的DNA生物學家、該論文作者卡倫·米加表示:「直到最近,組裝或拼湊這些片段才成為可能。」
研究人員採用高級測序技術,專注於解碼X染色體,因為絕大多數人至少有一條X染色體。通常,從生理上的女性有一對X染色體,生理上是男性的人有一條X染色體和一條Y染色體。
米加說:「基因遺傳學及基因組學領域研究X染色體,因其與許多遺傳特性及疾病相關聯。」比如,X染色體與色盲、杜氏肌營養不良及血友病有關。

米加與來自美國國家人類基因組研究所的研究員亞當·菲利皮合作,採用長讀長測序,即能一次讀取長鏈DNA鹼基的技術進行研究。人類基因密碼長到難以想像——約60億個鹼基——且DNA測序儀無法同時讀取所有鹼基。
因此,研究人員不得不將基因組切割為含有上百個鹼基的小片段,這樣便可以一次分析一個小片段。任務完成後,研究人員還須重新拼接這些片段。
在人類基因組項目初期,科學家一次僅能讀取500個鹼基。20世紀中期,測序技術愈加精準,但其速度降至每次讀取100至200個鹼基。到2010年,新技術問世,可一次讀取約10000個鹼基。使用舊測序技術時,這些重複DNA片段切割出的短片段十分相似,幾乎沒有能將它們拼接的線索。
現在,測序技術的改進意味著一些儀器可以同時讀取約100000甚至更多的鹼基。米加與菲利皮團隊採取兩種工具分析X染色體,染色體來自內含兩個相同X染色體的特殊細胞。之後,菲利皮及其團隊使用新創建的電腦程式拼接這些片段。
在X染色體上,他們能夠填補染色體中央及許多基因上的空白部分。這樣一來,儘管研究人員沒發現什麼大驚喜——比如沒有新的、尚待發現的基因,但他們發現了許多在基因組重複片段中的變化。變化包括DNA鹼基替換、缺失或插入,也包括較長DNA片段的複製、易位或倒置,這些問題會導致基因疾病。

米加說:「你可以對人群中一些最豐富的序列多樣性視而不見,而你所忽視的或許就與此前無法研究的疾病有關。」
進一步研究這些尚未測序的區域會開闢基因組新疆界,研究人員可以以此尋找基因突變與原因未知的基因疾病之間的聯繫。接下來,研究人員把目光轉向下一個未完整測序的染色體,以期最終能拼接出首個完整的人類基因組序列。
留言點讚關注
我們一起分享AI學習與發展的乾貨
如轉載,請後臺留言,遵守轉載規範