Nature重大突破!生成完整的人類X染色體序列!

2020-12-24 生物谷

2020年7月21日訊 /

生物谷

BIOON /——美國國家衛生研究院(NIH)下屬的國家人類基因組研究所(NHGRI)的研究人員製造出了第一個人類染色體的端到端DNA序列。近日發表在《自然》(Nature)雜誌上的研究結果表明,精確地生成人類染色體的鹼基序列現在是可能的,這將使研究人員能夠生成完整的人類基因組序列。


"這一成就開啟了

基因組學

研究的新時代,"美國國家基因組研究所主任、醫學博士Eric Green說道。"產生真正完整的染色體和基因組序列的能力是一項技術壯舉,它將幫助我們獲得對基因組功能的全面理解,並為在醫療保健中使用基因組信息提供信息。"


經過近二十年的改進,人類基因組參考序列是迄今為止最準確和完整的脊椎動物基因組序列。然而,其中仍然還有數百個未知的空白或缺失的DNA序列。

圖片來源:Nature


這些缺口通常包含重複的DNA片段,非常難以測序。然而,這些重複片段包括可能與人類健康和疾病相關的基因和其他功能元素。


因為人類基因組非常長,由大約60億個鹼基組成,DNA測序機無法一次讀取所有鹼基。取而代之的是,研究人員將基因組切成更小的片段,然後分析每一個片段,每次產生幾百個鹼基的序列。這些較短的DNA序列必須被重新組合在一起。


國家人類基因組研究所(NHGRI)的資深作者Adam Phillippy博士將這個問題比作解決一個謎題。


"想像一下,我們要重建一個拼圖遊戲。如果你用的是更小的碎片,每一塊都包含了更少的背景來找出它的來源,特別是在拼圖中沒有任何獨特線索的部分,比如藍天。人類基因組測序也是如此。直到現在,這些片段都太小了,沒有辦法把基因組拼圖中最難的部分拼在一起。"


在24條人類染色體(包括X和Y)中,研究作者Phillippy和Karen Miga博士選擇先完成X染色體序列,因為它與許多疾病有關,包括血友病、慢性肉芽腫病和杜氏肌營養不良。


人類有兩套染色體,分別來自父母。例如,女性從生理上繼承了兩條X染色體,一條來自母親,另一條來自父親。然而,這兩條X染色體並不完全相同,它們的DNA序列會有許多不同之處。


在這項研究中,研究人員沒有對來自正常人類細胞的X染色體進行排序。相反,他們使用了一種特殊的細胞類型--有兩個相同的X染色體。這樣的細胞比只有一個X染色體副本的男性細胞提供更多的DNA進行測序。它還避免了分析一個典型女性細胞的兩個X染色體時遇到的序列差異。


作者和他們的同事們利用了新技術,可以對長段DNA進行測序。他們沒有準備和分析小的DNA片段,而是使用了一種保持DNA分子基本完整的方法。然後用兩種不同的儀器分析這些大的DNA分子。每一種機器都能產生很長的DNA序列,這是以前的儀器無法完成的。


在以這種方式分析了人類的X染色體後,Phillippy和他的團隊使用他們新開發的電腦程式將生成的序列的許多片段組合起來。Miga的研究小組致力於縮小X染色體上最大的剩餘序列空隙,也就是染色體中間部分被稱為著絲粒的約300萬個重複DNA鹼基。


對於研究人員來說,沒有"黃金標準"來批判性地評估組裝這種高度重複的DNA序列的準確性。為了幫助確認所生成序列的有效性,Miga及其合作者執行了幾個驗證步驟。


"實際上,我們以前從未在我們的基因組中看到過這些序列,也沒有很多工具來測試我們的預測是否正確。這就是為什麼讓

基因組學

領域的專家參與進來並確保最終產品的質量是重要的。"


這是

端粒

端粒

(T2T)聯盟更廣泛倡議的一部分,部分由NHGRI資助。該聯盟的目標是生成一份完整的人類基因組參考序列。

圖片來源:Nature


T2T聯盟仍在繼續研究剩餘的人類染色體,目標是在2020年生成完整的人類基因組序列。


研究人員表示還不知道在新發現的序列中會發現什麼,但這是令人興奮的未知發現。這是一個全基因組序列的時代,他們正全心全意地擁抱它。


潛在的挑戰依然存在。例如,1號染色體和9號染色體具有比X染色體大得多的重複DNA片段。


Miga說:"我們知道,我們基因組中這些以前未繪製的位點在個體之間有很大的不同,但重要的是要開始弄清楚這些差異是如何影響人類生物學和疾病的。"Phillippy和Miga都認為,加強測序方法將繼續在人類

遺傳

學和

基因組學

領域創造新的機會。(生物谷Bioon.com)


參考資料:





相關焦點

  • 美國研究團隊首次合成人類X染色體完整序列
    美國國立衛生研究院(NIH)下屬的國家人類基因組研究所(NHGRI)的研究人員製造了人類染色體的第一個端對端DNA序列。這項研究於7月14日在《自然》(Nature)雜誌發表,表明生成一個人類染色體的精確鹼基序列如今已成為可能,未來研究人員還將能夠生成人類基因組的完整序列。
  • 人類基因組草圖再添細節X染色體被無死角解碼
    這是基因測序技術的一小步,卻有可能是人類基因工程學發展的一大步。近日,美國國立衛生研究院(NIH)人類基因組研究所(NHGRI)的研究人員宣布,終於獲得了人類X染色體的完整、無間隙、端對端的序列信息。這一突破性發現公布在《自然》雜誌上,這表明有可能生成一個人類染色體的精確鹼基序列,產生人類基因組的完整序列。NHGRI主任、醫學博士埃裡克·格林說:「這項成就開啟了基因組學研究的新紀元。」耗資30億美元、於1990年啟動的人類基因組計劃,經過十年努力,在2000年繪製出首個人類基因組工作草圖。
  • 哈佛醫學院Church等團隊開發新的方法,可快速組裝染色體
    單倍型解析或分階段的基因組組裝可提供基因組及其複雜遺傳變異的完整圖片。但是,當前用於分階段裝配的算法要麼不生成染色體尺度的定相,要麼需要譜系信息,這限制了它們的應用。人類包含每個染色體的兩個同源拷貝,並且推導每個拷貝的基因組序列對於正確理解等位基因特異性DNA甲基化和基因表達以及分析進化,法醫和遺傳疾病至關重要。然而,重建基因組序列的傳統從頭組裝算法通常將樣品表示為單倍體基因組。
  • 線粒體「夏娃」與Y染色體「亞當」之謎
    人的基因有數萬個,絕大部分位於細胞核的染色體上,但是有極少數(確切地說是37個)位於細胞質的線粒體中。每個細胞中都有成千上萬個線粒體,它們是細胞的「呼吸器官」,為細胞活動提供能量。在精子生成過程中,絕大多數的線粒體都被去除了,只保留極少數的線粒體提供精子運動的能量。
  • NCB丨不用失活,人類X染色體劑量補償添新機制!
    雖然二倍體生物通常能夠應對單個基因拷貝數的變化,但這並不適用於基因組的大部分,比如整個染色體。例如,在人類發育過程中,非整倍體通常會導致流產,就是有倖存者也會表現出先天缺陷,如發育異常和智力低下。此外,研究發現在人類女性著床前囊胚中,XIST可從兩條X染色體上單獨表達,並且X連鎖基因在兩條等位基因上的表達存在轉錄水平上的降低,但沒有沉默——這種補償狀態稱為X染色體抑制(XCD)【4】。
  • 科學家新發現,人類體內的Y染色體正在減少,未來男性會消失嗎?
    科學家新發現,人類體內的Y染色體正在減少,未來男性會消失嗎?在1951年,沃森克裡克揭開了DNA雙螺旋結構之謎,也建立了DNA的精確模型。自此人類就開始了對於人類DNA的研究,我們知道在染色體和DNA上攜帶著人體的遺傳信息片段。
  • 重大突破!東阿阿膠成功破譯德州驢基因組
    2020-12-10 13:51:47 來源: 大眾日報 舉報   國內畜禽生命科學迎來重大突破
  • 如果460萬年後Y染色體真的消失了,人類會變成孤雌生殖嗎?
    曾有統計數據表明男性比女性多了近3000萬人,當然考慮到兩性不同的適婚年齡以及各種複雜的因素,這個數據並不能代表最後的光棍人數,但比單身更可怕的是,與男性同胞緊密相關的Y染色體似乎正在慢慢退化消失。我們知道人類體細胞中有23對染色體,其中22對是常染色體,還有1對是性染色體,即X染色體與Y染色體,這決定了我們的性別。
  • Python中的時間序列數據可視化的完整指南
    時間序列數據在許多不同的行業中都非常重要。它在研究、金融行業、製藥、社交媒體、網絡服務等領域尤為重要。對時間序列數據的分析也變得越來越重要。在分析中有什麼比一些好的可視化效果更好呢?沒有一些視覺效果,任何類型的數據分析都是不完整的。因為一個好的情節比20頁的報告更能讓你理解。因此,本文是關於時間序列數據可視化的。
  • 重大事件上鏈—DeepMind破解蛋白質摺疊難題
    AlphaFold是一種能夠基於蛋白質的基因序列,利用AI預測蛋白質3D結構的系統。DeepMind表示,他們已經解決了關鍵的「蛋白質摺疊問題」,並且將解決問題的運算時間從數月縮短至了數小時,這將大大加速藥物發現速度,有可能破解一個類似於繪製人類基因組的問題。
  • X染色體決定下一代的智商?教你2招有效刺激寶寶大腦發育
    原創 丁香媽媽 很多媽媽聽說「寶寶的智商全靠 X 染色體」,因為在那裡能找到大多數跟大腦有關的基因。這樣說來,男孩獲得媽媽的 X 染色體和爸爸的 Y 染色體,智商隨媽,女孩分別獲得爸媽給予的一個 X 染色體,父母對智商的功勞一半一半?
  • 人工智慧在生物學上的重大突破,比肩DNA的發現,或徹底改變醫學
    他對《自然》雜誌說:「這是一級突破,無疑是我一生中最重要的科學成果之一。」這也是DeepMind的一次勝利,該公司因一系列算法在圍棋等遊戲中的表現超過人類而聲名大揚。然而,蛋白質結構預測的勝利標誌著它在現實世界的閃亮登場。DeepMind並不是蛋白質摺疊領域唯一的競爭者。
  • 國內AI技術再突破,百度NLG模型讓機器人能更好理解和表達
    其實NLG是NLP的一部分,其實主要目的是為了降低人類和機器/機器人之間的溝通鴻溝,也就是要將非語言格式的數據轉換成我們人類可以理解的語言格式。當然,充滿神秘和挑戰的自然語言處理包括自然語言理解和自然語言生成。而且我們漢字中文還是一個單獨的子領域:中文分詞技術。雖然NLG是把數據換成語言,其實它還包括本文到語言的轉換。
  • 人類曾丟失1對染色體,外星人假說太離奇,伏羲女媧造人或是真的
    大猩猩、黑猩猩等類人猿身上有24對染色體,但是人身上只有23對染色體。按照進化論的觀點,人類是從類人猿進化來的。如果我們真的和類人猿有著共同的祖先,根據科學家的研究,人類和類人猿的血統分叉發生在600萬年前。
  • 染色體碎裂促進癌症中基因擴增的進化
    染色體碎裂促進癌症中基因擴增的進化 作者:小柯機器人 發布時間:2020/12/25 12:53:46 美國加州大學聖地牙哥分校Don W. Cleveland、Peter J.
  • AAAI 2020 論文解讀:關於生成模型的那些事
    由表中可見,論文中完整 DG-PGNN 的結果幾乎在各個任務中的表現都是最好的。RL 如何進行序列生成前文提到的自回歸式的序列生成模型(如 LSTM,Transformer 等)就是這個任務中的 agent,可以採取的動作則是生成的單詞,策略即是模型的參數,在整個序列生成結束後,系統會給 agent 一個獎勵 r(),這個獎勵函數就是講生成的序列和目標序列(ground-truth
  • 英報:研究稱同性戀源自X染色體的一種基因
    大概有很多基因影響人類的性取向。報導稱,人們也許不該把它們看成「同性戀基因」,而應看成「愛男基因」。這種基因可能很普遍,因為它們在女性身上會使她更早、更頻繁地交配,而且生育更多孩子。同樣,女同身上如果沒有「愛女基因」也會很奇怪,這種基因如果在男性身上會讓他更早交配,生育更多孩子。人們可以跟蹤表現出差異的家族成員,以發現導致人與人不同的基因變異。
  • 重大進展!何川團隊首次系統地獲得了19個組織的5hmC圖譜
    然而,在不同的人類組織類型中缺乏全基因組範圍的5hmC圖譜,阻礙了關於5hmC如何與轉錄活性和組織特異性相關的一般性結論。具體而言,5mC使重複序列沉默,促進X染色體失活,並影響哺乳動物的基因組印跡。可以通過DNA複製進行被動稀釋或通過TET家族蛋白進行主動去甲基化來去除5mC標記。
  • ...通信重大突破!論文再登Nature,展示天地一體超4600公裡通信網絡
    論文連結:https://www.nature.com/articles/s41586-020-03093-8這是潘建偉團隊繼去年12月與中科院上海微系統所、國家並行計算機工程技術研究中心合作研發「九章」量子計算原型機,實現「量子計算優越性」後,又一次在量子領域發表新成果。智東西針對這篇論文,對這項研究成果進行較為完整的復盤和梳理。
  • 海洋所在魚類異型染色體融合起源研究中獲進展
    該研究首次從全基因組層面證實條石鯛雄魚存在染色體融合現象,解決了雄魚異型染色體Y融合起源問題,為魚類異型染色融合演化及性別決定機制解析奠定了重要基礎。  研究人員通過前期染色體核型及帶型分析發現條石鯛和斑石鯛染色體系統存在一個共同特點:雄魚(2n=47)染色體較雌魚(2n=48)少一條,並且雄魚染色體中存在一條體型異常巨大的染色體,推測它們的性別決定類型可能為X1