DNA是一部由30億個鹼基對排列組合而成的「天書」

2020-11-25 鳳凰河北站

原標題:載有人類龐大遺傳信息的基因組,是一部由30億個鹼基對排列組合而成的「天書」。裡面有我們的「自傳」,更蘊含著生命延續進化的密碼——破解人類DNA「天書」

圖註:DNA結構圖

人類一直認為,自己位於整個進化體系的頂端是因為自身的複雜程度,然而事實並非如此。美國華盛頓大學遺傳學家埃文•艾希勒教授帶領的研究團隊日前在美國《科學》月刊撰文說,現代人類的細胞裡所擁有的遺傳信息實際上不如遠古的「親戚」多。從早期人類至今,我們已經失去了4070萬個鹼基對。

DNA數量多少與人類進化程度有什麼關係?人類DNA發揮著什麼樣的作用?人類能否通過基因掌握自己的命運……帶著一系列疑問,記者採訪了一直從事基因研究的河北醫科大學博士生導師呂佔軍教授。

基因組大的生物不一定進化程度高

埃文•艾希勒教授帶領的研究團隊來自39個不同的研究所。他們對來自125個不同人群的236個人的DNA進行了分析。然後,將其與黑猩猩、尼安德特人及丹尼索瓦人等古人類的基因組進行比較。他們發現,在大約1300萬年前的人類進化早期,人類在非洲與類人猿相分離之後,喪失了大約1580萬個鹼基對。隨著人類後來分布於世界各地,他們進一步喪失了1216萬個獨特的DNA片段。

「在生物界的進化過程中,像人類這樣丟失DNA的並不是個例,而且基因組大的生物不一定進化程度高。」呂佔軍表示,基因組大小與生物進化程度約略成正比,但離散比較大,有許多的例外。「比如洋蔥的基因組相當於人類的5倍大小,但它的進化程度和人類相去甚遠。」

據介紹,不只是洋蔥,衣笠草(又名重樓百合)有1490億個鹼基對,非洲肺魚有1320億個,寬足蠑螈有655億個,而人類的基因組只有約30億個鹼基對。為什麼洋蔥、衣笠草等這些基因組大的生物進化程度並不是更高?

原來,構成生物基因組的每個鹼基對,並不是發揮著同樣的作用,而生物進化程度更多地取決於起主要作用的部分。比如,黑猩猩是與人類血緣最近的動物,也是除人類之外智力水平最高的動物。以前,科學家們一直認為人類和黑猩猩之間的巨大外形差異是因為兩個物種有不同的基因構造。然而,當二者的基因組被測序後,研究人員驚奇地發現,人類和黑猩猩的DNA序列幾乎完全相同。

「根據目前最新的研究,人和猩猩的主要區別在於ALU基因數量的多少。」呂佔軍介紹,靈長類動物身上都有這個基因,而且越多越聰明。

此外,埃文•艾希勒在研究中還發現,尼安德特人與丹尼索瓦人基因組中有大約10.4萬個鹼基對未在現代人類身上發現;而現代人類大約有3.33萬個鹼基對未在尼安德特人或丹尼索瓦人身上發現。

「事實上,人類對基因所起作用的認識才剛剛開始。」呂佔軍認為,在人類的進化過程中,失去的這部分DNA與新基因的重新排序和形成同樣重要,而且研究這些差異有助於解開現代人得以存活繁衍而其他人種則滅絕之謎。

「垃圾」DNA在控制細胞、器官和其他組織的行為上起著關鍵作用

「在人類基因研究中,一直有一種『垃圾』DNA的觀點。他們認為負責蛋白質編碼的DNA是有用的,其他則是殘餘的進化物質。」呂佔軍表示,人類僅有1%到2%的DNA負責蛋白質的編碼,如果按照這種觀點,人類基因組的98%都是毫無用處的「垃圾」DNA,這顯然讓人難以信服。

據了解,這種「垃圾」DNA的觀點由來已久。早在1972年,美國加州理工學院的大野乾就提出了假說:哺乳動物的基因不可能超過3萬個。理由是基因越多,發生突變的概率就越大,而且絕大多數突變是有害的,所以超過3萬個基因的哺乳動物根本無法存活。這樣,他把哺乳動物基因組中剩下的大量的不用來編碼蛋白質的DNA,稱為「垃圾」DNA。

2000年以後,隨著人類基因組測序工作的完成,科學家們發現人類基因大約在2萬個左右,正好與大野乾的假設相吻合,而且有科學家開始用實驗證明這一假設。2004年10月,美國一科學家在《自然》雜誌發表報告說,他們刪除了小鼠基因中超過100萬個鹼基對的非編碼DNA(約佔鼠基因的1%),但這並沒有對小鼠的發育、壽命和繁殖造成可察覺的影響。在100多項評估基因活性的組織測試中,只有兩項發現差異。這一實驗結果的發表進一步激發了科學家們對「垃圾」DNA的關注。

2012年,《自然》、《基因組研究》等權威刊物密集發表多篇為「垃圾」DNA正名的論文。在《自然》雜誌的一篇論文中,研究人員指出,他們通過研究發現了許多基因開關,這些開關與一系列人類疾病有關係,如多發性硬化症等,甚至還包括像身高這樣的體貌特徵。他們認為,人類基因組攜帶著至少400萬個基因開關,而這些基因開關就位於曾被認為是「垃圾」的DNA片段上。這一發現,被認為是醫學界和科學界的重大突破。

「所謂『垃圾』DNA在控制細胞、器官和其他組織的行為上起著關鍵作用。」呂佔軍介紹,從出生到死亡,我們體內每一個細胞中合成的蛋白質幾乎都是一樣的。在什麼時間、什麼地方激活哪些蛋白質必須經過控制,而這就是基因開關所起的作用。

然而,有關爭論並未結束,一些堅持「垃圾」DNA觀點的科學家開始對他們的論述進行修正。2014年,牛津大學克裡斯•蘭茲教授發布研究報告稱,人類DNA中僅僅有8.2%是「起作用的」。他認為,略多於1%的人類DNA參與蛋白質編碼,另外7%在不同的時間、不同的人體部位,參與激活和抑制給蛋白質編碼的基因活動。

「這實際上還是『垃圾』DNA的觀點,只是把負責基因開關的部分獨立出來,但其仍然堅持認為人類DNA中大部分是沒有用的。」呂佔軍對此並不認同,他表示,隨著對「垃圾」DNA研究的深入,還會有更多的證據來反駁這種觀點。

未來醫生會基於你的基因培養出私人定製的藥品

「儘管科學家已經完成了人類全基因組測序工作,但這只是基因研究的第一步。」呂佔軍介紹,基因組測序就是檢測DNA四個鹼基ATCG的排列順序,正是它們排列組合的順序不同,造成了包括人在內每一個生物的差別。「人類全基因組測序就是檢測出全部30億個鹼基對是怎麼排列的。」

據了解,「人類基因組研究計劃」曾被譽為生命科學的「登月計劃」,最早由美國提出。1990年,美國能源部與國立衛生研究院(NIH)共同啟動人類基因組研究計劃,後來,英國、德國、日本、中國和法國的科學家相繼加入,並於2000年6月繪製完成了人類基因組草圖。

「正常人有大約30億個鹼基對,哪怕是其中一個排序不同,都有可能會造成高矮胖瘦等各種表面特徵的不同。而且其中一些序列的缺失或者變異,也是造成很多疾病的根源之一。」呂佔軍表示,人類基因組研究有一個貫穿始終的目的,就是希望通過人類基因組信息幫助人們克服疾病,達到健康長壽的目的。

全基因組測序,是檢測人類所有基因組信息,不針對任何單個疾病,但又囊括了所有單個基因檢測要用到的信息。「這相當於人類基因的一部『天書』,但以我們現有的技術和能力,還不能完全看懂。」

事實上,不要說解讀,就連「瀏覽」完「天書」這一步,也沒有想像中那麼容易。先不論鹼基這種納米級的東西「讀」起來有多費勁,光是30億鹼基對這個龐大數字,就讓研究人員頭痛。精確的全基因組測序要求每個位點平均至少被測量30次,出來的數據基數至少都是TB(計算機存儲容量單位,1TB=1024GB)級別的。

呂佔軍說,目前基因治療已成為醫學界研究的一大熱點,而且隨著技術進步,科學家們已經看懂了其中一些「字句」,在基因治療腫瘤、血管硬化等方面也取得了很大進展。

「在基因修復和改良技術下,未來基於細胞培養的自我疾病治療將成為可能。」呂佔軍對基因治療很有信心,「到那時,生病後不用再吃普通藥物,而是醫生根據你的基因培養出的私人定製藥品。」

相關焦點

  • 8鹼基DNA的誕生,會是外星生命的遺傳密碼麼?
    當然,這種全新的DNA並非自然界產生的,而是由科學家Steven Benner帶領研究組合成出來的。隨後,擴展遺傳字母表的方式大致可分為兩種:1)鹼基間通過疏水相互作用配對。美國Floyd E. Romesberg教授團隊則創造出了兩種疏水性人工鹼基XY,並通過改造tRNA,成功創造了包含ATGCXY 6種鹼基的全新生命體,將遺傳字母表擴展到六個字母。儘管只多了兩個鹼基,但細胞可以合成的胺基酸數目已經可從20種變成172種。
  • 8鹼基DNA誕生,會是外星生命遺傳密碼?
    而演化的基礎就是DNA了,DNA用4個鹼基的排列組合完整地保存著遺傳信息,並利用RNA至蛋白的方法進行解碼,構築起整個生命體的基礎結構。這種DNA的4鹼基模式被認為是生命的基本存在形式,但是DNA只有4種鹼基才能存在嗎?Science上的最新文章給出了答案:8種鹼基的DNA也能存在。
  • 首份個人DNA圖譜 60億對鹼基序列全破譯
    人類基因組由30億對鹼基組成,包含數萬個基因,分布於23條獨立的染色體之中。人類通常具有兩套這樣的染色體(46條),一套來自父親,一套來自母親,兩者間存在0.01%的差異,所以人的全基因組實際上應該包括60億對鹼基。「454」公司對沃森的兩套染色體的60億鹼基對都進行了測序。工作量雖然相當浩大,但只用了不到2年時間。
  • DNA迎來4名新成員:4個鹼基變8個
    追溯這個問題,首先需要回答生命的物質基礎——基因,而基因是由4個天然鹼基組成的,它們的英文代碼分別是「C」「G」「T」「A」,對應的中文名字是胞嘧啶、鳥嘌呤、胸腺嘧啶、腺嘌呤,配對規則是C配G,T配A,C和G之間通過3個氫鍵相連,T和A之間是2個氫鍵。
  • 科學家創造由8種鹼基組成的DNA,能像天然DNA一樣存儲和轉錄信息
    複雜的 DNA 其實只有四種鹼基排列組合而成,分別為鳥嘌呤、胞嘧啶、腺嘌呤和胸腺嘧啶,通常用字母 G、C、A 和 T 表示。四種不同類型鹼基的排列組合,就如同計算機語言中的「0」和「1」一樣,儲存著地球上所有生命的遺傳信息。
  • 科學家創造出由8種鹼基組成的DNA,能夠像天然DNA一樣存儲和轉錄信息
    複雜的 DNA 其實只有四種鹼基排列組合而成,分別為鳥嘌呤、胞嘧啶、腺嘌呤和胸腺嘧啶,通常用字母 G、C、A 和 T 表示。四種不同類型鹼基的排列組合,就如同計算機語言中的「0」和「1」一樣,儲存著地球上所有生命的遺傳信息。
  • 科學家建立一種新型的元DNA結構,開闢光電子以及合成生物學
    ASU和上海交通大學(SJTU)的一個由分子科學學院米爾頓格利克教授郝巖領導的科學家團隊眾所周知,沃森-克裡克鹼基配對的可預見性以及dna的結構特徵,使得dna可以作為一種通用的構件,來設計複雜的納米結構和設備。「DNA技術的一個裡程碑當然是dna摺紙的發明,其中一個長單鏈dna(Ssdna)在數百條短dna短纖鏈的幫助下被摺疊成指定的形狀,」嚴解釋道。
  • 排列組合公式/排列組合計算公式
    公式P是指排列,從N個元素取R個進行排列。公式C是指組合,從N個元素取R個,不進行排列。
  • 世界上存儲量最大的硬碟,就是你的DNA
    記得生物課上講過, DNA ( 脫氧核糖核酸)是一種雙螺旋結構( doublehelix )的生物大分子,由鹼基組成。圖片用不同顏色代表不同鹼基鹼基的排列順序,決定了長相、智力,不同病症的發病風險等。隨便舉個慄子, ACA 的排列讓人眼神不好,按CAC 排能讓人長高。
  • 猜想木乃伊之謎,DNA記憶存儲,複製人是否有本體記憶?
    並沒寫入硬碟,那大腦會不會只是個處理記憶調取記憶的那麼一個地方呢?把你的記憶文字化或者圖像化,來讀取調用而大腦只不過是個cpu晶片來處理各種問題。那真正的存儲記憶的地方在哪裡呢?2016年紐約基因組研究中心的研究人員發現了一套新的編碼系統,可以極大的增加dna分子的數據存儲容量他們將一部電影,一個電腦作業系統,一篇論文,一個電腦病毒,一張電子券進行了「鹼基編碼」,並成功的合成了實體dna
  • DNA硬碟:16GB的英文版維基百科,正以4Mb/s的速度存入DNA
    ——DNA寫入機的哲學基礎據CNET報導,StartCatalog已經將所有16 GB的英語維基百科存儲在這個小瓶中的dna上。CataLog是一家位於美國波士頓的初創公司,成立於2016年,2018年累計獲得千萬級美元融資。上個世紀60年代,生物存儲信息的想法被科學家提了出來。
  • 從DNA到蛋白蛋:4個鹼基是如何編寫成我們這本生命複雜的書?
    泛生論認為,遺傳是通過精子把人體各功能的微縮成份運輸到卵子裡,組合成胚胎,然後胚胎再發育成完整的人。先成論則認為,沒有泛生論那麼複雜,精子的頭部其實已經形成一個「雛形人」,而胚胎的發育,只是把它放大成一個完整的人就OK。
  • 含8個鹼基的DNA首次合成
    正常情況下,當一對DNA鏈以雙螺旋的形式纏繞在一起時,每條DNA鏈上都有成對的鹼基:A和T,C和G,鹼基之間依賴氫鍵牢牢結合在一起。由鳥嘌呤(G)、胞嘧啶(C)和腺嘌呤(A)、胸腺嘧啶(T)組成的兩對鹼基,加上在RNA中存在的尿嘧啶(U),被認為是大自然創造地球上無窮無盡生命的所有基礎。很長一段時間以來,科學家們一直試圖在這套遺傳密碼中加入更多的化學物質。
  • 科學家首次合成包含六種鹼基的生命體,自然法則對生命40億年的統治終於被人類打破
    這類含氮化合物構成了DNA的基本材料(下圖),並組成了合成蛋白質的「指令」——密碼子(由3個鹼基組成,對應了組成蛋白質的不同胺基酸)。Romesberg教授高中生物告訴我們,組成DNA的ATGC四種鹼基可以隨機排列形成64種不同的包含3個鹼基的組合,形成生命的遺傳密碼,每個密碼編碼一種相應的胺基酸。
  • 排列組合公式
  • 論公考中的排列組合
    基本知識點: (1)排列、組合 這組概念主要負責挑人或者挑東西,與順序有關就用排列,與順序無關就用組合。看跟順序有關還是無關只需把任意兩個元素互換位置即可,若產生了新情況,則與順序有關,否則,與順序無關。
  • 含8個鹼基的DNA首次合成
    地球生命的DNA包含4個鹼基,現在,美國科學家將生命「字母表」的數量增加了一倍,首次合成出包含8個鹼基的DNA。實驗表明,合成DNA似乎能像天然DNA一樣存儲和轉錄信息。發表於《科學》雜誌的最新研究成果表明,宇宙中或許存在其他生命形式,這對於外星生命搜尋非常重要。
  • ...天然鹼基?科學家多用了四個合成鹼基創造出了具有雙螺旋結構的DNA
    不止四個天然鹼基?(指A、G、C、T四個鹼基)旋轉跳躍,構成了優雅的DNA雙螺旋結構,為我們星球提供了生命密碼。編寫遺傳密碼天然DNA由四種分子組成,稱為含氮鹼基,它們彼此配對形成地球上的生命密碼:A與T配對;G與C配對。除了這四個天然鹼基外,「八字母」DNA包還包括另外四個合成的核苷酸鹼基:P、B、Z以及S。該研究小組由美國各地幾個不同的團隊組成。研究人員用天然和合成的核苷酸鹼基對的不同組合創造了數百個這樣的「八字母」雙螺旋結構。
  • 核苷酸由磷酸基、戊糖和含氮鹼基組成,鹼基包括嘌呤和嘧啶兩大類
    小胞漿RNA(scRNA,smallcytosol RNA)又稱為7SLRNA,長約300個核苷酸,主要存在於細胞漿中,是蛋白質定位合成於粗面內質網上所需的信號識別體(signal recognization particle)的組成成分.
  • 排列組合的基本計算公式、排列組合的威力
    今天講一下如何理解和記憶排列組合的基本計算公式,然後再解釋一下為什麼推薦用排列組合。排列的定義:從n個不同元素中任取m個,按一定順序排成一列,所有排列的個數記作:A(n,m)組合的定義:從n個不同元素中任取m個的組合數(順序無關)記作:C(n,m)A(n,m)=n(n-1)(n-2)…(n-m+1)C(n,m)=n(n-1)(n-2)…(n-m+1)÷(m!)