原標題:載有人類龐大遺傳信息的基因組,是一部由30億個鹼基對排列組合而成的「天書」。裡面有我們的「自傳」,更蘊含著生命延續進化的密碼——破解人類DNA「天書」
圖註:DNA結構圖
人類一直認為,自己位於整個進化體系的頂端是因為自身的複雜程度,然而事實並非如此。美國華盛頓大學遺傳學家埃文•艾希勒教授帶領的研究團隊日前在美國《科學》月刊撰文說,現代人類的細胞裡所擁有的遺傳信息實際上不如遠古的「親戚」多。從早期人類至今,我們已經失去了4070萬個鹼基對。
DNA數量多少與人類進化程度有什麼關係?人類DNA發揮著什麼樣的作用?人類能否通過基因掌握自己的命運……帶著一系列疑問,記者採訪了一直從事基因研究的河北醫科大學博士生導師呂佔軍教授。
基因組大的生物不一定進化程度高
埃文•艾希勒教授帶領的研究團隊來自39個不同的研究所。他們對來自125個不同人群的236個人的DNA進行了分析。然後,將其與黑猩猩、尼安德特人及丹尼索瓦人等古人類的基因組進行比較。他們發現,在大約1300萬年前的人類進化早期,人類在非洲與類人猿相分離之後,喪失了大約1580萬個鹼基對。隨著人類後來分布於世界各地,他們進一步喪失了1216萬個獨特的DNA片段。
「在生物界的進化過程中,像人類這樣丟失DNA的並不是個例,而且基因組大的生物不一定進化程度高。」呂佔軍表示,基因組大小與生物進化程度約略成正比,但離散比較大,有許多的例外。「比如洋蔥的基因組相當於人類的5倍大小,但它的進化程度和人類相去甚遠。」
據介紹,不只是洋蔥,衣笠草(又名重樓百合)有1490億個鹼基對,非洲肺魚有1320億個,寬足蠑螈有655億個,而人類的基因組只有約30億個鹼基對。為什麼洋蔥、衣笠草等這些基因組大的生物進化程度並不是更高?
原來,構成生物基因組的每個鹼基對,並不是發揮著同樣的作用,而生物進化程度更多地取決於起主要作用的部分。比如,黑猩猩是與人類血緣最近的動物,也是除人類之外智力水平最高的動物。以前,科學家們一直認為人類和黑猩猩之間的巨大外形差異是因為兩個物種有不同的基因構造。然而,當二者的基因組被測序後,研究人員驚奇地發現,人類和黑猩猩的DNA序列幾乎完全相同。
「根據目前最新的研究,人和猩猩的主要區別在於ALU基因數量的多少。」呂佔軍介紹,靈長類動物身上都有這個基因,而且越多越聰明。
此外,埃文•艾希勒在研究中還發現,尼安德特人與丹尼索瓦人基因組中有大約10.4萬個鹼基對未在現代人類身上發現;而現代人類大約有3.33萬個鹼基對未在尼安德特人或丹尼索瓦人身上發現。
「事實上,人類對基因所起作用的認識才剛剛開始。」呂佔軍認為,在人類的進化過程中,失去的這部分DNA與新基因的重新排序和形成同樣重要,而且研究這些差異有助於解開現代人得以存活繁衍而其他人種則滅絕之謎。
「垃圾」DNA在控制細胞、器官和其他組織的行為上起著關鍵作用
「在人類基因研究中,一直有一種『垃圾』DNA的觀點。他們認為負責蛋白質編碼的DNA是有用的,其他則是殘餘的進化物質。」呂佔軍表示,人類僅有1%到2%的DNA負責蛋白質的編碼,如果按照這種觀點,人類基因組的98%都是毫無用處的「垃圾」DNA,這顯然讓人難以信服。
據了解,這種「垃圾」DNA的觀點由來已久。早在1972年,美國加州理工學院的大野乾就提出了假說:哺乳動物的基因不可能超過3萬個。理由是基因越多,發生突變的概率就越大,而且絕大多數突變是有害的,所以超過3萬個基因的哺乳動物根本無法存活。這樣,他把哺乳動物基因組中剩下的大量的不用來編碼蛋白質的DNA,稱為「垃圾」DNA。
2000年以後,隨著人類基因組測序工作的完成,科學家們發現人類基因大約在2萬個左右,正好與大野乾的假設相吻合,而且有科學家開始用實驗證明這一假設。2004年10月,美國一科學家在《自然》雜誌發表報告說,他們刪除了小鼠基因中超過100萬個鹼基對的非編碼DNA(約佔鼠基因的1%),但這並沒有對小鼠的發育、壽命和繁殖造成可察覺的影響。在100多項評估基因活性的組織測試中,只有兩項發現差異。這一實驗結果的發表進一步激發了科學家們對「垃圾」DNA的關注。
2012年,《自然》、《基因組研究》等權威刊物密集發表多篇為「垃圾」DNA正名的論文。在《自然》雜誌的一篇論文中,研究人員指出,他們通過研究發現了許多基因開關,這些開關與一系列人類疾病有關係,如多發性硬化症等,甚至還包括像身高這樣的體貌特徵。他們認為,人類基因組攜帶著至少400萬個基因開關,而這些基因開關就位於曾被認為是「垃圾」的DNA片段上。這一發現,被認為是醫學界和科學界的重大突破。
「所謂『垃圾』DNA在控制細胞、器官和其他組織的行為上起著關鍵作用。」呂佔軍介紹,從出生到死亡,我們體內每一個細胞中合成的蛋白質幾乎都是一樣的。在什麼時間、什麼地方激活哪些蛋白質必須經過控制,而這就是基因開關所起的作用。
然而,有關爭論並未結束,一些堅持「垃圾」DNA觀點的科學家開始對他們的論述進行修正。2014年,牛津大學克裡斯•蘭茲教授發布研究報告稱,人類DNA中僅僅有8.2%是「起作用的」。他認為,略多於1%的人類DNA參與蛋白質編碼,另外7%在不同的時間、不同的人體部位,參與激活和抑制給蛋白質編碼的基因活動。
「這實際上還是『垃圾』DNA的觀點,只是把負責基因開關的部分獨立出來,但其仍然堅持認為人類DNA中大部分是沒有用的。」呂佔軍對此並不認同,他表示,隨著對「垃圾」DNA研究的深入,還會有更多的證據來反駁這種觀點。
未來醫生會基於你的基因培養出私人定製的藥品
「儘管科學家已經完成了人類全基因組測序工作,但這只是基因研究的第一步。」呂佔軍介紹,基因組測序就是檢測DNA四個鹼基ATCG的排列順序,正是它們排列組合的順序不同,造成了包括人在內每一個生物的差別。「人類全基因組測序就是檢測出全部30億個鹼基對是怎麼排列的。」
據了解,「人類基因組研究計劃」曾被譽為生命科學的「登月計劃」,最早由美國提出。1990年,美國能源部與國立衛生研究院(NIH)共同啟動人類基因組研究計劃,後來,英國、德國、日本、中國和法國的科學家相繼加入,並於2000年6月繪製完成了人類基因組草圖。
「正常人有大約30億個鹼基對,哪怕是其中一個排序不同,都有可能會造成高矮胖瘦等各種表面特徵的不同。而且其中一些序列的缺失或者變異,也是造成很多疾病的根源之一。」呂佔軍表示,人類基因組研究有一個貫穿始終的目的,就是希望通過人類基因組信息幫助人們克服疾病,達到健康長壽的目的。
全基因組測序,是檢測人類所有基因組信息,不針對任何單個疾病,但又囊括了所有單個基因檢測要用到的信息。「這相當於人類基因的一部『天書』,但以我們現有的技術和能力,還不能完全看懂。」
事實上,不要說解讀,就連「瀏覽」完「天書」這一步,也沒有想像中那麼容易。先不論鹼基這種納米級的東西「讀」起來有多費勁,光是30億鹼基對這個龐大數字,就讓研究人員頭痛。精確的全基因組測序要求每個位點平均至少被測量30次,出來的數據基數至少都是TB(計算機存儲容量單位,1TB=1024GB)級別的。
呂佔軍說,目前基因治療已成為醫學界研究的一大熱點,而且隨著技術進步,科學家們已經看懂了其中一些「字句」,在基因治療腫瘤、血管硬化等方面也取得了很大進展。
「在基因修復和改良技術下,未來基於細胞培養的自我疾病治療將成為可能。」呂佔軍對基因治療很有信心,「到那時,生病後不用再吃普通藥物,而是醫生根據你的基因培養出的私人定製藥品。」