深度解析人類基因組中的加速進化區

2020-12-05 生物谷

2016年8月18日 訊 /生物谷BIOON/ --2001年當第一個人類基因組測序結果公布時,我(筆者)還是一名在研究組從事統計學數據分析的研究生,我們研究團隊的目的就是發現腫瘤細胞和健康細胞之間基因表達水平的差異,像很多人一樣,我也有著自己的想法,希望通過對30多億個As, Cs, Ts及 Gs鹼基進行分析得出一些可喜的結果,繪製人類細胞的精確線路圖以及開發治療疾病的新型療法是我的同學和教授們經常談到的話題,然而我卻對這些數據不同的用途卻更感興趣一些,直到黑猩猩的基因組被測序完成後,我就知道我又有事兒要幹了。

在生命進化樹中,黑猩猩和人類親緣關係最近,其機體的生物學特性和人類非常相似,然而卻又存在著驚人的差異,不管是在消化酶類還是發音語言上都存在明顯的不同;人類通常會遭受一系列疾病,但這些疾病似乎對黑猩猩並無多大影響,比如自閉症、精神分裂症、阿爾茲海默氏症、糖尿病等多種疾病,長期以來我對古人類的化石以及骨頭的不同演變形式非常著迷,但有時這些骨頭並不能告訴我們關於人類機體免疫系統和認知能力的進化歷史,因此我們就開始研究如何利用癌症研究中的統計學方法來比較人類和黑猩猩機體DNA的差異,而我們的目標就是鑑別出使人類變得獨一無二的遺傳特性。

2005年黑猩猩的基因組測序結果公布,當時我正在加利福尼亞大學做博士後研究,此後研究者們又開始對另外12種脊椎動物進行研究,與此同時,計算機科學家們也忙於開發特殊算法來追蹤多個物種相似區域中的DNA,當然我也進行了一些比較基因組的掃描研究,即通過寫入了一些電腦程式來鑑別其它動物機體中保守的DNA序列,自從我們從古老祖先進化成為人類,機體的DNA才發生了快速的改變,而這些進化特性可以預測人類機體功能的缺失或修飾,我和其他同事就利用了兩部分模型定義了人類基因組的快速進化區域,名為人類加速進化區(human accelerated regions,HARs),2006年我們發布了202個HARs的信息。

這項研究讓人非常激動,但同時也會出現一些令人生畏的模式,僅有一小部分的HARs位於基因中,實際上我們並不知道絕大部分假設的功能性及特殊性的人類DNA序列到底是什麼,更不必說其在人類進化過程中所扮演的角色了,HARs是一種短的,平均僅有227個鹼基對長,明顯小於基因的DNA序列,其看起來就好像是我們所說的「垃圾DNA」,而且科學家們從來沒有對其進行深入研究過。

感謝測序技術帶來的幫助,該技術可以產生出大量的基因組信息,而且不同實驗室也對計算方法進行了一些調整,如今研究者得到的HARs組合清單中包括了將近3000個基因組片段,研究者指出,幾乎所有的HARs都位於基因外部,有些則距離基因組中的基因距離較遠。

那麼在哺乳動物的進化歷程中,HARs到底做了什麼才使其序列保持永久不變的?每一個HAR中的多個人類突變又是如何改變其功能的?連續十年以來,我們的研究團隊(格萊斯頓研究所)同其他研究者一直在調查這些問題,我們希望可以更好地理解為何人類和其他物種不一樣,為何人類具有獨特性?

特殊的人類基因調節子

HARs是人類基因組中的保守區域,其中部分HARs在黑猩猩和鴨嘴獸之間是幾乎相同的,這些序列編碼的信息非常關鍵,而且序列的改變能夠改變基因中的重要指令,而這就使得研究人類基因組中HARs的突變變得尤為重要了。研究者推測,HARs序列的突變會破壞或者改變基因調節子的功能,同時研究者鑑別出的頭兩個HARs就從功能特性上支持了這一假設。

HAR1並不會編碼蛋白質,而是會編碼長鏈的RNA,研究者推測,HAR1的RNA能夠摺疊形成一個三維結構,因為其保守的序列具有一種迴文結構,這些結構能夠配對形成一系列互聯的莖樣結構,這些結構看起來就好像梯子一樣(DNA雙螺旋結構),隨後研究人員在體外通過合成人類和黑猩猩的HAR1 RNA,鑑別出了這種RNA結構,隨即證實了計算機預測的結果;隨後通過標記人類和獼猴胚胎中的HAR1,研究者就發現,在大腦皮質模式和布局形成過程中,RNAs就會在神經元中發揮功能,大腦皮質是人類進化過程中尺寸能夠擴張的一種大腦結構,目前研究者並不清楚哪種基因的HAR1可以發揮調節作用。

HAR2(HACNS1)既不會編碼蛋白,也不會編碼RNA,其功能就好比增強子一樣,可以增加或降低基因的表達水平,增強子距離其所調節的基因又數千個鹼基那麼遠,而且一旦增強子進入物理距離以內其就會使得目標基因被激活表達;對小鼠的研究結果表明,在多個胚胎組織中,人類機體的HAR2處於活性狀態,目前研究者並不清楚HAR2調節基因表達的分子機制,研究者指出,另一種名為GBX2的轉錄因子也能夠控制參與胚胎形態發生的基因的表達。

基於前期的研究發現,研究者揭示了其它HARs在基因調節過程所扮演的角色,而這還要感謝先進技術的幫忙,這些技術能夠幫助研究者在單細胞水平下測定基因表達的水平,並且追蹤結合DNA的蛋白質的位點,同時還能夠評估基因組中其它的表觀遺傳特性;將相關的研究信息整合到計算機模型中,研究者們就推測5%的HARs的功能就類似於非編碼性的RNAs,同時大部分的HARs可以作為增強子在胚胎發育過程中幫助控制基因的表達。

為了更深入具體地驗證這種假設,研究小組(筆者)開始對大約100個快速進化的HARs的功能進行研究,研究者推測這些HARs具有增強子的活性,研究者將構建的報導子注入到受精的小鼠胚胎和魚類胚胎中,這種報導子中在基因之前加入了黑猩猩的HAR序列;截止到目前為止,進行增強子活性檢測三分之二的HARs在機體發育期間都可以開啟基因的表達,對於26個增強子而言,研究者對人類序列重複了相關的實驗,當人類突變開始出現時,有8個HARs表現出了增強子活性的差異,而這些差異可以修飾四肢(HAR2, 2xHAR114)、眼部(HAR25)及中樞神經系統(2xHAR142, 2xHAR238, 2xHAR164, 2xHAR170, ANC516/HARE5)發育過程中基因的表達情況。

許多HARs都位於控制機體基礎發育過程的基因位置附近,因此其改變的調節功能或許對於人類的生物學特性有著深遠的影響;相比黑猩猩的HAR而言,人類機體中一種HAR增強子(ANC516/HARE5)處於發育早期時在大腦的較大一部分區域中都處於活性狀態,人類機體中的HARE5可以增強靶向基因Frizzled 8的表達,基因Frizzled 8會影響小鼠大腦的尺寸及發育。

相關的實驗結果表明,在人類進化過程中HARs能夠改變關鍵的機體發育程序,在對HARE5的研究過程中,研究者發現,HAR序列能夠影響對人類進化非常重要的器官,而且HARs的突變或許會影響到人類的一些特性,比如運動技能、言語以及認知功能等;但將HAR突變同有機體的創新機制聯繫起來就有點困難了,因為目前研究者很難檢測人類或猿類遺傳改變所產生的影響,因此建立上述關聯才是研究者未來要面對的巨大挑戰。

HARs的浮現

人類和黑猩猩最近的祖先大約生活在600萬年前,化石記錄數據顯示,從那時開始兩個物種(人類和黑猩猩)在很多方面都開始了持續性的改變,因此知曉人類進化期間HAR的突變狀況,或許就能夠幫助科學家們將HAR同人類機體不斷改變的特性相聯繫;相反,隨著我們闡明HAR突變所影響的人類生物性過程開始,突變的年齡或許也能夠幫助確定化石難以指示的人類機體特性。

估計HAR的進化非常具有挑戰性,因為這些計算過程依賴於對古人類基因組數據的比較,沒有了沿著人類譜系的分子路標,我們很難說在人類和黑猩猩分開之後HAR的進化是對的,但對古老DNA的測序技術或許就能夠給我們一些提示,比如,通過將人類的HAR序列同古人類HAR序列進行比較,研究者就能夠估計,HAR的突變到底是在共同祖先出現之前、之後還是出現期間發生的,因此大多數的HAR突變往往都已經有數百萬年的歷史了,而且其也和滅絕的古人類有一部分相同(黑猩猩則不是)。

然而一些HAR 是近些年才開始進化產生的,HARs中大約10%的突變具有多態性,這就意味著,僅有一部分人類會攜帶這種突變的序列,而其他人群則會攜帶在黑猩猩機體中出現的DNA序列;HARs多態性的改變往往是在人類進化的最近階段發生的,其並不太可能有超過100萬年的歷史,但研究者卻在部分人群中發現了新型的HAR突變,這或許就意味著他們可以提前知曉大約6萬年前的人類長距離遷移的過程了。

加速推進創造HARs

從統計學上來講,高度保守的DNA序列在600萬年的進化歷程中將會改變很多次這種可能性幾乎為零,也就是說,除非有某種驅動力來選擇性地抵禦序列突然改變引發的突變,比如HAR2就會開啟參與人類四肢發育的基因的表達,而這要感謝於特殊序列的缺失。

長期以來科學家們一直希望能夠闡明HARs的功能以及其在人類進化過程中所扮演的角色,但如今研究者仍然不能深入理解HARs在機體發育和其它過程中的特殊功能,其中研究者面臨的一個主要的挑戰就是如何建立因果關係,慶幸的是,當前新技術的不斷湧現使得科學家們可以通過靈長類動物的皮膚組織來製造出大腦、心臟和肝臟細胞,同時在實驗室對這些細胞的DNA進行編輯,於是研究者們就能夠證實是否特殊的人類突變能夠改變人類或靈長類機體細胞中HARs激活細胞表達的能力。此外,利用高通量的基因組技術研究者就可以測定增強子的活性,同時對大量HARs進行檢測,這一項項激動人心的結果或將加速研究者對HAR功能的理解,同時也將幫助他們理解塑造HARs的進化驅動力。當然,研究者還指出,高效的計算技術和算法程序對於HAR的研究也至關重要,如今研究者發現了202個原始的HARs,他們相信隨著高端技術的開發以及不斷的深入研究,未來他們或將對更多的HARs進行研究,並且闡明HARs的功能,以及實現在人類細胞中對HARs進行精準化編輯。(生物谷Bioon.com)

本文系生物谷原創編譯整理,歡迎轉載!點擊 獲取授權 。更多資訊請下載 生物谷APP.

參考資料:

【1】International Human Genome Sequencing Consortium, 「Initial sequencing and analysis of the human genome,」 Nature, 409:860-921, 2001.

【2】The Chimpanzee Sequencing and Analysis Consortium, 「Initial sequence of the chimpanzee genome and comparison with the human genome,」 Nature, 437:69-87, 2005.

【3】K.S. Pollard et al., 「Forces shaping the fastest evolving regions in the human genome,」 PLOS Genet, 2:e168, 2006.

【4】M.J. Hubisz, K.S. Pollard, 「Exploring the genesis and functions of Human Accelerated Regions sheds light on their role in human evolution,」 Curr Opin Genet Dev, 29:15-21, 2014.

【5】K.S. Pollard et al., 「An RNA gene expressed during cortical development evolved rapidly in humans,」 Nature, 443:167-72, 2006.

【6】A. Beniaminov et al., 「Distinctive structures between chimpanzee and human in a brain noncoding RNA,」 RNA, 14:1270-75, 2008.

【7】S. Herculano-Houzel, 「The remarkable, yet not extraordinary, human brain as a scaled-up primate brain and its associated cost,」 PNAS, 109(Suppl 1):10661-68, 2012.

【8】S. Prabhakar et al., 「Human-specific gain of function in a developmental enhancer,」 Science, 321:1346-50, 2008.

【9】J.A. Capra et al., 「Many human accelerated regions are developmental enhancers,」 Philos Trans R Soc Lond B Biol Sci, 368:20130025, 2013.

【10】J.L. Boyd et al., 「Human-chimpanzee differences in a FZD8 enhancer alter cell-cycle dynamics in the developing neocortex,」 Curr Biol, 25:772-79, 2015.

【11】J. Krause, S. Paabo, 「Genetic time travel,」 Genetics, 203:9-12, 2016.

【12】R.E. Green et al., 「A draft sequence of the Neandertal genome,」 Science, 328:710-22, 2010.

【13】K.S. Pollard et al., 「Analysis of human accelerated DNA regions using archaic hominin genomes,」 PLOS ONE, 7:e32877, 2012.

【14】C.N. Simonti et al., 「The phenotypic legacy of admixture between modern humans and Neandertals,」 Science, 351:737-41, 2016.

【15】K. Sumiyama, N. Saitou, 「Loss-of-function mutation in a repressor module of human-specifically activated enhancer HACNS1,」 Mol Biol Evol, 28:3005-07, 2011.

【16】I. Gallego Romero et al., 「A panel of induced pluripotent stem cells from chimpanzees: A resource for comparative functional genomics,」 eLife, 4:e07103, 2015.

【17】S. Weyer, S. Paabo, 「Functional analyses of transcription factor binding sites that differ between present-day and archaic humans,」 Mol Biol Evol, 33:316-22, 2016.

【18】Decoding Human Accelerated Regions

相關焦點

  • HPC如何協助解析新型冠狀病毒基因組
    對於新發病毒,在序列組裝過程中會面臨更多難點,因為在測序深度、測序準確性、重複序列比例等方面沒有可供參考的經驗值,這就需要將海量的短序列還原出原始的基因組序列。在序列拼裝中還可能會出現測序錯誤,拼接的準確性和完整性不高,拼接難度更高。所以,解析新冠病毒序列,需要在建庫、高通量測序、序列組裝、變異進化分析等多個流程加以管理。
  • 研究解析寨卡病毒基因組RNA二級結構圖譜並發現調控RNA病毒傳播的...
    與登革病毒、乙型腦炎等常見典型黃熱病毒類似,寨卡病毒通過蚊蟲叮咬在人類和其它動物中傳播,對人類健康有嚴重的威脅。寨卡病毒有兩個流行株系:一個比較古老的非洲株系,於 1947年發現於非洲;另一種是流行的亞洲株系(又稱美洲株系),原在東南亞流行,後在南美洲和中北美洲爆發。目前,對人類威脅較大的株系是亞洲株系。
  • 人類基因組的基因進化
    在11月13日的《美國科學院院刊》的網站上公示了美國健康研究院癌症研究所的華人學者劉秀芬(Xiu-Fen  Liu)等人有關人類基因組中POTE-actin基因表達和進化的研究論文。         研究組之前曾描述了一種靈長類特異性基因家族POTE,這種基因在許多中癌症中表達,但正常器官中的量很有限。
  • 全基因組單核苷酸變異資料庫建立
    有助推動我國及周邊國家人群的進化遺傳和醫學研究 中國科學院上海營養與健康研究所/馬普計算生物學研究所徐書華團隊新近建立的全基因組單核苷酸變異資料庫有助於更深入解析人類基因組變異的功能、表型效應,對我國及周邊國家人群的進化遺傳和醫學研究具有重要價值。
  • 科學家揭示棉花基因組進化歷程
    因此,提高棉花品質,是我國棉花研究中非常重要的課題。」中國科學院院士、武漢大學高等研究院院長朱玉賢告訴《中國科學報》。   近日,朱玉賢團隊解析了世界上首個高精度的草棉參考基因組,解決了困擾已久的棉花A基因組進化起源問題,為棉花遺傳改良提供了寶貴的基因組資源,將加快培育高產優質的棉花新品種的進程。相關研究成果發表於《自然—遺傳學》。
  • 探索人類基因組「荒漠」中的秘密[圖]
    該項目旨在識別出人類基因組序列中的所有功能區,包括轉錄、轉錄因子聯合、染色質結構和組蛋白修飾區,現在科學家們可以確認,人類基因組中80%的成分至少有一種生化功能。  人類基因組計劃與ENCODE計劃之間有著承上啟下的關係。人類基因組計劃發現基因組中僅有1.5%的序列是給蛋白質編碼的,其餘98.5%的序列以前被認為是「垃圾」。
  • 研究人員解析豆科植物深度系統發育關係
    本報訊(記者 季徵) 近日,中國科學院昆明植物研究所植物多樣性與基因組學團隊伊廷雙和李德銖研究組在國際生物系統學頂級期刊發表研究成果,解析豆科植物深度系統發育關係。    豆科是植物界第三大科,約有765屬19500種,也是經濟價值最大的科之一。
  • 我國科學家解析蠟梅染色體水平的基因組圖譜
    我國科學家解析蠟梅染色體水平的基因組圖譜中國花木園林快訊 記者柏斌報導 近日,華中農業大學劉秀群(副教授)、趙凱歌(副教授)研究組和金雙俠(教授)研究組,聯合西南林業大學陳龍清(教授)研究組在開放獲取期刊Genome Biology 上,以「The chromosome-level wintersweet (Chimonanthus
  • 一飯一思丨文明是如何加速人類進化的?
    來源:盒飯財經引讀物理學家霍金在生前預測說:「一旦『超級人類』普遍存在,沒有改善基因的普通人就會被淘汰。」《進化論》的觀點認為人類基因進化的方向是自然選擇的結果,但是,《一萬年的爆發》這本書提出:人類自己創造的文明也會改變基因的進化。那麼,文明是如何加速人類進化的呢?這就是《一萬年的爆發》這本書要重點回答的問題。《一萬年的爆發》是一本簡述文明如何加速人類進化的書。
  • 人類仍在進化,並且在加速,科學家在35%的人手臂中發現了進化
    達爾文的進化論為我們解釋了自然界中生物的持續演化,也正是經過數億年間的發展,才造成了地球的多樣性的生物鏈,同樣,也告訴我們自然界的萬物都有著共同的起源,而人類更是得天獨厚,擁有了智慧。其實就是我們熟知的基因突變以及外來環境的影響,基因突變為生物打造了基礎,而環境變遷更是加速了生物間的進化,大概意思就是,如果你不做出改變,你只能被自然殘酷的淘汰。
  • 浙大羅琛教授:解析基因組印記
    浙大羅琛教授:解析基因組印記   生物通報導  來自浙江大學生命科學學院的研究人員近日在國際學術期刊《Epigenetics
  • 草莓箭毒蛙基因組成功解析
    原標題:草莓箭毒蛙基因組成功解析   記者從中科院昆明動物研究所獲悉,該所近日聯合美國北卡萊羅納大學、加利福尼亞大學和丹麥哥本哈根大學的研究人員,首次成功「破譯」草莓箭毒蛙基因組,揭示了其基因組演化特徵,為研究毒蛙的演化提供新思路。研究成果發表於國際著名雜誌《分子生物學與進化》。
  • 昆明動物所在樹鼩基因組研究中取得進展
    來自中國科學院昆明動物研究所的研究團隊,對樹鼩開展了長期而深入的研究,先後主導完成了樹鼩高質量基因組測定、基於樹鼩精原幹細胞的轉基因技術突破、樹鼩特殊遺傳特性和生活習性的解析等工作,拓展了人們對於這一新型實驗動物的認識。
  • 我國科學家解析蠟梅染色體水平的基因組圖譜
    蠟梅還是本草綱目中記載的藥草植物。該研究團隊利用二代Illumina Hiseq2000和三代PacBio測序平臺進行測序,結合10x Genomics和Hi-C獲得了染色體水平的精細基因組。同時利用二代測序技術完成了蠟梅近緣種夏蠟梅的全基因組測序。
  • 今日關注:我國科學家解析蠟梅染色體水平的基因組圖譜
    研究者利用蠟梅、夏蠟梅以及其他15個具有代表性被子植物的基因組數據構建了系統進化樹,結果表明木蘭類植物與雙子葉植物互為姐妹關係。同時利用共線性分析以及Ks分析,估測蠟梅經歷了兩次全基因組複製事件,分別發生在大約77.8和112.1Ma。其中較古老的全基因組複製事件發生在樟科和蠟梅科分化之前,近期的全基因組複製事件發生在樟科和蠟梅科分化之後。
  • 研究人員從冬眠動物進化中尋找治療肥胖等疾病線索
    新華社華盛頓11月26日電(記者周舟)美國科研團隊從冬眠動物的基因組中發現可能與肥胖和代謝紊亂有關的基因片段,未來有望開發出治療人類相關疾病的新方法。  冬眠的哺乳動物體內會蓄積大量脂肪,但甦醒後依然能保持健康。
  • 【科技日報】草莓箭毒蛙基因組成功解析
    研究成果發表於國際著名雜誌《分子生物學與進化》。  箭毒蛙是生活在中美洲及南美洲加勒比海沿岸的低地森林中的一種小型陸地蛙,當地部族將其分泌的毒素塗在箭上,因此得名。箭毒蛙以其強烈的毒性、絢麗斑斕的色彩以及獨特的生活習性而不同尋常。一些箭毒蛙所攜帶的毒素,強度是嗎啡的200倍。雖然這些強毒素是對付天敵的致命武器,但對自身卻沒有影響。
  • Science:獼猴的參考基因組為進化和疾病研究提供線索
    在研究人類生物學和疾病時,獼猴是最常用的非人類靈長類動物模型之一。鑑於獼猴在生物醫學研究中的重要地位,華盛頓大學等多家機構的研究人員近日組裝出獼猴的最新參考基因組,發現了新的譜系特異性基因和擴展的基因家族,有望為進化研究和人類疾病提供線索。
  • 在基因組垃圾場裡,科學家發現了進化中的重要基因
    人們通常認為基本基因在進化時期是凍結的——進化的速度非常緩慢,因為變化或死亡會導致生物死亡。億萬年的進化將昆蟲和哺乳動物分開,但是實驗表明,指導果蠅和小鼠體內進化發展的Hox基因可以毫無障礙地互換,因為它們非常相似。這種顯著的進化是基因組研究的一個基礎概念。但是一項新的研究改變了基因保護的基本原理。
  • 基因組研究揭示了榕樹的進化秘密
    榕樹無花果榕樹以其氣生根而聞名,該氣生根從樹枝發芽並最終到達土壤,這棵樹和與之共同進化的黃蜂也有著獨特的關係,並且是唯一可以將其授粉的昆蟲,在一項新的研究中,研究人員在榕樹無花果的基因組中識別出促進其異常氣生根發育並增強其向黃蜂授粉者發出信號的能力的區域。