2016年8月18日 訊 /生物谷BIOON/ --2001年當第一個人類基因組測序結果公布時,我(筆者)還是一名在研究組從事統計學數據分析的研究生,我們研究團隊的目的就是發現腫瘤細胞和健康細胞之間基因表達水平的差異,像很多人一樣,我也有著自己的想法,希望通過對30多億個As, Cs, Ts及 Gs鹼基進行分析得出一些可喜的結果,繪製人類細胞的精確線路圖以及開發治療疾病的新型療法是我的同學和教授們經常談到的話題,然而我卻對這些數據不同的用途卻更感興趣一些,直到黑猩猩的基因組被測序完成後,我就知道我又有事兒要幹了。
在生命進化樹中,黑猩猩和人類親緣關係最近,其機體的生物學特性和人類非常相似,然而卻又存在著驚人的差異,不管是在消化酶類還是發音語言上都存在明顯的不同;人類通常會遭受一系列疾病,但這些疾病似乎對黑猩猩並無多大影響,比如自閉症、精神分裂症、阿爾茲海默氏症、糖尿病等多種疾病,長期以來我對古人類的化石以及骨頭的不同演變形式非常著迷,但有時這些骨頭並不能告訴我們關於人類機體免疫系統和認知能力的進化歷史,因此我們就開始研究如何利用癌症研究中的統計學方法來比較人類和黑猩猩機體DNA的差異,而我們的目標就是鑑別出使人類變得獨一無二的遺傳特性。
2005年黑猩猩的基因組測序結果公布,當時我正在加利福尼亞大學做博士後研究,此後研究者們又開始對另外12種脊椎動物進行研究,與此同時,計算機科學家們也忙於開發特殊算法來追蹤多個物種相似區域中的DNA,當然我也進行了一些比較基因組的掃描研究,即通過寫入了一些電腦程式來鑑別其它動物機體中保守的DNA序列,自從我們從古老祖先進化成為人類,機體的DNA才發生了快速的改變,而這些進化特性可以預測人類機體功能的缺失或修飾,我和其他同事就利用了兩部分模型定義了人類基因組的快速進化區域,名為人類加速進化區(human accelerated regions,HARs),2006年我們發布了202個HARs的信息。
這項研究讓人非常激動,但同時也會出現一些令人生畏的模式,僅有一小部分的HARs位於基因中,實際上我們並不知道絕大部分假設的功能性及特殊性的人類DNA序列到底是什麼,更不必說其在人類進化過程中所扮演的角色了,HARs是一種短的,平均僅有227個鹼基對長,明顯小於基因的DNA序列,其看起來就好像是我們所說的「垃圾DNA」,而且科學家們從來沒有對其進行深入研究過。
感謝測序技術帶來的幫助,該技術可以產生出大量的基因組信息,而且不同實驗室也對計算方法進行了一些調整,如今研究者得到的HARs組合清單中包括了將近3000個基因組片段,研究者指出,幾乎所有的HARs都位於基因外部,有些則距離基因組中的基因距離較遠。
那麼在哺乳動物的進化歷程中,HARs到底做了什麼才使其序列保持永久不變的?每一個HAR中的多個人類突變又是如何改變其功能的?連續十年以來,我們的研究團隊(格萊斯頓研究所)同其他研究者一直在調查這些問題,我們希望可以更好地理解為何人類和其他物種不一樣,為何人類具有獨特性?
特殊的人類基因調節子
HARs是人類基因組中的保守區域,其中部分HARs在黑猩猩和鴨嘴獸之間是幾乎相同的,這些序列編碼的信息非常關鍵,而且序列的改變能夠改變基因中的重要指令,而這就使得研究人類基因組中HARs的突變變得尤為重要了。研究者推測,HARs序列的突變會破壞或者改變基因調節子的功能,同時研究者鑑別出的頭兩個HARs就從功能特性上支持了這一假設。
HAR1並不會編碼蛋白質,而是會編碼長鏈的RNA,研究者推測,HAR1的RNA能夠摺疊形成一個三維結構,因為其保守的序列具有一種迴文結構,這些結構能夠配對形成一系列互聯的莖樣結構,這些結構看起來就好像梯子一樣(DNA雙螺旋結構),隨後研究人員在體外通過合成人類和黑猩猩的HAR1 RNA,鑑別出了這種RNA結構,隨即證實了計算機預測的結果;隨後通過標記人類和獼猴胚胎中的HAR1,研究者就發現,在大腦皮質模式和布局形成過程中,RNAs就會在神經元中發揮功能,大腦皮質是人類進化過程中尺寸能夠擴張的一種大腦結構,目前研究者並不清楚哪種基因的HAR1可以發揮調節作用。
HAR2(HACNS1)既不會編碼蛋白,也不會編碼RNA,其功能就好比增強子一樣,可以增加或降低基因的表達水平,增強子距離其所調節的基因又數千個鹼基那麼遠,而且一旦增強子進入物理距離以內其就會使得目標基因被激活表達;對小鼠的研究結果表明,在多個胚胎組織中,人類機體的HAR2處於活性狀態,目前研究者並不清楚HAR2調節基因表達的分子機制,研究者指出,另一種名為GBX2的轉錄因子也能夠控制參與胚胎形態發生的基因的表達。
基於前期的研究發現,研究者揭示了其它HARs在基因調節過程所扮演的角色,而這還要感謝先進技術的幫忙,這些技術能夠幫助研究者在單細胞水平下測定基因表達的水平,並且追蹤結合DNA的蛋白質的位點,同時還能夠評估基因組中其它的表觀遺傳特性;將相關的研究信息整合到計算機模型中,研究者們就推測5%的HARs的功能就類似於非編碼性的RNAs,同時大部分的HARs可以作為增強子在胚胎發育過程中幫助控制基因的表達。
為了更深入具體地驗證這種假設,研究小組(筆者)開始對大約100個快速進化的HARs的功能進行研究,研究者推測這些HARs具有增強子的活性,研究者將構建的報導子注入到受精的小鼠胚胎和魚類胚胎中,這種報導子中在基因之前加入了黑猩猩的HAR序列;截止到目前為止,進行增強子活性檢測三分之二的HARs在機體發育期間都可以開啟基因的表達,對於26個增強子而言,研究者對人類序列重複了相關的實驗,當人類突變開始出現時,有8個HARs表現出了增強子活性的差異,而這些差異可以修飾四肢(HAR2, 2xHAR114)、眼部(HAR25)及中樞神經系統(2xHAR142, 2xHAR238, 2xHAR164, 2xHAR170, ANC516/HARE5)發育過程中基因的表達情況。
許多HARs都位於控制機體基礎發育過程的基因位置附近,因此其改變的調節功能或許對於人類的生物學特性有著深遠的影響;相比黑猩猩的HAR而言,人類機體中一種HAR增強子(ANC516/HARE5)處於發育早期時在大腦的較大一部分區域中都處於活性狀態,人類機體中的HARE5可以增強靶向基因Frizzled 8的表達,基因Frizzled 8會影響小鼠大腦的尺寸及發育。
相關的實驗結果表明,在人類進化過程中HARs能夠改變關鍵的機體發育程序,在對HARE5的研究過程中,研究者發現,HAR序列能夠影響對人類進化非常重要的器官,而且HARs的突變或許會影響到人類的一些特性,比如運動技能、言語以及認知功能等;但將HAR突變同有機體的創新機制聯繫起來就有點困難了,因為目前研究者很難檢測人類或猿類遺傳改變所產生的影響,因此建立上述關聯才是研究者未來要面對的巨大挑戰。
HARs的浮現
人類和黑猩猩最近的祖先大約生活在600萬年前,化石記錄數據顯示,從那時開始兩個物種(人類和黑猩猩)在很多方面都開始了持續性的改變,因此知曉人類進化期間HAR的突變狀況,或許就能夠幫助科學家們將HAR同人類機體不斷改變的特性相聯繫;相反,隨著我們闡明HAR突變所影響的人類生物性過程開始,突變的年齡或許也能夠幫助確定化石難以指示的人類機體特性。
估計HAR的進化非常具有挑戰性,因為這些計算過程依賴於對古人類基因組數據的比較,沒有了沿著人類譜系的分子路標,我們很難說在人類和黑猩猩分開之後HAR的進化是對的,但對古老DNA的測序技術或許就能夠給我們一些提示,比如,通過將人類的HAR序列同古人類HAR序列進行比較,研究者就能夠估計,HAR的突變到底是在共同祖先出現之前、之後還是出現期間發生的,因此大多數的HAR突變往往都已經有數百萬年的歷史了,而且其也和滅絕的古人類有一部分相同(黑猩猩則不是)。
然而一些HAR 是近些年才開始進化產生的,HARs中大約10%的突變具有多態性,這就意味著,僅有一部分人類會攜帶這種突變的序列,而其他人群則會攜帶在黑猩猩機體中出現的DNA序列;HARs多態性的改變往往是在人類進化的最近階段發生的,其並不太可能有超過100萬年的歷史,但研究者卻在部分人群中發現了新型的HAR突變,這或許就意味著他們可以提前知曉大約6萬年前的人類長距離遷移的過程了。
加速推進創造HARs
從統計學上來講,高度保守的DNA序列在600萬年的進化歷程中將會改變很多次這種可能性幾乎為零,也就是說,除非有某種驅動力來選擇性地抵禦序列突然改變引發的突變,比如HAR2就會開啟參與人類四肢發育的基因的表達,而這要感謝於特殊序列的缺失。
長期以來科學家們一直希望能夠闡明HARs的功能以及其在人類進化過程中所扮演的角色,但如今研究者仍然不能深入理解HARs在機體發育和其它過程中的特殊功能,其中研究者面臨的一個主要的挑戰就是如何建立因果關係,慶幸的是,當前新技術的不斷湧現使得科學家們可以通過靈長類動物的皮膚組織來製造出大腦、心臟和肝臟細胞,同時在實驗室對這些細胞的DNA進行編輯,於是研究者們就能夠證實是否特殊的人類突變能夠改變人類或靈長類機體細胞中HARs激活細胞表達的能力。此外,利用高通量的基因組技術研究者就可以測定增強子的活性,同時對大量HARs進行檢測,這一項項激動人心的結果或將加速研究者對HAR功能的理解,同時也將幫助他們理解塑造HARs的進化驅動力。當然,研究者還指出,高效的計算技術和算法程序對於HAR的研究也至關重要,如今研究者發現了202個原始的HARs,他們相信隨著高端技術的開發以及不斷的深入研究,未來他們或將對更多的HARs進行研究,並且闡明HARs的功能,以及實現在人類細胞中對HARs進行精準化編輯。(生物谷Bioon.com)
本文系生物谷原創編譯整理,歡迎轉載!點擊 獲取授權 。更多資訊請下載 生物谷APP.
參考資料:
【1】International Human Genome Sequencing Consortium, 「Initial sequencing and analysis of the human genome,」 Nature, 409:860-921, 2001.
【2】The Chimpanzee Sequencing and Analysis Consortium, 「Initial sequence of the chimpanzee genome and comparison with the human genome,」 Nature, 437:69-87, 2005.
【3】K.S. Pollard et al., 「Forces shaping the fastest evolving regions in the human genome,」 PLOS Genet, 2:e168, 2006.
【4】M.J. Hubisz, K.S. Pollard, 「Exploring the genesis and functions of Human Accelerated Regions sheds light on their role in human evolution,」 Curr Opin Genet Dev, 29:15-21, 2014.
【5】K.S. Pollard et al., 「An RNA gene expressed during cortical development evolved rapidly in humans,」 Nature, 443:167-72, 2006.
【6】A. Beniaminov et al., 「Distinctive structures between chimpanzee and human in a brain noncoding RNA,」 RNA, 14:1270-75, 2008.
【7】S. Herculano-Houzel, 「The remarkable, yet not extraordinary, human brain as a scaled-up primate brain and its associated cost,」 PNAS, 109(Suppl 1):10661-68, 2012.
【8】S. Prabhakar et al., 「Human-specific gain of function in a developmental enhancer,」 Science, 321:1346-50, 2008.
【9】J.A. Capra et al., 「Many human accelerated regions are developmental enhancers,」 Philos Trans R Soc Lond B Biol Sci, 368:20130025, 2013.
【10】J.L. Boyd et al., 「Human-chimpanzee differences in a FZD8 enhancer alter cell-cycle dynamics in the developing neocortex,」 Curr Biol, 25:772-79, 2015.
【11】J. Krause, S. Paabo, 「Genetic time travel,」 Genetics, 203:9-12, 2016.
【12】R.E. Green et al., 「A draft sequence of the Neandertal genome,」 Science, 328:710-22, 2010.
【13】K.S. Pollard et al., 「Analysis of human accelerated DNA regions using archaic hominin genomes,」 PLOS ONE, 7:e32877, 2012.
【14】C.N. Simonti et al., 「The phenotypic legacy of admixture between modern humans and Neandertals,」 Science, 351:737-41, 2016.
【15】K. Sumiyama, N. Saitou, 「Loss-of-function mutation in a repressor module of human-specifically activated enhancer HACNS1,」 Mol Biol Evol, 28:3005-07, 2011.
【16】I. Gallego Romero et al., 「A panel of induced pluripotent stem cells from chimpanzees: A resource for comparative functional genomics,」 eLife, 4:e07103, 2015.
【17】S. Weyer, S. Paabo, 「Functional analyses of transcription factor binding sites that differ between present-day and archaic humans,」 Mol Biol Evol, 33:316-22, 2016.
【18】Decoding Human Accelerated Regions