比較基因組學終將走向黃金時代

2020-07-14 oebiotech歐易生物

背景介紹

始於1990年的人類基因組計劃(The Human Genome Project)開啟了基因組時代。隨著測序技術的不斷進步和測序成本的下降,越來越多的物種基因組被測序,從原核生物(流感嗜血桿菌,1995)到真核生物(釀酒酵母,1996),從單細胞生物到多細胞生物(秀麗線蟲,1998;果蠅,2000),從陸生生物到水生生物(河豚魚,2002),從動物到植物(擬南芥,2000),從小基因組生物到大基因組生物(人,2001;小鼠,2002;大鼠,2004)。大量基因組數據的深入研究,開闊了人類對物種進化及生命之樹(地球上所有生命之間的進化關係網絡,圖1)認識的眼界,推動了物種間的比較基因組學的研究。

比較基因組學終將走向黃金時代

圖1 | 生命之樹(來源於網絡圖片)


比較基因組學是什麼?

比較基因組,一般是指一個物種的多個個體基因組(群體)或多個物種基因組的結構和功能基因區域進行比較分析(Nobrega and Pennacchio 2004),本文主要指後者。具體來講就是:比較多個物種的基因組結構特徵的異同,研究物種間基因家族收縮與擴張,研究分化時間和演化關係,研究新基因的產生與進化等。其中,基因組的結構特徵包括DNA序列、基因及基因家族、基因排序、調控序列和其它基因組結構標誌等(圖2)。

比較基因組學終將走向黃金時代

圖2 | 基因組特徵結構(修改網絡圖片)


比較基因組學研究基礎是什麼?

當物種A與物種B在從共同祖先分化的初期,兩物種基因序列(內含子和外顯子)都具有非常高的保守性(圖3左)。但是隨著兩物種的分化時間越來越久遠,由於鹼基自發突變,兩物種的基因序列會存在越來越多的變異。不同的是內含子序列由於不參與編碼蛋白,其突變不改變蛋白序列,因此受選擇壓力較小,允許積累較多突變;而外顯子區域由於負責編碼蛋白,其突變導致蛋白序列和功能發生改變,特別是功能重要的看家基因,其外顯子序列受到較強的負向選擇,一般不容易積累突變,因而兩物種的外顯子區域仍然具有非常高的同源性(圖3右)(Miller, Makova et al. 2004)。


比較基因組研究的基礎正是基於物種基因序列的相似性,即物種間基因序列同源性越高,基因組共線性越好,說明物種的親緣關係越近;相反,如果物種間基因序列變異越大,說明物種分化時間越久遠,親緣關係就越遠。

比較基因組學終將走向黃金時代

圖3 | 基因編碼和非編碼序列在物種分化後因受到不同選擇壓力,具有不同保守性


研究比較基因組學的意義是什麼?

通過比較在生命進化樹中處於不同地位的物種的基因組結構特徵,推測序列的共同祖先狀態(common ancestral states),得到最近共同祖先序列(MRCA: most recent common ancestor)。通過研究物種演化過程中序列變異,了解物種分類譜系的動態變化過程,解析物種進化關係,為闡明物種進化歷史提供依據(圖4)(Kawashima,T. 2019)。同時,比較基因組對於解釋基因功能,闡明其在適應性進化中的作用,鑑定基因型和表型之間的聯繫等方面也有重要意義(Alfoldi and Lindblad-Toh 2013)。

比較基因組學終將走向黃金時代

圖4 | 比較基因組中物種生物學分類距離示意圖

X、Y、Z為現存物種,都從共同祖先CA分化而來,其中X和Y的親緣關係比X和Z的親緣關係更近。當將X、Y和Z三個物種同時進行比較基因組分析時,可以推測其共同祖先CA的性狀特徵。


比較基因組分析主要包括哪些方面?

比較基因組學通過比較多物種蛋白序列或者基因位置與相對順序,包括基因的丟失、複製、水平轉移等,鑑定物種之間保守的基因(找物種相似之處),或者每個生物自身特徵基因(找物種不同之處),旨在闡釋物種多樣性的分子遺傳基礎。其常見分析包括:基因家族聚類得到直系同源基因、系統進化分析、物種分歧時間估算、鑑定基因融合與基因簇、信號通路基因簇重構、基因家族收縮與擴張、全基因組共線性比較等(圖5)(V. de Crécy-Lagard and Hanson, A. 2013)。

比較基因組學終將走向黃金時代

圖5 | 比較基因組常見分析流程圖


比較基因組物種的選擇?

選擇合適的物種是比較基因組分析的第一步,是成功挖掘生物學故事的關鍵,更是發高分文章的必要條件。那如何選擇合適的物種呢?小編在這裡列舉些高分文章的實例,拋磚引玉,給老師們提供些思路。


案例1:比較基因組分析揭示黃麻纖維生物合成機制

研究人員首先獲得兩個高質量的錦葵科黃麻基因組,然後通過與其他13個物種,包括錦葵類(可可,棉花,擬南芥),豆類(亞麻,蓖麻,苜蓿,大豆,楊樹),菊類(番茄和土豆),葡萄和單子葉水稻(外類群)等物種進行比較基因組分析,結合纖維特異表達的轉錄組數據,揭示了黃麻中纖維合成的分子機制(圖6)(Islam, Saito et al. 2017)。

比較基因組學終將走向黃金時代

圖6 | 黃麻系統進化樹


案例2:比較基因組分析揭示大熊貓(Giant panda)和小浣熊(Red panda)都愛吃竹子的趨同進化機制

雖然大熊貓和小浣熊名字中都帶「熊」字,但它們實際上是遠親。通過將小浣熊、大熊貓、白釉、北極熊、狗、老虎、人和老鼠等物種進行比較基因組分析發現,小浣熊與白釉親緣關係相對較近,位於進化樹的姐妹支;而大熊貓與北極熊親緣關係相對較近(圖7A)。雖然是遠親,小浣熊卻表現出與大熊貓相同的食性,都愛吃竹子。這種兩個親緣關係較遠的生物獨立發展出相似特性的現象被稱為趨同進化。通過比較基因組分析,研究人員發現兩個基因PCNT 和DYNC2H,在兩個物種的四肢發育中是重要的,允許手腕的骨頭額外增長成拇指狀附屬物(偽拇指的第六指)來幫助它們進食,有助於把握竹竿(圖7B)(Hu, Wu et al. 2017)。

比較基因組學終將走向黃金時代

圖7 | 小浣熊和大熊貓的系統進化樹分析和偽拇指的趨同表型


案例3:芡實和金魚藻基因組揭示被子植物早期進化

兩種水生植物-芡實和金魚藻通過與其它代表性陸生植物基因組包括真雙子葉植物(擬南芥、桃子、葡萄和耬鬥菜),木蘭類植物(牛油果、牛樟和鵝掌楸),單子葉植物(水稻、小果野焦和蝴蝶蘭),無油樟和裸子植物銀杏,進行深入比較分析,揭示了被子植物在生命之樹中關鍵進化地位:無油樟和睡蓮是其他所有被子植物的姐妹群;而金魚藻是雙子葉植物的姐妹群(圖8)(Yang, Sun et al. 2020)。


比較基因組學終將走向黃金時代

圖8 | 芡實和金魚藻系統進化樹


從以上比較基因組研究論文中可以看出,物種的選取與闡述的生物學故事緊密相關。在此,小編依據對文獻的理解和項目分析的經驗,大膽提出針對不同的項目需求,採用不同的原則選取物種

  1. 如闡釋物種特異的生物學特性,即找物種之間差異或不同,比如案例1,要採取「相近相異」原則,即選取親緣關係較近,但生物學特性不同的物種。

  2. 如闡釋物種共有的生物學特性,即找物種間相似性,比如案例2,要採取「相遠相同」原則,即選取物種親緣關係相對較遠,但具有相似生物學特性的物種。

  3. 如闡釋物種的系統發育關係,則採取「跨度合適」的原則,即選取生命之樹上跨度合適的物種。


當然,比較基因組分析還可以應用在其他很多方面,選取物種的原則也因具體研究而異。


結束語

高質量基因組的不斷湧現,使得比較基因組的應用越來越廣泛和深入,也是研究者挖掘生物學問題和解釋生物學現象的有力工具。歐易生物擁有專業的動植物基因組研發團隊,為客戶提供從PacBio三代測序、de novo組裝、基因注釋、基礎分析,到比較基因組、個性化分析及多組學聯合分析等高質量的技術服務,多名博士級專業人員,經過多年經驗沉澱積累,具備多角度分析問題能力,提供多元化項目技術服務,多組學技術平臺聯合支撐,極力打造一站式服務。歡迎登陸歐易生物官網或來電諮詢。


參考文獻

Alfoldi, J. and K. Lindblad-Toh (2013). "Comparative genomics as a tool to understand evolution and disease." Genome Res 23(7): 1063-1068.


Hu, Y., Q. Wu, S. Ma, T. Ma, L. Shan, X. Wang, Y. Nie, Z. Ning, L. Yan, Y. Xiu and F. Wei (2017). "Comparative genomics reveals convergent evolution between the bamboo-eating giant and red pandas." Proc Natl Acad Sci U S A 114(5): 1081-1086.


Islam, M. S., J. A. Saito, E. M. Emdad, B. Ahmed, M. M. Islam, A. Halim, Q. M. Hossen, M. Z. Hossain, R. Ahmed, M. S. Hossain, S. M. Kabir, M. S. Khan, M. M. Khan, R. Hasan, N. Aktar, U. Honi, R. Islam, M. M. Rashid, X. Wan, S. Hou, T. Haque, M. S. Azam, M. M. Moosa, S. M. Elias, A. M. Hasan, N. Mahmood, M. Shafiuddin, S. Shahid, N. S. Shommu, S. Jahan, S. Roy, A. Chowdhury, A. I. Akhand, G. M. Nisho, K. S. Uddin, T. Rabeya, S. M. Hoque, A. R. Snigdha, S. Mortoza, S. A. Matin, M. K. Islam, M. Z. Lashkar, M. Zaman, A. Yuryev, M. K. Uddin, M. S. Rahman, M. S. Haque, M. M. Alam, H. Khan and M. Alam (2017). "Comparative genomics of two jute species and insight into fibre biogenesis." Nat Plants 3: 16223.


Miller, W., K. D. Makova, A. Nekrutenko and R. C. Hardison (2004). "Comparative genomics." Annu Rev Genomics Hum Genet 5: 15-56.


Kawashima T, (2019). 「Comparative and Evolutionary Genomics.」 Encyclopedia of Bioinformatics and Computational Biology.


Nobrega, M. A. and L. A. Pennacchio (2004). "Comparative genomic analysis as a tool for biological discovery." J Physiol 554(Pt 1): 31-39.


V. de Crécy-Lagard, Hanson, A. (2013) 「Comparative Genomics and Genome Evolution.」 Brenner's Encyclopedia of Genetics (Second Edition).


Yang, Y., P. Sun, L. Lv, D. Wang, D. Ru, Y. Li, T. Ma, L. Zhang, X. Shen, F. Meng, B. Jiao, L. Shan, M. Liu, Q. Wang, Z. Qin, Z. Xi, X. Wang, C. C. Davis and J. Liu (2020). "Prickly waterlily and rigid hornwort genomes shed light on early angiosperm evolution." Nature Plants 6(3): 215-222.


相關焦點

  • 張澤——西南大學——生物信息學、比較基因組學、分子進化、分子...
    所在院校: 西南大學       所在院系: 生物技術學院 職稱: 教授       招生專業: 生物化學與分子生物學 研究領域: 生物信息學、
  • 作物基因組學研究進展
    近年來,我國水稻功能基因組學研究一直走在世界前列,高質量的水稻參考基因組序列可謂功不可沒。普通小麥(Triticum aestivum L.)是3個不同亞基因組形成的異源六倍體物種(AABBDD),由早期的野生二粒小麥與粗山羊草天然雜交而來。其基因組非常龐大且結構異常複雜,富含大量的重複序列,這些特點使得小麥基因組學的研究遠遠落後於水稻和玉米等二倍體植物,嚴重製約了小麥功能基因組學研究和育種工作的深入。
  • 進化-系統發育基因組學(Phylogenomics)
    由於技術條件的限制,早期的分子系統發育學研究常常基於單個或少量基因。但考慮受到譜系不完全分選(Incomplete lineage sorting)、旁系同源基因(Paralog)、飽和替換(Substitution saturation)、生物雜交(Hybridization)等因素的影響,基於單個基因構建的系統發育樹有時並不能真實反映生物的進化歷史。
  • 人類基因組時代的泛基因組學
    薩爾茲伯格是一位橫跨計算機領域和生物學領域的專家,名氣很大,他是約翰霍普金斯大學計算生物學中心的主任,同時在計算機系和醫學院任職,專門從事基因測序和基因組學應用研究,人類基因組計劃的參與者之一,最近還主持了非洲裔美國人的基因組學項目等。開發過很多有名的生物信息算法,大家使用過的生信軟體如:bowtie、TopHat、cufflinks等都出自於他的實驗室,今天要談的泛基因組學也是他的研究內容之一。
  • 樟科植物比較轉錄組學研究獲進展
    然而,這一類群的遺傳學與基因組學研究背景十分薄弱,目前僅有鱷梨(Persea americana)、山胡椒(Lindera glauca)和山雞椒(Litsea cubeba)等少數種類的轉錄組學數據公布。
  • 英國基因組學公司選擇WekaIO來加速基因組學研究
    加速500萬個基因組計劃的基因組研究。英國基因組學公司選擇WekaFS來滿足未來五年所需的預期容量擴展,同時為其DNA管道提供最高性能。英國基因組學歸英國衛生與社會保健部所有,負責執行500萬個基因組計劃。該項目的目的是對來自國家衛生局(NHS)的罕見病患者,其家庭以及常見癌症患者的500萬個基因組進行測序。
  • 建立多學科和材料基因組學的交叉實驗室,合作搞材料基因組學項目
    包括新材料新結構材料新性能材料新光學材料新病理材料新材料材料基因組學,你可以了解下。三峽大學研究生院官網,裡面有詳細的專業課目材料基因組學是一個交叉學科,結合很多傳統的基礎研究,我所在的復旦大學和浙江大學這兩個老牌強校。比如,建立多學科和材料基因組學的交叉實驗室,合作搞材料基因組學項目等等。每個老師負責一個方向,搞基因組建模。實驗室涉及藥物合成、單細胞分子研究,腦研究和材料物理性能對比實驗,產能缺陷遷移研究等很多科研領域。老師最少都有三個博士點。
  • 代謝組學——後基因組時代新熱點
    代謝組學是定量描述生物內源性代謝物對內外因變化應答規律的科學,能夠直接反映生命體的終端和表型信息,近年來在疾病診斷和分型、生物標誌物發現、藥物研發、基因功能解析、代謝途徑及調控機理等領域發揮著重要作用。
  • 走進細胞組學最前沿!國際基因組學大會細胞組學會議在青舉行
    11月21日,國際基因組學大會細胞組學會議(ICG-15 CELLOMICS)在青島拉開帷幕。本次會議由青島西海岸新區、深圳華大生命科學研究院主辦,青島中德生態園管委、青島華大基因研究院、國際海洋基因組學聯盟和青歐生命科學高等研究院承辦。
  • 基因組學研究的未來之星——泛基因組
    高通量測序技術的迅猛發展,極大地推動了全基因組測序進程及物種的群體進化、遺傳多樣性、性狀定位等研究。但單一或者少數參考基因組中可能會缺少部分基因,不能完全覆蓋物種的全部遺傳信息,限制了基因組學研究的深入開展。泛基因組的提出,有效解決了該問題,成為了基因組學研究的新方向。01 什麼是泛基因組?
  • 百餘全球頂尖科學家共議「組學與人類健康」第十五屆國際基因組學大會(ICG-15)在武漢開幕
    央廣網武漢10月26日消息(記者張晶 通訊員龔碧婧 麥絲綺)10月26日上午,第十五屆國際基因組學大會(ICG-15)在武漢開幕。本屆大會以「組學與人類健康」為主題,吸引了來自海內外20餘位院士及百餘位組學領域頂尖科學家參會。湖北省委常委、武漢市委書記王忠林,武漢市委副書記、市長周先旺等嘉賓出席大會開幕式。
  • 美格基因微生物多組學聯合文章刊登ISME!
    華南師範大學生命科學學院王璋研究員研究團隊的研究成果刊登ISME,同時,這也是美格基因微生物多組學聯合項目文章!多組學聯合分析是微生物組研究的秘密武器!利用篩選得到1124個基因分析COPD患者和健康人之間的比較分析,通過相關性分析發現其中891個基因在不同的16S rRNA數據之間具有一致的變化趨勢,而這891個基因中的759個基因在宏基因組也表現出一致的趨勢(圖2.d)。圖2.COPD呼吸道微生物組學數據meta分析。
  • 中科院版納植物園樟科植物比較轉錄組學研究獲進展
    然而,這一類群的遺傳學與基因組學研究背景十分薄弱,目前僅有鱷梨(Persea americana)、山胡椒(Lindera glauca)和山雞椒(Litsea cubeba)等少數種類的轉錄組學數據公布。
  • 龍膽族葉綠體基因組進化和系統學研究取得進展
    大多數植物葉綠體基因組呈環狀四分體結構,包含約80個蛋白編碼基因。葉綠體基因組由於缺乏重組,而常被認為是連鎖的單一基因座;然而,越來越多的研究表明,葉綠體基因組中不同區域以及不同編碼基因具有不同的核酸替代速率,經受不同的自然選擇壓力。目前對葉綠體單基因或不同功能組基因的進化研究較少。
  • 奧維森基因與西部開發研究院共建基因組學研究中心
    奧維森基因是行業領先的跨組學技術合作夥伴,致力於將國際領先的基因組學和生物信息學技術相結合,提供優質、高效、性價比優的技術服務。3月25日,西部開發研究院常務副院長火照程一行再次來到奧維森基因,就奧維森基因在疫情防控期間科研攻關、生產經營等方面進行座談交流。
  • 基因組學辨別蚊子進化及多樣性
    瑞士洛桑大學生態與進化系的馬爾滕·賴納德斯等研究人員,回顧了蚊子基因組學的現狀、資源及其在描述蚊子生物學和進化特徵方面的應用進展,重點介紹了進化基因組學和功能基因組學的交叉,以理解基因和基因組動力學與蚊子多樣性之間的假定聯繫。(文章來源:科技日報)
  • 石瓊:立足基因組學科技,助力海洋藍色經濟
    2018年5月,由深圳市華大海洋研究院(下稱「海洋研究院」)和國家基因庫聯合發起的「千種魚類轉錄組」項目正式宣布構建了迄今為止最可靠的魚類系統演化樹,解答了許多一直以來魚類起源和進化研究中存在的爭論和難題,成為魚類演化研究史上的裡程碑式事件。長期以來,有別於陸地生物基因組學研究,海洋的生物基因組學研究不僅起步晚,且發展滯後。
  • 【中國科學報】功能基因組學渴盼技術突圍
    為此,功能基因組學應運而生。中國科學院遺傳與發育生物學研究所研究員馬潤林表示,功能基因組學就是要解析生物的遺傳信息,從基因組水平和層次上,對其內的各個基因或特定序列進行功能分析,揭示目標基因組的功能及調控機制。
  • 癲癇的基因檢測和蛋白質組學研究
    隨著分子生物學技術的進展,基因檢測的方法越來越多,主要包括:直接測序,突變掃面(利用變性高效液相色譜,單鏈構象多態性分析,變性梯度凝膠電泳等技術來識別基因變異的部位),已知突變檢測,螢光原位雜交(FISH),微陣列比較基因組雜交(Array-CGH),單核苷酸多態性分析及多重連接探針擴增技術(MLPA
  • 國際基因組學大會細胞組學會議在青島舉行 開啟國際技術合作新篇章
    11月21日,國際基因組學大會細胞組學會議(ICG-15 CELLOMICS)在青島拉開帷幕。本次會議由青島西海岸新區、深圳華大生命科學研究院主辦,青島中德生態園管委、青島華大基因研究院、國際海洋基因組學聯盟和青歐生命科學高等研究院承辦。