原核生物基因組重組在大腸桿菌物種形成中的決定作用

2020-12-23 測序中國

物種起源一直是地球上芸芸眾生多樣化(Diversity)和變演(Evolution)的核心問題之一。基因的變異和基因組的重組是物種起源和變演的內因和原動力。一般說來,變異作為基因型的物質基礎,發生於所有生命體的遺傳物質——DNA或者RNA之中,作為「信息流」(Information Track)而在變化中代代傳承,孕育著生命體的遺傳多樣性,或分流(趨異,Divergent Evolution),或匯聚(趨同,Convergent Evolution);自然選擇,作為外因和環境的合力,以優勝劣汰為原則,展示出由基因型和環境共同塑造的各種表型,這些表型又會有不同的形式,有的持續遺傳,有的跨代遺傳,有的表現為某種可塑性,作為可塑流(Plasticity Track)的可觀察部分。

基因組的重組是在基因變異的基礎上更高層次的雜合性(Heterozygosity)組合,即將個別等位基因的變化「集體」遷移、集合、乃至剔除。這樣的重組一般發生在有性繁殖的過程中,通過減數分裂和染色體的部分交換,利用創造雜合個體、擴大群體中的個體數量等途徑創造更複雜的遺傳多樣性(Genetic Heterogeneity)。因此,染色體數量和多基因結構是遺傳範疇中可塑性的突出案例。對於無性繁殖的單細胞原核生物,比如細菌(也包括基因組更小的病毒)而言,重組在物種起源和變演中的作用則一直模糊不清、爭議不斷。

傳統觀點認為,細菌在傳代過程中(比如複製後尚未分離的染色體)的基因重組率極低,基因組的變化主要是通過橫向基因轉移來實現,比如利用與穿梭中的噬菌體和質粒的整合性重組來實現。這些偶然發生的基因組重組常常會打亂基因組趨異變演所形成的樹形結構,導致系統分類的混亂。由於NGS技術的突飛猛進,近年來研究發現,細菌的基因重組率遠高於預期,並達到一種類似於有性繁殖的高重組率狀態。那麼高重組率的作用是模糊還是清晰物種間的界限?在物種內的種群之間是促進還是阻遏新種的形成?新種形成的原動力是什麼?地域隔離對無性繁殖的生物和有性繁殖的生物在新種形成中的貢獻是一樣的嗎?

針對以上疑問,近日,北京基因組研究所於軍團隊利用二代、三代測序儀產生的綜合性(利用二代測序的高覆蓋度提高精準度,利用三代測序的長讀長實現連續性)數據,完成了逾百株來自世界各地、不同脊椎動物宿主(包括人類在內)的大腸桿菌(E.coli)高精準度基因組完成圖(Complete Genome)。通過基因組序列的詳細比對,構建了真實可信的大腸桿菌種內種群的系統發生樹,並結合生化檢測驗證了系統發生所形成的種群與種群間表型的差異,並定義了這些差異的生理學和分子生物學屬性。該研究成果發表在生物信息學領域雜誌Briefings in Bioinformatics上,題目為「A fine-scale map of genome-wide recombination in divergent Escherichia coli population」[1]。

文章發表在Briefings in Bioinformatics

研究者們將大腸桿菌分為活潑型(Vigorous, Vig)和懶惰型(Sluggish, Slu)兩個種群,代表獨立的種群分化,並指出種群對於營養來源的分工應該是初始分離的基礎—包括由營養與代謝的分工導致基因組組織結構的分化和固化等—也可能是新物種形成的出發點和基礎。這一假說挑戰了傳統的地域隔離理論,即地域隔離造成的基因交流的阻滯和新物種形成。研究者們通過基因組之間在單核苷酸解析度的兩兩比較,確定基因組間重組片段的長度、數量,以及每個基因的可移動性,以高清晰度解析了種群內部和之間的重組頻率,闡明了重組在大腸桿菌種群分化過程中的規律。

該研究的起點是獲得了具有物種特徵和代表性的104株前所未有的高質量大腸桿菌基因組序列完成圖和系統變演樹。同時,研究人員們還測量了這些菌株的特徵性生理生化指標,包括生長速率、趨化特性、運動速度等,還結合其生存環境和基因組中基因和關鍵變異信息,發現大腸桿菌兩大種群—活潑型(Vig)和懶惰型(Slu)的各自特徵。比如Vig包括了傳統大腸桿菌分群的phylotype A和B1,其特徵為生長速度快、運動速度快、嗜胺基酸、不能分解雙糖,宿主主要來自熱、溫帶地區、多發現於肉食及雜食動物體內,可引起流行性及侵襲性腸道內感染,極少耐藥。而Slu包括了傳統大腸桿菌分群的phylotype B2,其特徵為生長速度慢、運動速度慢、不嗜胺基酸、能分解雙糖,宿主多為生活在寒、溫帶地區的草食及雜食動物,常引起耐藥性及腸外感染,極少流行。從基因組組成上來看,Vig和Slu兩個種群存在明顯差異,包括大量穩定的核心基因以及特異變異,攜帶不同的代謝胺基酸及糖類代謝相關的基因、耐藥基因、毒性基因等,這些基因組特徵可以清楚區分兩個分化了的種群,很有可能成為兩個新物種發生的初始階段。

圖1. E.coli的Vig和Slu種群的系統發生關係和生存環境差異。

來源:Briefings in Bioinformatics

於軍團隊的研究手段主要是基因組序列的詳細兩兩比較,確定重組片段的位置和大小,並獲得每個基因組間、種群內基因組間和種群間基因組間重組片段的發生和規律(圖2A)。首先是種群內的重組片段無論在長度上,還是在數量上都明顯高於種群間的重組片段。兩個種群內基因組之間的重組片段總長度在0.3~2 Mbp之間,最大可以達到基因組長度(4Mbp)的一半。即使在種群內正常寄生和致病性大腸桿菌之間的重組也非常活躍,重組片段長度與其它種群內重組情況相當,說明正常寄生和致病性之間沒有明顯的遺傳界限。與之相反,種群間基因組重組片段平均長度只有種群內重組片段長度的1/10,且不超過250kbp(圖2B)。進一步的分析發現,重組片段的長度與基因組之間的遺傳距離顯著成反比:遺傳距越近的基因組之間,重組越活躍;遺傳相距越遠的基因組之間,重組越稀少,並在遺傳距離跨種群時,重組率出現陡峭下滑趨勢(圖2C)。以往的模型研究發現,僅依靠該機制(遺傳距離與重組率成反比)就可以使種群分開,因此,重組不但不會減緩物種形成的進程,反而會促進物種的分化。

圖2. E.coli種群內部和之間的重組情況。來源:Briefings in Bioinformatics

基於重組片段中每個基因的相應結構與功能性分析發現,大部分重組片段的長度約3000bp左右,恰好是典型原核生物操縱子(operon,可自我調控的基因表達單元)長度(圖3A)。可見,這些片段其實可以在重組後完好地保存其功能,而它們的功能大多與營養吸收和代謝有關。當研究人員進一步計算每個參與重組基因在所有可能重組事件中真實概率(存在於重組片段中的次數除以在整個大腸桿菌群體中出現的次數)時,這個定義為基因的「可移動性」(0~1之間)在很多基因上數值為零,即這些基因從不參與重組事件。另一個極端是有些基因卻永遠存在於重組片段中。因此,基因的可移動性與其在大腸桿菌群體中的普及性成反比,對於普及性為100%的核心基因來說,幾乎從不參與重組,而普及性相對較低的基因,如耐藥基因等,移動性就很高(圖3B)。這些現象說明近緣個體基因組之間雖然重組非常活躍,但很少涉及具有核心營養物代謝、運動調控功能等基因,從而保持供體和受體基因組之間整體功能的穩定性。這個現象驗證了研究團隊2014年提出的原核生物(尤其是真細菌)基因組組織框架(genome organization framework, GOF)的概念[2]。在GOF概念中,基因組是由兩部分基因組成:基因組組織框架基因(cGOF-associated genes,也稱為clade-associated genes, CAG)和可移動基因(clade-associated-variation-containing genes, CAV genes)。前者的結構相對穩定,是由泛基因組研究產生的核心基因來界定,所以稱為「核心基因界定的基因組組織框架(core-gene-defined genome organizational framework, cGOF)」;後者是指在cGOF框架中可以插入重組片段的特定位置和在這些位置上發現的基因,由於對它們種群特徵性變異(相同的基因當時屬於不同的種群)加以識別,所以也叫做CAV基因。研究者們發現,在Vig種群中顯著富集的CAG基因在Vig群內部的移動性顯著低於其在Slu群中的移動性;同樣,在Slu種群中顯著富集的CAG基因在Slu群內部的移動性顯著低於其在Vig群中的移動性。這兩個趨勢說明在某個種群明顯富集的CAG基因參與了該種群的核心生物學功能,因為受到功能選擇而很少被重組,而當其處於其它種群基因組中時,因為生物學功能並非必需,受到的選擇壓力較小,而更易被宿主菌再次重組(圖3C)。對於Vig和Slu種群都重要的框架基因(CAG基因)則在兩個種群中的移動性都極低,且兩群之間沒有差異(圖3D)。

圖3. 基因移動性收到基因功能重要性的影響。來源:Briefings in Bioinformatics

綜上所述,研究者們通過系統性、精確序列定位研究描述了種群內部在物種分化初始階段的基因組重組情況,闡述了基因組重組在物種形成中的核心作用。從基因型和變異出發,遺傳距離是重組率的決定因素。遺傳距離越近的基因組間重組越活躍,而不同種群間的重組率差是促進物種形成的關鍵動力。從表型和功能出發,基因是否被重組受到功能性的選擇,功能越重要的基因重組概率越低,從而保障基因組整體營養代謝和運動等優勢功能的穩定。這些發現系統地回答了重組在細菌進化中的作用,拓展了遺傳學界對於物種形成機制的認知水平。

據悉,於軍團隊20多年前就開始對細菌抗性基因[3]、基因組(中國科學家發表的第一個細菌基因組完成圖[4])、宏基因組[5]和泛基因組[6]研究,並長期從事原核生物基因組結構與變演原理和規律的研究[7],從理論創新到研究工具與方法[8]開發,建樹頗豐。該研究的第一作者康禹副研究員耗時多年的研究成果推翻了人類宏基因組的永久性寄生特徵,提出了環境微生物群落的固化性地域分布。其理論的進一步完善和驗證,以及真正的實用價值有待於新的思考和發揮。比如,這一理論可以解釋中國各種白酒、米酒香型的地域性、固化性,以及中藥植物的道地性,也對於微生物群落的生態研究開闢了新的思路。

參考文獻:

[1] Kang et al. (2020). A fine-scale map of genome-wide recombination in divergent Escherichia coli population. Briefings in Bioinformatics. Bbaa335. 2020. DOI 10.1093/bib/bbaa335.

[2] Kang et al. (2014). Flexibility and symmetry of prokaryotic genome rearrangement reveal lineage-associated core-gene-defined genome organizational frameworks. mBio.;5(6):e01867.

[3] Wang et al. (2014). Heteroresistance at the single-cell level: adapting to antibiotic stress through a population-based strategy and growth-controlled interphenotypic coordination. mBio 5(1):e00942-13. doi:10.1128/mBio.00942-13.

[4] Bao et al. (2002). A complete sequence of Thermoanaerobacter tengcongensis genome. Genome Res 12:689–700.

[5] Jia et al. (2013). The intestinal metagenome of red palm weevil (Rhynchophorus ferrugineus). Envir Microbiol 15(11):3020–3029.

[6] Zhao et al. (2012). PGAP: Pan-Genomes Analysis Pipeline. Bioinformatics. 28: 416–418.

[7] Wu et al. (2014) The quest for a unified view of bacterial land colonization. IMSEJ 8:1358–1369.

[8] Shi et al. (2019). Microfluidic-based enrichment and whole-genome amplification enable strain-level resolution for airway metagenomics. (2019) mSystems. 4 (4) e00198-19; DOI: 10.1128/mSystems.00198-19.

相關焦點

  • 基因敲除大腸桿菌的代謝通量分析-源井生物
    大腸桿菌(又稱大腸埃希氏菌)是革蘭氏陰性,兼性厭氧,棒狀大腸埃希氏菌,通常存在於溫血生物的小腸(吸熱)中。由於實驗室培養的悠久歷史和簡便的操作,基因敲除細胞系大腸桿菌在現代生物工程和工業微生物學中起著重要的作用。 [82] Stanley Norman Cohen和Herbert Boyer在大腸桿菌中的工作,利用質粒和限制酶產生重組DNA,成為生物技術的基礎。
  • 全球首次:科學家創造出人工基因組合成的大腸桿菌
    但實際上,這些密碼子中有一部分發揮著相同的作用。這64個密碼子中,有61個密碼子產生20種天然胺基酸,這些胺基酸可以像串珠一樣串在一起,形成自然界中的任何蛋白質,另外3個密碼子實際上是停止信號。因此,劍橋大學的研究小組著手重新設計大腸桿菌基因組的主要工作,就是去除其中一些「多餘」的密碼子。
  • 挑戰生命基本公式:人工合成實現大腸桿菌全基因組重編碼
    在這項研究中,Jason Chin 團隊通過人工合成、替換的方式,將大腸桿菌全基因組的64個密碼子成功縮減為61個,是目前全基因組水平上最大規模的密碼子重編寫工作。 然後,基於此前 Jason Chin 開發的 REXER 技術 [2],研究者將 BAC 電轉入大腸桿菌細胞,再利用 CRISPR/Cas9 技術將大腸桿菌基因組中的~100kb長的同源序列替換為人工合成的序列模塊。
  • 原核生物的分類介紹
    原核生物指的是無真正細胞核的一類具有細胞結構的生物,它包括細菌(杆狀、球狀、螺旋狀)、放線菌、支原體、衣原體、立克次氏體、螺旋體。
  • 豬偽狂犬病毒gB基因在大腸桿菌中的分段表達
    豬偽狂犬病毒gB基因在大腸桿菌中的分段表達  包新奇 黃紹華 劉巧榮 孫明 楊璐 申屠芬琴 康立平 陳西釗  江蘇省疾病預防控制中心;  徐州市高校獸醫站;  北京世紀元亨動物防疫技術有限公司;  中國動物疫病預防控制中心  偽狂犬(Pseudorabies
  • 高中教材中的「原核生物」
    高考中每年都有涉及原核生物,為了方便同學們在題海訓練中能迅速和相應考題建立條件反射,在此總結高中生物常見的原核生物及考點
  • 大腸桿菌雜交及基因定位實驗
    一、原理大腸桿菌染色體呈環狀。轉移時,靠近轉移起始點的染色體基因進入F-細胞的機率大,重組頻率高,遠離轉移起始點的基因進入F-細胞的機會少,重組率低,與F-細菌基因(選擇性標記基因)已經發生了重組的細菌(重組子),然後在這些重組子中逐個測定其它的Hfr基因(非選擇標記)出現的次數。
  • 轉基因作物的起源及其作用
    轉基因即是基因工程,是指利用DNA重組技術在體外通過人工「剪切」和「拼接」等方法,對各種生物的核酸(基因)進行改造和重新組合,然後導入微生物或真核細胞內進行無性繁殖,使重組基因在細胞內表達,產生出人類需要的基因產物,或者改造、創造新的生物類型。
  • Nature:科學家成功繪製出大腸桿菌的功能性蛋白質組藍圖 有望揭示...
    2020年12月14日 訊 /生物谷BIOON/ --理解基因的工作機理以及其如何與另一個基因之間發生相互作用是從事生物學研究的科學家們想要實現的一個主要目標,當然了,這在方法和所需要的的實驗數量上都能帶來巨大的挑戰,而最近的研究進展已經改變了科學家們繪製基因功能和相互作用圖譜的能力,近日,一篇刊登在國際雜誌Nature上的研究報告中,來自歐洲分子生物學實驗室等機構的研究人員通過研究開發了一種創新性的技術能同時測定成千上萬個基因的活性
  • 真核生物與原核生物
  • DNA重組技術的基本工具(1)
    C.用紫外線照射青黴菌,使其DNA發生改變,通過篩選獲得青黴素高產菌株D.自然界中天然存在的噬菌體自行感染細菌後其DNA整合到細菌DNA上2.科學家把兔子血紅蛋白基因導入大腸桿菌細胞中,在大腸桿菌細胞中合成了兔子的血紅蛋白。
  • 生物進化樹中蛋白質組熱穩定性圖譜
    本篇文章使用基於質譜的蛋白質組學方法系統地描繪了從古細菌到人類共13個物種中48000個蛋白的熱穩定性圖譜,其中涵蓋的變性溫度從30℃到90℃。文章研究發現,蛋白質的序列,組成及大小會影響原核生物的熱穩定性而真核蛋白的無序結構程度與其熱穩定性之間呈非線性關係。
  • 你們真的了解大腸桿菌麼?
    它是實驗室最常用的微生物之一,此外,日常生活中也少不了大腸桿菌的身影,站在廁所深吸一口氣,就能與大腸桿菌進行一場深入腸道的交流。這是一個有關菌株使用的handbook,一整個網頁即包含了全部其搜集到的有關大腸桿菌不同菌株的全部信息,包括各種常用菌株的基因型、來源及一些相關使用場景等,可以從頁面頂部的目錄方便地跳轉到想感興趣的菌株。
  • PNAS:詳細繪製出大腸桿菌DNA突變過程圖譜
    通過分析模式原核生物大腸桿菌在沒有自然選擇性壓力的情況下經過20萬次傳代培養時所發生的精確基因組變化,印第安納大學文理學院生物學系教授Patricia L. Foster和同事們發現大腸桿菌DNA的自發性突變率實際上要比人們之前所認為的低3倍。相關研究結果於近期在線刊登在PNAS期刊上。
  • 真核生物核糖體蛋白基因的轉錄調控
    然而,一個物種中包含有成千上萬的基因,因此構建基因調控網絡難度不言而喻。基於對核糖體蛋白(RP)基因近50年的研究,所以我們就可以通過這些基因更好地來理解和構建調控網絡。 RP基因的早期研究是在大腸肝菌中開始的,RP基因在原核生物中形成操縱子,一些RP蛋白還能夠結合到翻譯成這些蛋白的mRNA上,引起翻譯的終止,在翻譯水平形成一種RP基因的調控反饋網絡。
  • Cell:經過基因改造的大腸桿菌也可通過攝入空氣中的二氧化碳進行生長
    2019年12月29日訊/生物谷BIOON/---在一項新的研究中,來自以色列魏茨曼科學研究所的研究人員對大腸桿菌進行基因改造,使得它們通過吸收二氧化碳就可以生長。比如,增加植物中的碳固定可產生更多的生物量,這可能增加世界的食物供應。Milo說,他的研究團隊著手讓大腸桿菌---「一種極具遺傳可塑性的模式生物」---固定碳,作為邁向可持續工業過程(製造生物燃料)的一步。大腸桿菌通常沒有利用二氧化碳的分子機制,因此這些研究人員根據能夠固定碳的假單孢菌的基因序列,給它導入具有固碳能力的基因。
  • 如何用LB培養基培育出大腸桿菌?
    而在20世紀中葉,有科學家發現,一些特殊的血清型的大腸桿菌對任何動物有致病性,特別是嬰兒和幼禽獸,會對他們造成嚴重的腹瀉和敗血症。但它只是一種普通的原核生物,可分為六種類別。大腸桿菌周生鞭毛長,能運動且無芽孢。同時還能發酵多種糖類產酸、產氣,是很常見的人和動物腸道中的棲居菌類。
  • 「真核」「原核」傻傻分不清楚?
    「真核」「原核」傻傻分不清楚?真核細胞和原核細胞是我們生物學科在教資考試中的一個常考點,據小編的可靠統計,在初中生物學科的近四次考試中考查了兩次,在高中生物學科的近四次考試中考查了三次,既然這部分知識這麼「重要」,那麼一起來學的更透徹一點吧!真核細胞和原核細胞的主要區別:有無以核膜為界限的細胞核。
  • 為何真核生物如此多樣?因為祖先就形色各異-虎嗅網
    而單一的真核生物是無法承擔這樣大的基因組的。一個我們所熟悉的微生物——大腸桿菌,就出現了類似的問題。大腸桿菌是一個被分成許多遺傳菌株的單一物種。如果你從多個大腸桿菌的菌株中提取基因組,很明顯會發現不同的菌株有不同的基因——不僅僅是基因變體的不同,而是不同的細胞株存在或缺失一整套的基因家族。每種細菌都有一個基因組,其中大約包含 4200 到 5600 個基因。
  • 這個大腸桿菌牛在哪裡?
    雖然「基因組改寫」和「人工合成」這樣的名詞在人造生命研究領域已經不算是新鮮說法了,這株人造大腸桿菌還是登上了各國科技媒體的頭條。它到底有什麼特殊之處,能夠稱得上歷史第一呢?通俗地說,研究者們對大腸桿菌的整套DNA中的一些編碼進行了同義替換,然後從頭合成了這套「全新」的基因組,造出了這株叫做Syn61的人造大腸桿菌。