在神奇的轉座子:轉座子的分類一文中,我們簡要介紹了轉座子的分類系統和命名規則。我們已經知道,在生物體中轉座子的多樣性非常高,數量非常大。那麼,在不同的植物基因組中,每種類型的轉座子都是均一分布的嗎?它們的分布有沒有什麼特點呢?
今天我們就以模式植物擬南芥、水稻和玉米為例,介紹一下轉座子在植物基因組中的分布情況。2000年,
Nature發表了一篇題為
Analysis of the genome sequence of the fowering plant Arabidopsis thaliana 的論文,首次公開了擬南芥完整的基因組序列。研究人員對擬南芥基因組進行詳細分析後發現,轉座子至少佔據了整個基因組的
10%,並且基因間 DNA 中約 1/5 都是轉座子。擬南芥基因組中約有
2109個 class I 轉座子,
2203個class II 轉座子,另外還鑑定到
1209個新類型轉座子。
對轉座子的跳躍歷史進行研究後發現,擬南芥基因組中的轉座子傾向於整合到重複序列。不過,雖然擬南芥基因組中轉座子的數量巨大,但是它們大部分都是不表達的,只有約4%的轉座子可以表達。在許多具有較大基因組的植物中,I型轉座子的含量通常會比較豐富。擬南芥的基因組相對較小,I型座子的數量也比較少,並且它們主要集中在
著絲粒附近。相比之下,擬南芥中II型轉座子則主要分布在
中心體周圍。
對轉座子和基因的分布情況分析後發現,轉座子密集區域基因的分布相對較少,重組率較低,並且與之匹配的EST也較少,說明這些區域基因的表達也不活躍。2005年,
Nature 發表了水稻的基因組。水稻中轉座子序列至少佔據了整個基因組的35%,並且水稻基因組中幾乎含有所有已知的轉座子家族。具體分析後發現,水稻8號染色體和12號染色體的轉座子含量最高,分別為38.0%和38.3%;1號、2號以及3號染色體的轉座子含量相對較低,分別為31.0%、29.8%和29.0%。水稻基因組中II型轉座子的含量較多,約是I型轉座子的兩倍。但是,I型轉座子的核苷酸數量要遠遠大於II型轉座子,因為I型轉座子通常比較大,而II型轉座子一般都較小。水稻中I型轉座子主要集中在基因稀少的區域和異染色質區域,比如著絲粒和中心體附近;不過,仍有一些I型轉座子和II型轉座子分布在基因密集和重組率較高的染色體區域。
總體來看,水稻轉座子的分布和轉座子的大小有一定的相關性:較小的轉座子主要分布在基因相對密集以及重組率高的區域,而較大的轉座子則集中在著絲粒和中心體附近。2009年,玉米的基因組也在
Science上公布。由於轉座子最早是在玉米中發現的,許多轉座子家族也都是首先在玉米中鑑定到的,因此玉米中轉座子的含量及分布規律自然更加吸引人們的注意。
讓人們吃驚的是,轉座子這種一度被認為是「垃圾DNA」的物質,竟然佔據了玉米基因組的近85%。和擬南芥以及水稻不同,玉米中許多轉座子都分布在基因密集以及染色體重組率較高的染色體末端區域,這暗示著玉米中轉座子在調控基因功能方面可能非常活躍。我們在神奇的轉座子:轉座子的分類一文中提到過Helitrons,它是一類通過特殊的滾環方式進行轉座的轉座子,在植物、動物以及真菌中都有分布。不過,
在玉米基因組中,這類轉座子的含量非常豐富,活性極高,變異也非常多樣。玉米基因組中含有8個Helitrons家族,所有成員的拷貝數加起來約為20000個,並且主要分布在基因密集區域。而在許多其他的動物和植物基因組中,Helitrons都主要分布在基因稀少的區域。這也說明了,玉米基因組中轉座子廣泛參與了基因的調控。
從本文中列舉的三種模式生物中轉座子的含量和分布情況,我們可以發現,隨著基因組的擴增,轉座子的含量和豐富性也隨之逐漸增加。而轉座子的分布也隨之從基因稀少的著絲粒以及中心體附近向基因密集區轉移,這暗示著轉座子在基因組的擴張和大基因組生物的基因調控方面起到了非常重要的作用。
參考文獻:
【1】Arabidopsis Genome Initiative. (2000). Analysis of the genome sequence of the flowering plant Arabidopsis thaliana. nature, 408(6814), 796.
【2】Sasaki, T. (2005). The map-based sequence of the rice genome. Nature, 436(7052), 793.
【3】Schnable, P. S., Ware, D., Fulton, R. S., Stein, J. C., Wei, F., Pasternak, S., ... & Minx, P. (2009). The B73 maize genome: complexity, diversity, and dynamics. Science, 326(5956), 1112-1115.