Hope everybody can study well and make progress every day!
Phylogenomic Insights into Deep Phylogeny of Angiosperms Based on Broad Nuclear Gene Sampling
First author: Lingxiao Yang; Affiliations: Nanjing Normal University (南京師範大學): Nanjing, China
Corresponding author: Bojian Zhong
Angiosperms (flowering plants) are the most diverse and species-rich group of plants. The vast majority (∼99.95%) of angiosperms form a clade called Mesangiospermae, which is subdivided into five major groups: eudicots, monocots, magnoliids, Chloranthales, and Ceratophyllales. The relationships among these Mesangiospermae groups have been the subject of long debate. In this study, we assembled a phylogenomic dataset of 1594 genes from 151 angiosperm taxa, including representatives of all five lineages, to investigate the phylogeny of major angiosperm lineages under both coalescent- and concatenation-based methods. We dissected the phylogenetic signal and found that more than half of the genes lack phylogenetic information for the backbone of angiosperm phylogeny. We further removed the genes with weak phylogenetic signal and showed that eudicots, Ceratophyllales, and Chloranthales form a clade, with magnoliids and monocots being the next successive sister lineages. Similar frequencies of gene tree conflict are suggestive of incomplete lineage sorting along the backbone of the angiosperm phylogeny. Our analyses suggest that a fully bifurcating species tree may not be the best way to represent the early radiation of angiosperms. Meanwhile, we inferred that the crown-group angiosperms originated approximately between 255.1 and 222.2 million years ago, and Mesangiospermae diversified into the five extant groups in a short time span (∼27 million years) at the Early to Late Jurassic.
被子植物,又稱有花植物,是植物中物種多樣性最豐富的類群。絕大部分現存的被子植物形成單系類群稱為核心被子植物(Mesangiospermae),該單系群中包含五大主要類群:真雙子葉植物(eudicots)、單子葉植物(monocots)、木蘭類植物(magnoliids)、金粟蘭目(Chloranthales)以及金魚藻目(Ceratophyllales)。這五大類群之間的系統發育關係長期是爭論的熱點。本文中,作者選擇151個被子植物五大類群的代表性物種並篩選1594個基因,通過溯祖法和串聯法來構建被子植物早期分化類群的系統發育關係。作者首先對這1594個基因進行了系統發育信號檢測,結果發現超過一半的基因缺少被子植物系統發育主幹上的發育信號。移除了這些發育信號「貧瘠」的基因後,進一步的系統發育分析發現真雙子葉、金魚藻目以及金粟蘭目聚為一個進化枝,然後依次是木蘭類植物與單子葉植物。相似的基因樹拓撲結構衝突頻率說明在被子植物核心類群分化過程中發生了不完全譜系分選。作者認為二叉系統發育樹可能無法展示真實的被子植物早期輻射。同時,作者推斷了被子植物大約起源於距今255.1到222.2個百萬年前,而核心被子植物在早侏羅紀到晚侏羅紀間的某個時期短短27個百萬年迅速分化形成了如今的五大類群。
An abbreviated tree showing the relationship of the five lineages of Mesangiospermae with associated support values (PP/MLBS).
1594個OGs鑑定方法簡介
本文作者通過151個被子植物,包括98個真雙子葉植物、24個單子葉植物、19個木蘭類植物、4個金粟蘭目植物和2個金魚藻目植物,輔以2個裸子植物作為外群,深入解析了核心被子植物五大類群之間的系統發育關係。作者通過Deep Metazoan Phylogeny website(http://www. deep-phylogeny.org/hamstr/)獲得了4180個可能的直系同源基因(putative orthologous genes;pOGs),利用Hmmer在153個被子植物物種搜尋出上述4180個pOGs的序列,通過初步的篩選(去掉核酸序列小於600 nt和物種覆蓋度小於50%的基因)獲得了2435個pOGs。為了去掉可能的旁系同源基因,本文進行了一系列的篩選。首先利用RAxML構建2435 pOGs的基因樹,基於溯祖法利用ASTRAL軟體推斷物種樹;該物種樹的系統發育框架與已有研究結果一致,因此將其作為參考物種樹並利用RAxML重新估算枝長。接著作者計算了基於參考拓撲結構下每個pOG單基因樹的枝長,如果單基因樹的枝長高於參考物種樹對應分枝枝長的5倍,則刪除該基因中對應物種的序列(也就是刪除某個基因中某物種的序列,認為在該物種中該基因不是直系同源基因)。最後,作者計算了基於參考拓撲結構下每個單基因樹的枝長與參考樹枝長的皮爾森相關係數r,移除r值異常的基因(即箱線圖裡面的最小和最大觀測值範圍以外的數),認為這些基因是假的直系同源基因。另外,作者還比較了不限制拓撲結構的單基因樹與參考物種樹的枝長,如果單基因樹的枝長高於參考物種樹對應枝長的5倍,則刪除。最後,對處理後的pOGs重新比對和修剪,並刪除核酸序列小於600nt和物種覆蓋度低於70%的pOG。考慮到金粟蘭目和金魚藻目的物種採樣稀少(共6個),所以額外的篩選條件是pOG中必需含有所有這6個物種的序列,共獲得了1696個直系同源基因(orthologous gene; OG)。接著,作者計算了每個ML基因樹的ABS值(average bootstrap support;doi: 10.1038/nature12130)和TCA得分(Tree Certainty all;doi: 10.1093/molbev/msu061),然後選擇了ABS大於等於50%和TCA大於0.3的OGs,最終作者篩選出1594個OGs構建被子植物的系統發育樹。
通訊:鍾伯堅 (http://sky.njnu.edu.cn/cn/shiziduiwu/zhong-bo-jian)
個人簡介:2003-2007年,中國地質大學,學士;2007-2010年,復旦大學,碩士;2010-2014年,紐西蘭梅西大學,博士。
研究方向:植物系統發育基因組學;植物多樣性與適應性進化;植物光信號通路的分子演化。
doi: https://doi.org/10.1016/j.xplc.2020.100027
Journal: Plant Communications
Published date: January 29, 2020
p.s. (我起的初稿,鍾老師進行了細緻的修改和最終的定稿)