茶起源於中國,盛行於世界,尤其是今年首個「國際茶日」的設立,更是體現了國際社會對茶葉價值的高度認可及重視。茶樹(Camellia sinensis (L.) O. Kuntze)作為一種重要經濟作物,具有基因組大、雜合度高、物種多樣性強等特點。然而受限於茶樹基因組組裝水平,群體遺傳特徵和分子育種等相關研究有待進一步深入開展。
9月7日,Nature Communications在線發表了由中國農業科學院茶葉研究所和中國農業科學院深圳農業基因組研究所等單位聯合完成的題為Population sequencing enhances understanding of tea plant evolution的研究論文。研究人員基於組裝獲得的中國茶(Camellia sinensis var. sinensis)&39;品種染色體級別的高質量參考基因組,進一步對全球139個茶樹品種進行基因組重測序,從而探究了茶樹種質資源的進化和系統發育關係。該研究成果為茶樹基因組學研究和分子育種提供了重要遺傳資源,為深入開展茶樹遺傳和進化等研究奠定了基礎。在該研究中,安諾基因承擔了Hi-C輔助基因組組裝相關工作。
主要研究內容
1. 高質量的染色體級別參考基因組組裝
該研究以我國著名的茶樹栽培品種「龍井43」(LJ43)為實驗材料,通過PacBio三代測序結合Hi-C染色體掛載技術組裝獲得了大小為3.26 Gb的茶樹高質量參考基因組(LJ43):包含37,600條contigs,其中7,071條contigs成功掛載到15條染色體上(圖1),scaffold N50 144 Mb,具有較高的連續性;二代短reads比對參考基因組評估其基因組覆蓋度高達98.19%;BUSCO評估達到88.36%,其明顯高於已發表的SCZ 和YK10。其次,研究人員利用Bionano光學圖譜與10x Genomics等技術進一步驗證了組裝的LJ43參考基因組在單鹼基水平和scaffold水平都達到了較高的準確性。
圖1 茶樹LJ43染色體水平基因組組裝結果
基因組注釋結果表明,茶樹LJ43基因組中重複序列比例高達80.06%,其中LTR佔60.77%;結合轉錄組數據,最終預測所得蛋白編碼基因數目為33,556。
2. 基因家族進化分析
利用OrthoMCL軟體分析,總計獲得24,350個同源基因家族(綜合9個基因組),隨後利用其中1,034個單拷貝基因集構建了茶樹的系統發育進化樹,以Amborella trichopoda作為外群。利用CAFE進行基因家族進化分析,研究發現共有1,936個和1,510個茶樹基因家族分別經歷了擴張和收縮。基於GO、IPR、KEGG功能富集分析,結果表明茶樹基因組中發生擴張的基因家族主要與抗病、次級代謝以及生長發育相關,其中包括與萜烯類代謝相關的葡萄糖苷酸轉移酶/葡糖基轉移酶基因;NB-ARC、Bet v I、 RPM1以及RPS2等抗病性相關基因;與茶樹自交不親和相關的S位點糖蛋白結構域。正向選擇分析結果表明74個基因家族發生了正向選擇,其中包含一些與抗病性、耐寒性增強和高光耐受性有關的基因。
3. 茶樹全基因組複製及基因組分化
為了探究茶樹中所發生的全基因組複製事件,研究人員分別從SCZ,LJ43和 YK10基因組中選擇了3,373、3,199和2,992個基因家族(包含兩個旁系同源基因)進行Ks值分析。結果表明,以上3個茶樹品種基因組的Ks峰值均為0.3,大約在25 mya發生了全基因組複製,由此表明SCZ,LJ43和 YK10這三個茶樹品種經歷了相同的全基因組複製事件,進一步分析表明LJ43和SCZ的分化時間比LJ43和YK10晚。
4. 群體結構遺傳分析
大多數栽培茶樹屬於山茶科,山茶屬,主要歸為兩大類:小葉茶變種(CSS;又稱中國茶變種)和大葉茶變種(CSA;又稱阿薩姆)。此外,C. sinensis-related species(CSR)代表系統發育進化樹中與外群油茶(Camellia Sasanqua)接近的茶樹種質材料。為了探究不同茶樹種質資源間產生差異的遺傳基礎,在該研究中,研究人員對來自世界不同國家和地區的139份有代表性的茶樹材料進行了深度重測序,並以LJ43作為參考基因組,鑑定得到2.1887億個SNP。結合系統發育分析和PCA分析,進一步揭示了在茶樹栽培的擴大和馴化過程中,栽培茶與野生近緣雜交,造成了目前茶樹種群遺傳的複雜性以及廣泛的基因流動,且通過個體和群體水平的雜合度分析,研究表明CSR的雜合度顯著高於CSA和CSS;研究結果還表明CSR群體是CSS和CSA的祖先,但該結論仍需要進一步研究確定。
5. CSS和CSA群體馴化過程中的差異比較
通常認為,CSS茶和CSA茶的區別主要在於它們的風味、樹葉類型、耐寒性和加工適宜性。為了進一步揭示其遺傳差異的基礎,結合群體遺傳和轉錄組學分析,研究人員首先利用SweepFinder2軟體對CSS和CSA這兩個茶樹種群進行了受選擇基因分析,進一步結合GO富集分析,研究發現CSS和CSA在馴化過程中的選擇方向存在差異:CSS在馴化過程中與風味相關的萜烯類代謝基因受到的選擇明顯強於CSA(圖2b),且不同茶樹組織中,80%與風味相關的萜烯類代謝基因在芽和葉中呈現出相對較高的表達(圖2c),基於此,研究人員根據CSA和CSS的加工適宜性和兩個群體的群體選擇分析,得出了綠茶和烏龍茶香氣與萜類代謝的關係比紅茶與萜類代謝的關係更密切的結論;其次,研究結果還表明CSS在馴化過程中與抗病性相關基因受到的選擇也明顯強於CSA,且在這些抗病性基因中,69%的NB-ARC基因在春季、秋季或冬季高表達(圖2d),結合基因家族擴張結果,研究人員推測NB-ARC基因可能在賦予CSS品種抗寒性方面發揮了重要作用。
圖2 CSS和CSA群體馴化過程中的差異比較
文章小結
該研究獲得了一個染色體級別的高質量茶葉參考基因組,並對從世界各地收集的139份茶樹材料進行了重測序,揭示了茶樹的系統發育進化關係以及茶樹進化的歷史,且進一步闡明了茶樹群體遺傳的複雜性與兩個主要茶樹品種(CSS和CSA)之間的差異選擇方向。該研究為茶樹標記輔助育種提供了寶貴的基因組資源,為進一步研究茶樹遺傳和進化奠定了基礎。
參考文獻:
Xinchao W, Hu Feng , Yuxiao C, et al. Population sequencing enhances understanding of tea plant evolution[J]. Nature Communications, 2020, doi: 10.1038/s41467-020-18228-8