我有四倍體咖啡,你有科學故事嗎?(全長轉錄組文獻解讀-Gigascience)

2021-01-16 希望組科技服務


多倍體化事件增加了基因組的複雜性,幫助克服極端環境,是推動植物進化的主要動力,在物種的演化過程中起了舉足輕重的作用。然而多倍體物種的轉錄組分析,長久以來受限於二代測序讀長偏短,不僅無法準確重構轉錄本,更無力探究各亞基因組間的isoform結構差異及基因如何選擇性保留。

 

自PacBio全長轉錄組測序不斷普及,以及高粱和玉米兩篇全長轉錄組文獻高調亮相Nature Communications引起廣泛關注,研究人員開始嘗試將這種新技術應用到多倍體物種的轉錄組研究中,以下是幾篇多倍體物種PacBio SMRT 全長轉錄組文獻統計,供大家參考,下載地址請點擊文末「閱讀原文」。  

【 四倍體棉花[2]的文章為未來組項目經驗,文獻解讀請戳戳~】

本次為大家解讀四倍體阿拉比卡種小粒咖啡(2n=4x=44)全長轉錄組文獻[3],感受「全長轉錄組測序讓多倍體物種isoform重構和亞基因組phasing不再是難題」。

阿拉比卡種小粒咖啡(Coffea arabica)為世界上最為廣泛種植的咖啡品種,是由C.canephora和C.eugenioides雜交並基因組加倍形成的異源四倍體,其兩個祖先種在味道、咖啡因含量、生存環境等方面有著顯著的差別。C. arabica雖風味口感優質但對種植環境要求高、抗病蟲害能力較弱,因此研究亞基因組基因表達調控,利於培育不僅美味而且更易種植的品種。





隨機選取Coffea arabica var. K7品系的不同植株,不同部位,不同發育階段共計450 個果實。經樣本前處理、RNA提取,反轉成cDNA後,根據PacBio Iso-Seq protocol,分片段構建Pacbio RSⅡ文庫並測序。(目前新一代PacBio Sequel測序儀可構建不篩分片段的轉錄組文庫,更接近真實地還原物種轉錄本片段分布情況)


通過轉錄組注釋、同源基因比對、候選基因篩選等一系列生物信息分析,篩選出與咖啡因、蔗糖合成相關的基因的isoforms,並與相關資料庫比對。



 咖啡因合成途徑中isoform多樣性


咖啡因的合成途徑前期已有廣泛的研究,已有比較完善的資料庫提供候選基因和編碼序列信息(轉錄組和基因組數據都有),在這篇四倍體小粒咖啡的論文中,研究人員找到了10個可能與咖啡因合成相關基因的高質量isoforms,並且發現這些isoforms都發生了5'非翻譯區延伸。


Table1 咖啡因合成途徑相關候選基因注釋,isoforms及5'非翻譯區延伸情況


這10個isoforms中,有9個比基因組DNA序列長,而有一個isoform可能因為發生了可變聚腺苷酸化(APA)而短於基因組DNA序列(Fig.2 c),在3『UTR檢測到2個潛在的APA信號(Fig.2 d)。


Fig.2 一個isoform(c25904/f2p0/977)可能因APA事件而短於基因組DNA序列


這些咖啡因合成相關的基因也存在可變剪切現象(AS),以下為DXMT2基因內含子保留AS示例(Fig.3)。


Fig.3 DXMT2基因內含子保留AS示例


異源四倍體小粒咖啡轉錄組的isoforms表現出較明顯不同的亞基因組來源,通過與已發表的祖先種之一C. canephora的轉錄組數據進行比對,XMT1、MXMT1、DXMT2基因的isoforms與C. canephora的isoforms有較好的一致關係,表示這些isoforms可能來源於C. canephora亞基因組;相反,XMT2、MXMT2、DXMT1與C. canephora的isoforms比對率不高,表明他們可能來源於另一個C.eugenioides亞基因組。


通過重構isoform初探複雜多倍體亞基因組的基因表達


通過PacBio 全長轉錄組測序,可準確地重構小粒咖啡的轉錄本信息,以蔗糖合成途徑中非常重要的基因SS1為例,研究人員發現了9個轉錄本異構體,包括替換、缺失、內含子保留等多種可變剪接形式。


Fig.4 蔗糖合成相關基因SS1多種可變剪接形式


隨後,同樣通過與祖先種之一C. canephora的轉錄組數據進行比對,分析比對率和相同的核苷酸變異(Fig.5),以此推斷單個isoform來源於哪個亞基因組。例如Fig.5中第1行(標黃)為祖先種之一C. canephora SS1基因序列,將小粒咖啡的多個isoforms的一致性序列與其進行比對,第2-5行的isoforms與C. canephora表現出高度的一致性,並共同在3,726 bp處有一個A-G的鹼基替換,與第6-10行相比,在3,707bp、3,733bp處有著同樣的inset、在3,713bp、3,715bp處有著同樣的鹼基替換,以此將isoforms的來源區分開。


 Fig.5 SS1基因多個isoforms一致性序列中的鹼基變異比較


第二個有力的證據是,第6-10行的isoforms與C. canephora相比較,在內含子10區域,有著更高的變異。


另外還可以通過等位基因加以佐證。


可變剪接、可變聚腺苷酸化、5』UTR延伸、亞基因組拷貝數這些因素的綜合作用,形成了轉錄本的多樣性,本文以咖啡和蔗糖合成途徑相關基因為例,以PacBio SMRT長讀長測序為技術手段,完成四倍體小粒咖啡 isoforms重構和亞基因組複雜、多樣的基因表達研究,為其它多倍體物種基因表達調控研究提供參考。


未來組憑藉率先引進PacBio Sequel平臺的優勢,已完成十餘個多倍體動植物轉錄組測序分析,在多倍體物種isoforms重構和亞基因組phasing方面經驗豐富,如需要詳細了解,請垂詢當地科技顧問或在後臺留言。



引用文獻

[1]Clavijo B J, Venturini L, Schudoma C, et al. An improved assembly and annotation of the allohexaploid wheat genome identifies complete families of agronomic genes and provides genomic evidence for chromosomal translocations[J]. Genome research, 2017, 27(5): 885-896.

[2]Wang M, Wang P, Liang F, et al. A global survey of alternative splicing in allopolyploid cotton: landscape, complexity and regulation[J]. New Phytologist, 2017.

[3]Cheng B, Furtado A, Henry R J. Long-read sequencing of the coffee bean transcriptome reveals the diversity of full-length transcripts[J]. GigaScience, 2017.

[4]Hoang N V, Furtado A, Mason P J, et al. A survey of the complex transcriptome from the highly polyploid sugarcane genome using full-length isoform sequencing and de novo assembly from short read sequencing[J]. BMC genomics, 2017, 18(1): 395.

[5]Luo Y, Ding N, Shi X, et al. Generation And Comparative Analysis Of Full-Length Transcriptomes In Sweetpotato And Its Putative Ancestor[J]. bioRxiv, 2017: 112425.



文案:李贇

編輯:張芳芳

圖片來源於網絡|侵刪




想了解三代測序技術?

想解決困惑許久的難題?

想跟各個大牛們談情說「事」?

來這裡,一個最純的技術交流區!



武漢未來組生物科技有限公司(Nextomics Biosciences)成立於2011年8月8日,總部位於武漢光谷生物城,目前在北京生命科學園和美國紐約設立有分支機構,是世界領先三代測序基因組中心。

未來組通過三代測序生物信息學工具和流程的開發,解決了複雜基因組組裝、微生物完成圖組裝、全長轉錄組分析、人類基因組變異檢測等領域的技術瓶頸,推動了基因組學研究的升級換代,目前已經完成數百個三代測序科研項目,發表了多篇三代測序的科學文獻。因為專注於三代測序技術開發和應用推廣,未來組已成為三代測序技術應用的第一品牌。





相關焦點

  • 你轉發的四倍體錦鯉還好嗎?NC首次鑑定出異源四倍體魚類的祖先二倍體並成功進行亞基因組拆分
    藉此,我們成功將異源四倍體鯉的基因組拆分為兩套來自祖先二倍體的亞基因組,各由25條染色體組成,分別命名為A亞基因組和B亞基因組。由此可見,十分有必要對異源四倍體鯉亞基因組基因含量、基因表達模式及表觀調控等進行綜合分析,以更好理解基因組合併(genome merging)後異源四倍體基因組的演化。
  • 希望組正式推出納米孔單細胞全長轉錄組測序分析服務
    作為國內三代測序服務的引領者,希望組在三代測序技術領域深耕多年,將長讀長與單細胞測序技術結合,開發出了完整的納米孔單細胞全長轉錄組實驗分析流程,打破用三代測序單細胞全長轉錄組建庫起始量高的技術壁壘,並於近日正式推出納米孔單細胞全長轉錄組測序分析服務。
  • 轉錄組研究新利器:ONT直接RNA測序,鹼基修飾、轉錄異構體一網打盡!
    在短讀長cDNA測序中有很大比例的讀長定位模糊,這種局限在正確識別和定量基因的多種異構體表達上尤為明顯。長讀長cDNA測序方法能夠產生跨越整個異構體的全長轉錄本序列,從而去除或大幅度減少模糊定位,並改進差異異構表達的分析結果。然而,以上方法依賴於cDNA的合成及PCR擴增,去除了天然RNA的鹼基修飾信息,並且只能粗略地估計多聚腺苷酸(poly(A))尾長。
  • 2018年第三季度全長轉錄組文章集錦
    文章名稱:Full-length RNA sequencing reveals unique transcriptome composition in bermudagrass中文名稱:全長RNA測序揭示狗牙根獨特的轉錄組組成發表期刊:
  • 徐鵬報告詳細解讀:鯉魚異源四倍體起源及基因組進化
    藉此,我們成功將異源四倍體鯉的基因組拆分為兩套來自祖先二倍體的亞基因組,各由25條染色體組成,分別命名為A亞基因組和B亞基因組。由此可見,十分有必要對異源四倍體鯉亞基因組基因含量、基因表達模式及表觀調控等進行綜合分析,以更好理解基因組合併(genome merging)後異源四倍體基因組的演化。
  • 華中農大繪製出兩個棉花四倍體栽培種的參考基因組
    該論文介紹了整合多種方法組裝得到的異源四倍體栽培種陸地棉和海島棉的參考基因組序列,為棉花基因組進化和功能基因研究提供了重要參考,對基於基因組的棉花遺傳改良具有重要指導作用。棉花共有四個栽培種,兩個二倍體栽培種生產上已不再使用,生產上主要使用的是兩個四倍體栽培種,陸地棉和海島棉。
  • 探索爪蟾異源四倍體基因組演化之旅
    非洲爪蟾 ( Xenopus laevis ) 是脊椎動物細胞和發育生物學研究中的重要模式生物,它是一種古四倍體
  • 這個方法或許能拯救你的轉錄組
    如果你想到這方面,說明你跟我一樣,開始步入U秀的行列了,目前國際上還真的有這種標準品,叫ERCC Spike-In,它目前是被用到表達譜晶片上,用來校正基因的表達。在高通量測序上,目前是被用來評價實驗的一致性。那麼為什麼很少聽到有人用它來校正基因的表達呢?主要是因為要用它來作為內參,它就必須是非常精確的標準品,每mL的水裡,要有多少個外參序列,都是非常研格限制的,所以這個標準品很貴。
  • 華大組裝完成人類二倍體基因組序列
    華大組裝完成人類二倍體基因組序列  5月26日,華大基因研究人員首次基於新一代測序技術,開發策略和方法組裝出迄今最完整的單倍體水平的二倍體基因組序列,為從頭組裝雜合度高的基因組奠定了基礎。該最新研究成果發表於《自然生物技術》。  人類基因組是二倍體,完整了解每個染色單體的變異對基因組信息的解讀具有重要意義。
  • 葡萄二倍體、三倍體、四倍體都是什麼意思?
    2019首屆果園減肥增效高峰論壇及新型農資廠商見面會二倍體歐美種葡萄(陽光玫瑰)二倍體歐亞種葡萄(紅地球葡萄)三倍體無核葡萄品種(夏黑、早夏)四倍體歐美種葡萄(巨峰、巨玫瑰等)葡萄染色體倍性,正常一組是二倍體,二組是四倍體,三組是六倍體,倍數越大,果粒越大,也不一定。
  • 轉錄組做得不過癮?帶你走進翻譯組的神奇世界
    隨著高通量測序技術的發展,轉錄組測序已走入科研「尋常百姓家」,每個實驗室大概都有師兄師姐曾測過十個八個的轉錄組吧。但是,看遍了千篇一律的差異基因聚類圖,是不是想換點新花樣?面對日益競爭的科研壓力,是否應該為課題研究找到新的方向和切入點?承啟生物給各位看官呈上一份翻譯組的盛宴,讓大家對翻譯調控這一「調控之王」有一定的了解。
  • 迄今最完整的人類單倍體水平的二倍體基因組序列
    2015年5月26日,華大基因研究人員首次基於新一代測序技術,開發策略和方法組裝出迄今最完整的單倍體水平的二倍體基因組序列,為從頭組裝雜合度高的基因組奠定了基礎。在本研究中,研究人員在不使用參考基因組序列的前提下,僅憑藉新一代測序(NGS),通過全基因組鳥槍測序法(WGS)結合Fosmid-pooling策略的分級組裝方法,組裝出人類單倍體水平的二倍體基因組。研究人員通過所開發的方法對之前已完成的第一個亞洲人基因組 YH 1號進行重新測序,組裝出5.15Gb的二倍體基因組序列,其單體型N50長度達到484 kb。
  • 鏈特異性文庫 VS 普通轉錄組文庫
    轉錄組產品中,mRNA文庫構建的方式有兩種,分別是普通轉錄組文庫和鏈特異性文庫。客戶在選擇建庫類型時,會有以下疑問:什麼鏈特異性文庫?鏈特異性文庫和普通轉錄組文庫有什麼區別?鏈特異性文庫會給我的項目帶來哪些有用的結果?
  • IF10+發文攻略——轉錄組+ATAC
    隨著二代測序的發展,轉錄組測序已經成為大眾式的工具型技術。無論是做哪方面研究,只要涉及基因方面,均可以結合轉錄組測序分析篩選目標基因,因此轉錄組相關的文章在逐年增多。但是轉錄組主導的組學文章分數則越發越低,影響因子普遍在2-3分。
  • 華中農大發布異源四倍體棉最新基因組—新聞—科學網
    該研究利用三代測序組裝技術、Hi-C染色體掛載技術以及光學圖譜完成了異源四倍體棉基因組從二代向三代的升級。與二代異源四倍體棉基因組相比,最新的三代基因組在連續性以及高度重複區的完整性方面都有極大的改進。 據介紹,棉花是一種重要的經濟作物,是世界上重要的天然紡織纖維來源,在國民經濟中佔據著重要地位。目前,生產上主要棉花栽培種為異源四倍體棉,超過90%的纖維產量來自四倍體棉。
  • 北京生科院提出環形RNA全長轉錄本重建和定量新方法
    1月19日,國際學術期刊Genome Medicine 在線發表了中國科學院北京生命科學研究院計算基因組學實驗室趙方慶團隊題為該研究為環形RNA組成和功能研究提供了新視角,呈現了環形轉錄本更加細緻的內部結構,並實現了轉錄本水平的精確定量,為後續篩選有潛在功能的環形RNA分子提供了重要方法學工具。
  • 文獻解讀 | 轉錄延伸調節pRNA生成位點的一個子集
    儘管對轉錄後處理過程進行了大量的研究,但用於哺乳動物pRNA生物發生的染色質調節因子仍有很大一部分未被探索。轉錄組分析、染色質可及性和RNA聚合酶II的佔據情況表明,BTBD 18通過促進轉錄伸長促進粗線型piRNA前體的表達。
  • 喝咖啡對孩子的成長有影響嗎?
    在中國喝咖啡的文化歷程是比較短的,喝咖啡的人群也只是在青年和中年人之間,基本不會涉及到未成年人。然而在國外長大的小朋友,可能他們的父母在其小時候就會告訴說:「不要喝咖啡,會讓你長不高的。」這就引發一個問題,喝咖啡真的和生長發育有關係嗎?這篇文章BTB咖豆豆帶您一起探個究竟。
  • 利用納米孔測序研究人體組織樣本等位基因效應對轉錄組結構的影響
    相比之下,長讀長測序可以捕獲到全長轉錄本和異構體,這可以使定量過程像讀長序列計數一樣簡單。將該流程在全基因組範圍應用於所有樣本,揭示出跨越4217個基因的11000多個ASE(特異性表達)事件,以及跨越187個基因的350個ASTS(特異性轉錄本結構事件)事件。
  • 文獻解讀|LncRNA經典研究思路
    來和小喵一起看看文獻吧!第三部分描述了INcRNA如何經歷差異的異構體表達,這是共同調控的。在激活轉錄過程中,INcRNA可以進行差異剪接,也可以利用炎症刺激後新的轉錄起始位點,如脂多糖(LPS)。INcRNA的轉錄後調控分為三個部分:IV、V和VI。轉錄完成後,一個INcRNA可以經歷幾個過程。