給你的轉錄組分析加點料!文章升華利器!

2021-02-06 植物科學最前沿

之前給大家推薦了植物基因家族的分析思路,反響很好,今天還是用文章解讀的方式來剖析轉錄組高階分析思路,希望對大家有所幫助。

隨著轉錄組千元時代的到來,一方面我們可以大膽的去測有價值的樣品而不用擔心成本過高,另一方面審稿專家對相關文章的要求也水漲船高

想靠著差異基因富集、基因性狀關聯、qPCR驗證這三板斧發好的期刊,難度越來越大了。其實轉錄組數據裡還有很多值得深挖的信息,下面我們就用兩篇發表在《Journal of Experimental Botany》和《The Plant Journal》上的文章來探討下如何通過高階的分析手段來提高文章檔次(文末提供分析方法教學)。

文章1:

題目:Identification of regulatory networks and hub genes controlling soybean seed set and size using RNA sequencing analysis
期刊:Journal of Experimental Botany(IF:5.3)
關注性狀:大豆籽粒大小

實驗材料

大豆籽粒的大小是一個非常重要的農藝性狀,直接關係到大豆產量,找到決定大豆籽粒大小的關鍵調控基因對後續的分子育種具有重要意義。

該文作者選取了2個大豆品種做轉錄組測序,分別是:大籽粒Wandou 28 (V1),小籽粒Peixian Layanghuang (V2);3個取樣時期分別為:seed set (S1), seed growth (S2), and early seed maturation (S3);其中前兩個時期的取樣部位分別為:Seed pod with whole seed(S1),Whole seed(S2),S3時期取了兩個部位分別為:Seed coat(S3-1),Seed cotyledon(S3-2),每個樣品3個生物學重複共24個樣品。下圖為種子發育不同時期照片以及籽粒大小差異統計結果:



轉錄組常規分析結果:

① 整體表達情況描述:

對每個基因做表達定量,過濾極低表達的基因,統計每個時期不同品種基因表達量高低的分布圖,大約一半的基因處於低表達水平0.5<=FPKM<=5(下圖A)。

PCA分析發現樣品按照不同發育時期聚類在一起,而不是按照不同品種聚類,說明發育時期是決定基因表達譜的關鍵因素,而性狀的不同引起的轉錄表達差異較小(下圖B)。
下圖C展示的為不同品種,不同發育時期之間表達基因的韋恩圖,表明在不同的發育時期都表達的基因還是佔絕大多數:



② 總體差異基因分析:

差異基因分析方面,下圖A按相同發育時期,不同的品種之間比較,下圖B為不同發育時期之間的比較,紅色數字代表上調差異基因數量,黑色代表下調的差異基因數量。



差異基因功能注釋分析,主要針對決定籽粒大小的差異基因,也就是上圖A中的差異基因進行功能分析,挑出一些代表性基因,看一下他的功能和表達量。

例如,V1S1  vs V2S1差異比較當中,共找到973個差異基因(489個上調,484個下調),其中上調基因的功能及表達量表格如下圖所示,其中有轉錄因子,植物荷爾蒙(生長素等),脂肪酸代謝,蛋白激酶活性,類黃酮生物合成等功能相關的基因。總之挑選與種子果實等發育生長相關的基因來展示,其他還有好幾個類似表格,也是關於上圖A中不同時期的上調下調基因的功能注釋表格,這裡就不一一展示了,想詳細了解的可以查看原文。

③ 不同發育時期差異比較:

分別繪製每個發育時期高表達基因的熱圖,差異基因很多,作者從中挑選了和發育相關,或者和重要農藝性狀相關的差異基因做熱圖。例如轉錄因子相關的基因,荷爾蒙相關的,脂肪酸代謝,澱粉糖代謝等相關的基因。

WGCNA分析找關鍵hub基因:

截止到上面都還是轉錄組常用的分析手段,接下來作者使用了WGCNA(加權基因共表達網絡)分析方法對數據進行了深入挖掘,並成功找到了幾個與籽粒大小相關的關鍵候選基因,成為了本文的亮點,接下來我們看看具體是怎麼做的。

首先對所有樣品所有基因的表達量矩陣進行過濾,刪除表達量低的基因(FPKM<0.05),得到7359個基因用於基因共表達網絡構建。經過分析得到12個共表達基因模塊(見下圖A,聚類樹每一個枝代表一個基因,下面不同的顏色劃分代表基因所處不同的模塊),其中有4個模塊和種子大小相關(見下圖B)。例如lightyellow模塊,所有的V1不同時期的樣品與這個模塊高度相關,再如green模塊,有793個基因,不管是V1樣品,還是V2樣品,這個模塊都與S1相關等等。



導出WGCNA共表達網絡分析結果,繪製4個重要模塊當中基因的表達量熱圖和網絡圖,左邊熱圖從上到下分別代表:green module(A),darkturquoise module(C),black module(E),lightyellow module(G),右邊網絡圖分別對應共表達網絡,其中紅顏色標記的為連通性較高的hub基因。通過研究這些hub基因的功能發現:他們包括MYB家族轉錄因子,荷爾蒙(ABA,CK,BA)響應因子,細胞色素P450,BR信號激酶等等,這些都可能與籽粒的大小相關。



文章2:

題目:Global transcriptome and co-expression network analyses reveal cultivar-specific molecular signatures associated with seed development and seed size/weight determination in chickpea analysis
期刊:The Plant Journal(IF:5.7)
性狀:鷹嘴豆籽粒大小

實驗材料

這篇文章與上一篇文章思路幾乎一致,只是研究的物種變成了鷹嘴豆。同樣的,也是選取了兩個籽粒大小差異明顯的栽培品種:Himchana 1 (small-seeded) and JGK 3 (large-seeded),每個品種7個取樣時期S1-S7,分別為授粉後5, 9, 12, 19, 25, 30 and 40 天(DAP, day after pollination),還同時測了葉片的轉錄組,並取3個生物學重複,共48個樣品。不同發育時期和種子重量差異結果如下:


常規轉錄組分析結果:

① 整體表達情況描述:

利用轉錄組測序所有基因以及所有樣品的表達矩陣做樣品間的相關性分析和PCA聚類分析,從中可以發現,相同的發育狀態或者組織聚類在一起,說明他們之間具有較強的相關性。


② 差異基因比較分析:

作者主要比較了相同發育狀態不同品種之間的轉錄組差異比較,差異基因的上下調數量和其中轉錄因子的數量(見下圖a),另外還對差異基因中不同類型轉錄因子的數量進行了展示(見下圖b),圖c為不同時期差異基因的富集結果,顏色越深說明在該功能上越富集。最後對S3時期差異基因在mapman中的Metabolic pathways做了富集分析,可以將差異基因的表達量變化情況展示在通路圖中。

WGCNA分析

首先作者將不同的品種按籽粒大小分開,分別進行WGCNA共表達網絡分析,其中在Himchana 1品種中共找到27個模塊(見下圖a),在JGK 3品種中找到21個模塊(見下圖b):


進行模塊與樣品之間相關性分析,發現不同發育時期特有的基因模塊(這部分也是分開做)圖中顏色越紅的方框對應的模塊和樣品具有較高的相關性,左邊一半為Himchana 1中模塊與發育時期相關圖,右邊一半為JGK3模塊與發育時期相關結果,然後得到每個樣品中每個時期對應的最相關的模塊,(如下圖):




結合上一步的分析結果,再來分析兩個品種各自得到的模塊之間的相關性。理論上講,即便是不同品種,其相同發育時期對應的特有模塊應該具有較高的相關性。

例如,通過相關性分析,在JGK 3樣品中左下角黑色模塊與S6發育時期相關,這個模塊與Himchana 1中的darkorange模塊相關,同時darkorange模塊在Himchana 1 中也與S6相關(下圖中紅紫色方框);同樣的道理其他很多模塊都有這樣的相關性(下圖中紅色方框)。

但是在Himchana 1 中有個orange模塊不與JGK 3中任何一個模塊相關,作者推斷這個特殊的模塊很可能與籽粒大小相關,當然還有其他幾個模塊也有類似的現象。作者進一步研究這些模塊中基因表達情況發現裡面很多基因的表達量(在S3 和 S5時期)在不同的品種中具有相反的表達,之後作者進一步研究這些模塊裡面基因的相關功能等等。




總結

《Journal of Experimental Botany》和《The Plant Journal》都是植物學方面的經典權威期刊,此次解讀的兩篇文章的作者都圍繞研究目的做了多方面的工作。但毫無疑問的是,在文章主體的轉錄組分析部分,WGCNA方法起了重要作用,對數據進行了深入的挖掘,提高了文章的檔次。

如果您也有類似的研究目的,希望對轉錄組數據進行更加深入的利用,那麼WGCNA的方法一定要試一試!

如何實現WGCNA分析

經過我們的調研,實現該類型分析有兩種方式:

第一種方式,全套交給公司去做,報價6千到1萬不等,如需調整另外收費;

第二種方式,經過專業的訓練,學習之後自己進行分析工作。已經有部分學術團隊製作了相關的視頻教程,價格在百元級別,能省很多經費,而且自己也多一技在身。

在此給大家推薦一個優秀的相關視頻:組學大講堂製作的《WGCNA-加權基因共表達網絡分析》視頻教程,涵蓋了WGCNA分析的典型內容,並儘量照顧0生信基礎同學,降低了上手難度,一般經過半個月的學習和練習之後就可以掌握WGCNA的分析技能,同時設置了專門的技術交流QQ群在線解答分析中出現的問題。

想用這個方法提升文章檔次的同學趕緊點擊下面連結吧:

http://study.163.com/course/introduction/1005023004.htm?share=1&shareId=1143029466

或者掃描下面的二維碼開始學習之旅!

掃碼開啟學習之旅!!

參考文獻:

1. Du J, Wang S, He C, et al. Identification of regulatory networks and hub genes controlling soybean seed set and size using RNA sequencing analysis[J]. Journal of Experimental Botany, 2017, 68(8):1955-1972.

2. Garg R, Singh V K, Rajkumar M S, et al. Global transcriptome and co‐expression network analyses reveal cultivar‐specific molecular signatures associated with seed development and seed size/weight determination in chickpea[J]. Plant Journal, 2017.

延伸閱讀

基因家族分析思路解析及學習方法推薦

相關焦點

  • 轉錄組研究新利器:ONT直接RNA測序,鹼基修飾、轉錄異構體一網打盡!
    長讀長cDNA測序方法能夠產生跨越整個異構體的全長轉錄本序列,從而去除或大幅度減少模糊定位,並改進差異異構表達的分析結果。然而,以上方法依賴於cDNA的合成及PCR擴增,去除了天然RNA的鹼基修飾信息,並且只能粗略地估計多聚腺苷酸(poly(A))尾長。
  • 基因結構預測新利器-ONT全長轉錄組
    圖4  二代轉錄組與ONT全長轉錄組識別可變剪接Nanopore在三代全長轉錄組輔助基因預測中的優勢長度長在轉錄本分析方面比短讀長測序技術有明顯的優勢。組織差異越大,基因的表達差異通常也越大,因此基於轉錄組預測的方式需要多組織進行混樣分析以獲得更全面的基因信息。與PB相比ONT還具有無GC含量和鹼基偏好性、轉錄本表達定量準確的特性,在混合數據應用於注釋分析前,可以用作多組織/多處理下的表達差異分析。實現樣本一次檢測多種分析,完成數據最大利用率,也為文章添光增彩。
  • 搞定轉錄組入門分析?必備技能看這裡
    隨著高通量測序技術的迅猛發展,轉錄組分析逐漸發展成為一項基礎的研究方法在生物學個領域得到廣泛的應用。在轉錄組分析入門的過程中,您是否遇到這樣的問題:看了一篇篇的入門乾貨,依然無從下手;因缺少數據分析的環境,空有一肚子的理論無法實踐;按照教程一步步實踐,可就是無法產生相同的結果;面對種類繁多的數據挖掘工具,應該怎麼選擇?
  • 網課《腦神經的空間轉錄組分析》回放
    翻成中文,就是《人類背外側前額葉皮層轉錄組規模的空間基因表達》 在這張圖裡,左半邊是空間轉錄組的分析結果,右半邊是全轉錄組的分析結果,全轉錄組也就是傳統的RNA-seq。明顯可以看到,左半邊圖格子中的紅顏色要比右半邊圖格子的顏色深得多,也就是說,空間轉錄組相比於全轉錄組是更加敏感的分析手段。空間轉錄組的差異的顯著性要高許多。 那麼這個分析得到的一個結果,遺傳性的精神分裂症在第2層中有富集。
  • 高級轉錄組調控分析和R語言數據可視化第十三期 (線上開課)
    第十三期 高級轉錄組調控分析和R數據可視化在於2021年4月17日線上開課,將系統講述基於和不基於比對的轉錄組分析流程,從原始數據到表達矩陣、差異基因、轉錄組拼裝、可變剪接、非編碼RNA、ceRNA、轉錄因子調控網絡、富集分析、加權共表達網絡、通路分析、可視化繪圖、機器學習等一系列常見操作,理論和實踐兼備。
  • 項目文章 | 轉錄組學+iTRAQ蛋白質組學揭示乾旱條件下木薯的轉錄後調控機理
    本研究作為木薯轉錄組學和蛋白質組學分析的首次研究,為乾旱脅迫下木薯的轉錄後調控提供了新的方向。與轉錄組分析的結果相似,在葉和根樣本中變化相同的差異蛋白極少(圖1B),說明乾旱脅迫對葉和根中的不同功能途徑起作用。這些結果在蛋白質組水平上提供了乾旱脅迫對木薯功能途徑影響解析。
  • 基於RNA-seq的銀線草轉錄組分析
    本研究利用RNA-seq進行銀線草轉錄組測序分析,以期揭示其轉錄組信息特徵,為該藥用植物功能基因挖掘、次生代謝途徑解析及調控研究提供基礎數據。2  結果與分析2.1  銀線草轉錄組組裝與質量分析採用IlluminaHiSeqTM 2000 150PE高通量測序平臺對銀線草根莖進行轉錄組測序,共得到68 458 750條raw reads,過濾產生了66 138 234條clean reads,包含6 320 552 293個核苷酸信息
  • 數據挖掘系列主題(3)|那些年不能錯過的全轉錄組挖掘套路之lncRNA入手篇!
    所以今天就跟著小編一起走進全網最經典的全轉錄組數據挖掘思路之從lncRNA入手分析篇吧! 說起最近轉錄組分析思路什麼最火,那必然是全轉錄組了吧。近年來,大家也逐漸意識到單一的mRNA或ncRNA研究已無法完全滿足科研需求,需要結合多種RNA信息進行整合分析,進而探索潛在的調控網絡機制。
  • 希望組正式推出納米孔單細胞全長轉錄組測序分析服務
    作為國內三代測序服務的引領者,希望組在三代測序技術領域深耕多年,將長讀長與單細胞測序技術結合,開發出了完整的納米孔單細胞全長轉錄組實驗分析流程,打破用三代測序單細胞全長轉錄組建庫起始量高的技術壁壘,並於近日正式推出納米孔單細胞全長轉錄組測序分析服務。
  • 走進組蛋白乙醯化,解析轉錄因子與DNA轉錄的關係
    分析的文章題目為:Egr-1 and RNA POL II facilitate glioma cell GDNF transcription induced by histone hyperacetylation in promoter II(回復170515下載文獻)本文作者首先提出一個假設,組蛋白H3k9在GDNF
  • 轉錄組測序+SSR鑑定,文章可以輕鬆發
    然而對於一些物種樣本而言,在轉錄組測序基礎上,進一步開發SSR分子標記,深入挖掘物種中的遺傳多樣性等信息,可以從另一個角度快速成文,今天小編就跟大家分享一篇近期發表的經典範例。NJ聚類分為三組,來自紐西蘭的材料表現出相似的遺傳屬性,聚類成一組。UPGMA和PCoA分析也顯示了相同的結果。AMOVA分析表明,基於地理起源聚類和NJ聚類的種內遺傳多樣性優於種間遺傳多樣性。此外,本研究還建立了79種苔草的指紋圖譜。引物對的不同組合可以一次鑑定多種苔草,克服了傳統鑑定方法的困難。轉錄組分析從基因注釋中揭示了新的功能類別。遺傳特徵分析表明,79種苔草屬植物間存在廣泛的基因流動。
  • 轉錄組和代謝組解析風信子變色分子機制
    通過轉錄組和代謝組技術,不僅可以對轉錄水平進行研究,還可以對代謝產物進行比較分析,從而深入解析決定表型的分子調控機制。本研究首次使用轉錄組和代謝組聯合分析,揭示與風信子花色素沉著相關的主要代謝途徑,並且挖掘針對植物中色素沉積相關的關鍵基因。
  • 【線上直播】轉錄組+基因家族,一次全搞定
    本期培訓內容涵蓋轉錄組方案設計、標準分析、個性化數據挖掘、文章思路、基因家族分析等,從取樣到文章數據整理,手把手帶你解讀測序公司分析結果、理清個性化分析方案思路、學會個性化分析工具。p.s:本期新增轉錄組數據一鍵分析內容,附贈代碼。
  • 轉錄組測序入門知識(上篇)
    轉錄組測序作為目前研究基因轉錄和表達最常規有效的組學工具,已經廣泛被科研人員使用。但是作為初學者來說,對於轉錄組相關的很多名詞和術語,取樣與保存,實驗設計,數據分析與解讀,文章撰寫等方面都會存在一定程度上的疑問。美格基因,為此特意開設轉錄組測序專題,每期一篇乾貨,方便各位小新萌能快速掌握和運用這項技術,記得密切關注我們官方微信公眾號!
  • 全轉錄組後期驗證之mRNA篇
    目前公認的最常用也是最好用驗證方法沒有之一,堪稱教科書式的分析流程,和轉錄組學研究已是標配。提取組織或細胞中的總RNA,以其中的mRNA作為模板,採用Oligo(dT)或隨機引物利用逆轉錄酶反轉錄成cDNA。
  • 轉錄組學+iTRAQ蛋白質組學揭示乾旱條件下木薯的轉錄後調控機理
    通過轉錄組測序技術和iTRAQ標記定量蛋白質組學聯合研究,在木薯葉片和根中分別鑑定出1242/715個差異表達基因(DEGs)和237/307個差異表達蛋白(DEPs)。本研究作為木薯轉錄組學和蛋白質組學分析的首次研究,為乾旱脅迫下木薯的轉錄後調控提供了新的方向。棕色箭頭和藍色箭頭分別代表上調和下調的DEGs/DEPs。
  • 轉錄組專題-可變剪接
    3.基於新一代測序技術RNA-seq   定量更準確、可重複性更高、檢測範圍更廣、分析更可靠。轉錄組高通量測序對於研究可變剪切和它的調節來說是一個強而有力的實驗工具,但是同時必須要有特殊的分析方法和工具。
  • 轉錄調控與多組學貫穿圖形解析——調控網絡圖
    對應的RNA-seq分析涉及的圖形也十分豐富。從最基礎的「5』~3』隨機性曲線」到比較複雜多組學貫穿圖形,每種圖形都含有其獨一無二的意義。因此了解這些圖形中包含的信息以及繪製方法,對於我們解析RNA-seq以及相關的貫穿組學數據顯得尤為重要。在「轉錄調控與多組學貫穿」圖形專題系列,我們將會選擇轉錄組以及多組學貫穿研究中最有代表性的圖形為素材,與您分享解析這些圖形的繪製方法。
  • MPB:南土所褚海燕組-土壤宏轉錄組學樣本前處理與數據分析
    3廣東美格基因科技有限公司, 廣州,510000*通訊作者郵箱:hychu@issas.ac.cn摘要:土壤宏轉錄組學是通過製備土壤RNA樣本、RNA測序、以及利用一系列生物信息學方法和平臺搭建來完成土壤微生物組的轉錄過程分析,提供關於基因表達和土壤微生物組功能活性,從而獲得微生物組關鍵代謝差異表徵等信息的一門學科。
  • 科研人員開發出基於深度學習的單細胞轉錄組分析模型
    單細胞轉錄組作為單個細胞的特徵,可更加精確地定義細胞的類型。常規的基於單細胞轉錄組的分類方法首先是進行無監督的聚類,然後根據每個集群(Cluster)特異表達的細胞標記基因來對集群進行標註。雖然基於無監督的分類方法更容易發現新細胞類型,但是人工標註的過程費時費力。