在上一期文章《如何打破瓶頸,提升宏基因組研究level》中,我們和大家分享了提升宏基因組研究檔次的進階策略,包含專業資料庫、個性可視化、高級分析、多組學……今天,我們通過1篇經典案例,具體看看「可視化」和「高級分析」這些策略在文章中的應用。
期刊:2019 Science of the Total Environment
IF=5.589
背景:有害水藻爆發通常以藍藻聚集體(Cyanobacterial Aggregates,CAs)為特徵,是淡水湖泊面臨的嚴重威脅。推測CAs中藍藻與細菌的共生有利於彼此穩定,研究其共生關聯,為CAs失衡法治理水華的途徑提供參考。
實驗:一年內採集太湖CAs樣品,共26個,16S V4區測序、宏基因組測序。
策略:小提琴圖、組合圖的專業可視化 + SEM、binning的高級分析
文章主要圍繞兩種藍藻聚集體開展深入的微生物多樣性分析。對於常規的分析點,大家可以查看原文。這裡我們主要分享文章的特色之處。
在alpha多樣性分析中,我們最常用的展現形式,比如表格、柱形圖、盒型圖、稀釋曲線。但是如果樣本量比較多,比如文章中一個分組包含了10個以上樣本,就可以採用小提琴圖展現。小提琴圖可以認為是盒型圖的升級版,一般中間是盒型圖,外圍加了一片陰影,像小提琴的形狀,其實展現的是「數據密度」。
如圖1,小提琴胖的地方,表示分組中對應數值的樣本多;瘦的地方,就是對應數值的樣本少。由此可以看出樣本數據整體分布趨勢,比如圖1第一組,兩個小提琴比較胖,比較集中,說明組內大部分樣本sob指數接近;圖1第三組,小提琴更長,更瘦,說明組內chao指數差異偏大。可以看出,小提琴比盒型圖更直觀、更豐富。
圖1 分組alpha多樣性分析
在物種與環境因子的關聯分析中,相信大家對相關性熱圖或者mantel test都不陌生,但是把我們熟悉的兩個內容合成一幅圖,就變得非常新穎豐富了。
如圖2,右上角是環境因子spearman相關性熱圖,左下角是mantel test檢驗結果。使用線的粗細、顏色表示了相關性強弱和顯著性。圖中清晰呈現了影響微生物群落的WT、DO、TN、TP等重要環境因子。圖形直觀、信息量豐富,稱得上是SCI級圖形的典範。大家也可以嘗試畫一畫。
圖2 物種/功能與環境因子關聯分析
文章重在探討水體富營養化產生的藻類聚集體,所以物種與水體環境因子的關聯分析也是非常重要的一部分。所以除了開展上文的spearman相關性、mantel test,研究還採用了結構方程模型(structural equation model,SEM)開展細菌多樣性、藍藻多樣性、環境因子之間的關聯分析。
如圖3,通過SEM分析發現細菌多樣性是與藍藻多樣性關聯最強的因子,暗示細菌的狀態可以影響水藻的爆發。另一方面,TN(總氮)是對細菌、藍藻、其他環境因子都有重要影響的因子。
圖3 物種與環境因子SEM分析
2.2 宏基因組單菌分析「binning」
很多文章寫到這裡,已經是一個比較圓滿的故事了。但由於SEM分析指明了「氮」元素的重要性,圍繞細菌與藍藻「互利共生」的研究中心,文章進行了物種基因組氮(N)循環功能的研究,可謂畫龍點睛。
那麼,宏基因組測序,哪裡來的物種基因組呢?這就是我們在上一篇進階策略中提到的binning分析。從26個樣本的200G數據中,binning獲得了51個參與N循環過程的高質量bin(draft genome)。並基於這51個細菌基因組和兩類型藍藻,清晰呈現了細菌基因組(bin)和藍藻共同參與的N循環過程(圖4)。
圖4 細菌與藍藻共同參與的N循環
看到這裡,大家可能會疑問,不做binning分析,通過功能基因比對Nr或者KEGG資料庫,一樣可以區分出細菌和藍藻各自參與的N循環過程。但是,細想一下,研究旨在探討聚集體中細菌與藍藻的「互利共生關係」,所以目標並不是為了區分N循環功能基因是來源於細菌還是藻類。比如,通過宏基因組功能基因比對Nr庫,你很可能發現6個N循環過程都比對上了各種豐富的細菌,這樣豈不是沒有藍藻什麼事了。
但是如果我們是基於bin基因組分析,一方面可以更準確地鑑定出N循環的細菌參與者(因為bin的鑑定,說明存在的是一個潛在基因組,而不僅僅是某幾個基因);另一方面,從高質量細菌基因組層面,就可以很清晰地展示出這51個基因組不完善的N循環過程,從而暗示了這部分細菌與藍藻密切合作的潛在可能,緊扣主題。所以,研究的重要結論只有基於binning分析,才能更充分的展現。
當然,binning的應用思路非常豐富,不僅僅是bin功能基因層面的分析,歡迎大家繼續關注我們,後續還會分享binning應用的其他思路。
看著這麼豐富高大上的宏基因組分析,有沒有心動呢?來基迪奧進行宏基因組測序分析,福利多多哦!
掃描下方二維碼,即可預約「所有樣本binning分析免費做」。
PS:有宏基因組測序計劃的小夥伴們抓住機會哦,名額有限,先到先得!
活動最終解釋權歸基迪奧生物所有
參考文獻:
Zhu C M, Zhang J Y, Guan R, et al. Alternate succession of aggregate-forming cyanobacterial genera correlated with their attached bacteria by co-pathways[J]. Science of The Total Environment, 2019, 688: 867-879.
實用科研工具推薦
詳實生信軟體教程分享
前沿創新組學文章解讀
獨家生信視頻教程發布