微生物LEfSe分析圖表解讀

2021-01-14 基迪奧生物


一般來說,微生物常見分析內容有OUT豐度分析、OUT Venn圖、alpha多樣性、RDA/CCA分析、物種系統進化分析、LEfSe分析等等。其中,LEfSe分析在這兩年的微生物文章中常常出現。所以,今天我們來重點講解一下LEfSe分析的原理及圖表解讀!


LEfse分析即LDA Effect Size分析,可以實現多個分組之間的比較,還進行分組比較的內部進行亞組比較分析,從而找到組間在豐度上有顯著差異的物種(即biomaker);


主要分為三步,如下圖:




首先在多組樣本中採用的非參數因子Kruskal-Wallis秩和檢驗檢測不同分組間豐度差異顯著的物種(a);


然後在上一步中獲得的顯著差異物種,用成組的Wilcoxon秩和檢驗來進行組間差異分析;


最後用線性判別分析(LDA)對數據進行降維和評估差異顯著的物種的影響力(即LDA score)。


LDA值分布柱狀圖:

展示了LDA score大於設定值有差異的物種,即具有統計學差異的biomaker。展現不同組中豐度有顯著差異的物種,柱狀圖的長度代表顯著差異物種的影響大小;


進化分支圖:

由內至外輻射的圓圈代表了由門至屬(或種)的分類級別。在不同分類級別上的每一個小圓圈代表該水平下的一個分類,小圓圈直徑大小與相對豐度大小呈正比。

著色原則:無顯著差異的物種統一著色為黃色,差異物種 Biomarker跟隨組進行著色,紅色節點表示在紅色組別中起到重要作用的微生物類群,綠色節點表示在綠色組別中起到重要作用的微生物類群,其它圈顏色意義類同。圖中英文字母表示的物種名稱在右側圖例中進行展示。


biomaker在不同組各樣本中的豐度比較圖:

將biomaker豐度最高的樣本的豐度設定為1,其他樣品中該 biomarker 的豐度為相對於豐度最高樣品的相對值。



LEfse分析可以在本地分析也可以在線分析,本地版本只能在linux系統下運行;在線分析的網址是:

https://huttenhower.sph.harvard.edu/galaxy/



親測,這個網站還是蠻好用的,以上圖片這個網站都可以畫出來蛤~~


LEfSe分析是基於LDA值,很多人會問為什麼是不用PCA?PCA與LDA有什麼區別?關於這個問題,解釋如下:


PCA和LDA的差別在於,PCA,它所作的只是將整組數據整體映射到最方便表示這組數據的坐標軸上,映射時沒有利用任何數據內部的分類信息,是無監督的,而LDA是由監督的,增加了種屬之間的信息關係後,結合顯著性差異標準測試(克魯斯卡爾-沃利斯檢驗和兩兩Wilcoxon測試)和線性判別分析的方法進行特徵選擇。


參考文獻:

Segata N, Izard J, Waldron L, et al. Metagenomic biomarker discovery and explanation[J]. Genome Biol, 2011, 12(6): R60.



相關焦點

  • Lefse分析說明及線上、線下分析操作
    該數據可以從微生物多樣性分析結果中都能得到,即 OTU 在不同分類水平下的物種豐度統計信息,將文件格式轉換為網站所需的標準輸入格式,然後點擊 Get Data -> Upload File 上傳本地數據文件,本文練習文件(lefse_sample.txt),選擇文件格式為 tabular,Start上傳文件。
  • LEfSe分析的在線+本地運行的超詳細教程
    Step3:所得的向量子集用於構建線性判別分析(LDA)模型,利用類間的相對差異對變量進行降維和分類,輸出包含一列與類別有關的特徵列表,這些特徵與類別中的子類別分組保持一致,並根據它們區分類別的效應大小進行排名。 因此LEfSe是用於對不同生物學方面的相關性進行排名以及進行進一步研究和分析的有價值的工具。
  • 微生物組間差異分析之LEfSe分析
    LEfSe分析,可以分析組間菌群差異,找出各組間差異的微生物種類,有助於開發biomaker等研究,因此LEfSe分析在微生物相關文章中經常出現
  • 原創乾貨丨採用LefSe解析組間微生物構成差異
    最後,LEfSe採用線性判別分析(LDA)來估算每個組分(物種)豐度對差異效果影響的大小。LDA Score:表示不同組間顯著差異物種的影響程度 1、輸入文件的格式必須是.txt文件. 2、輸入文件的第一行代表的是class信息,第二行可以有一個第subclass信息.
  • MagicHand雲平臺|微生物高分文章必備分析LEfSe
    LEfSe(Linear discriminant analysis Effect Size,線性判別分析)即LDA Effect Size分析,是一種發現和解釋高緯度數據生物標識(分類單元、通路、基因)的分析工具,可以實現兩個或者多個分組之間的比較,同時也可進行分組內部亞組之間的比較分析
  • 數據分析常規分析思路及圖表類型解讀
    可視化數據分析工具的出現讓人們可以通過將數據可視化來探討問題、揭示洞見,用數據分享故事。甚至於不懂挖掘算法的人員,也能夠為用戶進行畫像。數據科學家是21世紀的熱門工作。 大數據分析的前瞻性使得很多公司以及企業都開始使用大數據分析對公司的決策做出幫助,而大數據分析是去分析海量的數據,所以就不得不藉助一些工具去分析大數據,那麼大數據分析的工具都有哪些呢?
  • 【乾貨】微生物高分文章必備分析LEfSe
    今天Fanny給大家介紹一個好玩又簡單的微生物多樣性分析中的組間比較分析——LEfSe,即linear discriminant analysis
  • 微生物擴增子測序圖表解讀最新
    作者:牛耀芳    筆名:谷禾牛博 很多小夥伴有過這樣的經歷,在拿到公司出具的報告之後,仍然一頭霧水,幾十頁的報告內容看著豐富卻不知該怎麼運用,看似一大堆數據圖表卻不知如何下手, 那麼怎樣給報告中的數據賦予靈魂讓它真正成為對你有幫助的分析呢?
  • 2019微生物組—宏基因組分析專題培訓第三期
    從Linux和R基礎、宏基因組Linux伺服器分析平臺搭建、Windows常用統計分析軟體、數據分析圖表解讀和實戰、宏基因組有參(Reference-based適合人類、動物腸道等)和無參(De novo適合植物、環境樣本等)標準分析流程、Binning(挖掘單菌基因組)、統計分析以及各類高級分析(多基因連接進化樹、網絡圖繪製和美化、網絡屬性比較、機器學習等),和CNS級圖片修改排版。
  • 微生物擴增子測序圖表解讀(實例數據)
    通常按照 97% 的相似性閾值將序列劃分為不同的 OTU,每一個 OTU 通常被視為一個微生物物種。相似性小於97%就可以認為屬於不同的種,相似性小於93%-95%,可以認為屬於不同的屬。樣品中的微生物多樣性和不同微生物的豐度都是基於對OTU的分析。有了OTU這個概念之後,就不難理解下表。對每個樣本的測序數量和OTU數目進行統計,並且在表栺中列出了測序覆蓋的完整度。
  • 手把手教你實現LEfSe:在線工具使用詳細流程!!
    LEfSe根據分類學組成對樣本按照不同的分組條件進行線型判別分析(LDA),找出對樣本劃分產生顯著性差異影響的群落或物種。右圖為聚類樹,紅色區域和綠色區域表示不同分組,樹枝中紅色節點表示在紅色組別中起到重要作用的微生物類群,綠色節點表示在綠色組別中起到重要作用的微生物類群,黃色節點表示的是在兩組中均沒有起到重要作用的微生物類群。
  • 乾貨|在線玩轉LEfSe分析!
    最後用線性判別分析(LDA)對數據進行降維並評估差異顯著的物種的影響力(即LDA score)。前兩步的Kruskal-Wallis秩和檢驗、Wilcoxon秩和檢驗 比較簡單,類似T檢驗或者方差檢驗等,只不過T檢驗和方差分析為參數檢驗(要求數據符合方差齊性、正態分布),而在微生物多樣性分析中,樣品物種豐度分布不確定,多採用非參數檢驗,所以採用非參數的Kruskal-Wallis秩和檢驗、Wilcoxon秩和檢驗。比較複雜一點的就是最後的LDA分析。
  • 數據可視化,職場數據分析都需要哪些常用的圖表?
    使用圖表數據可視化的作用  使用圖表來展示數據主要有三個作用:  表達形象化:使用圖表可以化冗長為簡潔,化抽象為具體,化深奧為形象,使讀者或聽眾更容易理解主題和觀點。  突出重點:通過對圖表中數據的顏色和字體等信息的特別設置,可以把問題的重點有效地傳遞給讀者或聽眾。
  • 數據分析,用對圖表很重要
    有些人可能會認為,數據分析那是數據產品經理的職責,其實不然,我認為數據分析重在思維,是一種通過現象看本質的思維,這種思維能力是產品經理需要掌握的,不少企業在招聘產品經理的時候也會看重產品經理的數據驅動能力。數據本身冰冷沒有意義的,我們需要通可視化圖表將數據直觀的表現出來,然後對其進行分析,發現背後蘊藏的規律。
  • 數據可視化圖表工具有哪些圖表類型?
    但很多人往往只注重讓圖表看上去「高大上」,而忽視了「這些的數據究竟適合哪些圖表來表達」。結果很多人花了大力氣做可視化圖表,卻沒達到想要的效果。 那麼,如何讓數據「說人話」,讓受眾更快速地懂你呢?
  • 16S裡的LEfSe分析,你知多少?
    這種圖學名叫做「進化分支圖」,是16S研究LEfSe分析裡的一種常見的結果展現形式。LEfSe (LDA Effect Size)是一種用於發現高維生物標識和揭示基因組特徵的軟體分析,能夠在組與組之間尋找具有統計學差異的生物標識(Biomarker),即組間差異顯著的物種。該算法強調的是統計意義和生物相關性。
  • 用於電機性能分析的三種圖表
    平常我們在做電機試驗時,往往會通過測試設備獲取電機的曲線圖表來進行分析。但這曲線圖表也有不同的種類,分別適用於不同的場合。本文引用地址:http://www.eepw.com.cn/article/201605/291387.htm  根據電機試驗項目的不同,一般會獲得不同的測試結果圖表。這些圖表可以根據涉及的電機參數變量,簡單劃分為三種:「一維」/「二維」/「三維」圖。
  • 初中數學:圖表信息問題的解讀與訓練
    圖表信息題是中考常考的一種新題型,它是通過圖象、圖形及表格等形式給出信息,通過認真閱讀、觀察、分析、加工、處理等手段解決的一類實際問題.主要考查同學們的讀圖、識圖、用圖能力,以及分析問題、解決問題的能力.圖表信息問題往往和「方程(組)、不等式(組)、函數、統計與概率」等知識結合考查. 21世紀教育網版權所有這類試題是指通過圖
  • 【工具】LEfSe分析在線做
    LEfSe分析,可以分析組間菌群差異,可以找出各組間特異的主要菌群,有助於開發biomaker等研究。
  • 網站分析中統計圖表的使用方法
    網站分析中會處理大量的數據,直接查看日誌中的原始數據很難把握整體情況。有時根據需要有必要創建圖表。另外,大多數的網站分析工具會將獲取的數據圖表化後再顯示出來,因此有必要了解各個圖表的特點、使用方法或者注意事項等。網站分析主要會用到下面幾類圖表。