原創乾貨丨採用LefSe解析組間微生物構成差異

2021-02-20 生信圈
LefSe(LDA EffectSize)是一種用於發現高維生物標識和揭示基因組特徵的軟體。包括基因,代謝和分類,用於區別兩個或兩個以上的生物條件(或者是類群)。該算法強調的是統計意義和生物相關性。具體來說,首先使用non-parametric factorial Kruskal-Wallis (KW) sum-rank test(非參數因子克魯斯卡爾—沃利斯和秩驗檢)檢測具有顯著豐度差異特徵,並找到與豐度有顯著性差異的類群。最後,LEfSe採用線性判別分析(LDA)來估算每個組分(物種)豐度對差異效果影響的大小。

LDA Score:表示不同組間顯著差異物種的影響程度

 1、輸入文件的格式必須是.txt文件.

 2、輸入文件的第一行代表的是class信息,第二行可以有一個第subclass信息.

 3、物種信息也有一定的要求,物種豐度表的第一行必須是分類信息,第二行是對應的樣品名稱,第一列是按照物種分類p_c_o_f_g_進行排序的,之後各列是某個物種在各個樣本中對應的相對豐度值。

示例如下:

Step 1. format_input.py

format_input.py convert the input data matrix to the format for LEfSe. 轉換輸入文件格式

format_input.py

species.out.txt      #輸入文件

species.out.in    #輸出文件

-c 1 -s 2 -u 3 -o 1000000

-c 1the class information in the first line (-c 1)

-s 2the subclass in the second line (-s 2)

-u 3 the subject in the third (-u 3).

If the subclass or the subject are not present in the data you need to set the value -1 for them.

-o 1000000 scales the feature such that the sum (of the same taxonomic leve)


Step 2. Run_lefse.py

run_lefse.py performs the actual statistica analysis 進行實際的統計分析

run_lefse.py

species.out.in

species.out.res


Step3 . plot_res.py

plot_res.py visualizes the output 可視化輸出

plot_res.py

species.out.res

species.out.png


Step 4. plot_cladogram.py

plot_cladogram.py visualizes the output on a hierarchical tree 在等級樹上進行可視化輸出

plot_cladogram.py

species.out.res

species.out.cladogram.png

--format png


Step 5. plot_features.py

plot_features.py visualizes the raw-data features 可視化輸出原始數據特徵

mkdir biomarkers_raw_images

plot_features.py species.out.in species.out.res

biomarkers_raw_images/

 5.1  根據LEfSe結果,以進化分枝樹圖展示各層次水平中存在組間差異的微生物群落或物種結構。

                                             

紅色與綠色表示不同的分組情況,由內到外表示的是門、綱、目、科、屬的物種分類平。進化樹中的紅色節點為在紅色組別中起重要作用的物生物分類,綠色節點為綠色組中起到重要作用的物生物分類,黃色均代表無顯著差異的物種。

5.2  按影響性及關聯性,以LEfSe算法計算各組中有顯著差異的微生物群落或物種的LDA分值。

圖中展示的是LDA score大於預設值的顯著差異物種,默認分值為2.0。柱狀圖的長短代表的是LDA score,即不同組間顯著差異物種的影響程度。

供稿:協雲基因 一葉知秋

編輯:生信圈

生信圈致力於每天推送生物信息乾貨,讓大家了解生信行業。旨在通過更多的交流促進行業的發展。我們一直在尋找志同道合的夥伴!投稿郵箱:bioinfor_club@163.com

生信圈

相關焦點

  • 微生物組間差異分析之LEfSe分析
    LEfSe分析,可以分析組間菌群差異,找出各組間差異的微生物種類,有助於開發biomaker等研究,因此LEfSe分析在微生物相關文章中經常出現
  • Lefse分析說明及線上、線下分析操作
    LEfSe (Linear discriminantanalysis Effect Size)分析又叫 LDA Effect Size 分析,常用於兩組及多個組的比較,同時還可以對分組內部的亞組進行比較分析,從而找到組間在豐度上有顯著差異的物種
  • LEfSe分析的在線+本地運行的超詳細教程
    LEfSe(Linear discriminant analysis Effect Size)一種廣泛用於宏基因組生物高維數據的biomaker鑑別和解釋的工具,通過分類比較、生物學一致性測試和效應大小估計,描述和驗證兩個或多個微生物群落之間的差異物種、基因或途徑(Segata et al, 2011)。
  • 【乾貨】微生物高分文章必備分析LEfSe
    今天Fanny給大家介紹一個好玩又簡單的微生物多樣性分析中的組間比較分析——LEfSe,即linear discriminant analysis
  • MagicHand雲平臺|微生物高分文章必備分析LEfSe
    LEfSe(Linear discriminant analysis Effect Size,線性判別分析)即LDA Effect Size分析,是一種發現和解釋高緯度數據生物標識(分類單元、通路、基因)的分析工具,可以實現兩個或者多個分組之間的比較,同時也可進行分組內部亞組之間的比較分析,從而找到組間在豐度上有顯著差異的物種
  • 微生物LEfSe分析圖表解讀
    其中,LEfSe分析在這兩年的微生物文章中常常出現。所以,今天我們來重點講解一下LEfSe分析的原理及圖表解讀!LEfse分析即LDA Effect Size分析,可以實現多個分組之間的比較,還進行分組比較的內部進行亞組比較分析,從而找到組間在豐度上有顯著差異的物種(即biomaker);主要分為三步,如下圖:
  • 何為「組間同質,組內異質」
    一般情況下,合作學習進行分組時要按照「組間異質,組內同質」的原則進行。所謂組內異質,就是小組成員在性格、成績、動手能力和表達能力、家庭等方面有一定的差異性和互補性。而組間必須同質,即小組間儘量減少差異,使其各方面情況相當,儘量使各小組之間的競爭公平、合理。合作式教學中的學生分組要注意科學合理。
  • 手把手教你實現LEfSe:在線工具使用詳細流程!!
    該算法強調的是統計意義和生物相關性,首先使用non-parametric factorial Kruskal-Wallis sum-rank test檢測具有顯著豐度差異特徵,之後應用unpaired Wilcoxon rank-sum test評估不同組的亞組兩兩之間該特徵的差異顯著性,之後採用LDA估算每個組分豐度對差異影響的大小。
  • 乾貨丨消毒劑開發過程中的中和劑你需要掌握!
    達到規定消毒時間終點時,要求立即終止殘留消毒劑的繼續作用,以便準確檢測出消毒體系中殘留存活的微生物及其數量。檢驗過程中消毒劑的殘留如何去除?這裡不得不提到一個關鍵詞中和劑!何為中和劑(neutralizer)?
  • 要分析組間的差異,該如何選擇正確的統計方法?
    差異分析主要用於:(1)判斷因變量在兩組或多組之間的統計學差異,各組之間可以是獨立的,也可以是非獨立的;(2)如果多組之間存在差異,進一步開展兩兩比較,分析差異來源。 比如,分析不同醫療機構醫生收入水平的差異。
  • 微生物群落差異分析方法大揭秘
    β 多樣性差異分析。舉個例子,微生物生長受N、P等多種因素影響。如果有3組樣本,分別是對照、N處理以及P處理的土壤,在N和P處理相對於對照都顯著(p<0.05)的情況下,想知道到底是N還是P的處理更為重要,那就是要看之前R值大小了。
  • 乾貨|在線玩轉LEfSe分析!
    首先在多組樣本中採用 非參數因子Kruskal-Wallis秩和檢驗 檢測不同分組間豐度差異顯著的物種;也就是圖中按class1和class2兩個大的分組,每一行都進行檢驗,初步得到差異物種,通過檢驗的打鉤進入step2檢驗。Step2. 再利用Wilcoxon秩和檢驗,對每一組中的亞組進行兩兩檢驗,具有顯著差異的再進行下一輪檢驗。Step3.
  • 【工具】LEfSe分析在線做
    LEfSe分析,可以分析組間菌群差異,可以找出各組間特異的主要菌群,有助於開發biomaker等研究。
  • 微生物群落多樣性測序與功能分析
    微生物群落測序是指對微生物群體進行高通量測序,通過分析測序序列的構成分析特定環境中微生物群體的構成情況或基因的組成以及功能。藉助不同環境下微生物群落的構成差異分析我們可以分析微生物與環境因素或宿主之間的關係,尋找標誌性菌群或特定功能的基因。
  • 環境因子影響湖泊沉積物微生物多樣性和汞循環機制研究獲進展
    從無機汞轉化而來的甲基汞(MeHg)可通過食物鏈進行生物積累,對人類健康構成威脅。微生物活動在汞生物地球化學循環中發揮關鍵作用,例如,merA基因編碼的汞還原酶能夠將Hg2+還原為Hg0。湖泊中的汞汙染影響沉積物微生物群落結構和功能。
  • Alpha多樣性指數的計算和差異分析(差異檢驗結果可視化)
    Alpha多樣性指數Alpha多樣性用於分析樣品內(Within-community)的微生物群落多樣性,可以反映樣品內的微生物群落的豐富度和多樣性。alpha多樣性指數包括豐富度、多樣性、均一性等。均一性指數用於評估群落中各個微生物在群落中的均勻程度,所有微生物均具有相同的豐度則均一性最高,例如Pielou等。
  • 乾貨丨超聲焊接原理及影響因素
    如果本文對你有所幫助,歡迎分享到朋友圈點擊下列標題 閱讀更多歷史乾貨【技術π】深度剖析鋰離子電池鼓脹原因丨【鋰電內阻】理論結合生產談談鋰電池內阻那些事丨【技術π】深度剖析NCM811電池壽命衰減原因丨【精品】鋰電池漿料性質及關鍵影響因素分析丨【技術π】水分含量對電池性能的影響 丨【技術π】陶瓷塗層在鋰電池中的應用丨【技術π】電極漿料製備過程中物料顆粒狀態變化詳解丨
  • 品頭論足-distcomp:組間分布差異檢驗
    1. distcomp 指令簡介在遇到需要比較不同分布的情況時,經濟學論文除了均值差異以外,正越來越多地側重於分布整體上,及其在不同分位數上的差異。具體地說,他們的田野實驗總共採用兩種形式:幫圖書館錄入書目,和上門籌款。圖書館任務中,他們每 90 分鐘統計一次被試者錄入書目數量,並以此為目標變量 (ylib)。