擴增子-β多樣性分析

2021-01-10 美格基因

一、關於擴增子β多樣性分析

β多樣性(Beta Diversity)是指不同樣品間的生物多樣性的比較,是對不同樣品間的微生物群落構成進行比較。β多樣性分析通常由計算環境樣本間的距離矩陣開始,對群落數據結構進行自然分解,並通過對樣本進行排序(Ordination),從而觀測樣本之間的差異。β多樣性與α多樣性一起構成了總體多樣性或一定環境群落的生物異質性。

β多樣性分析中通常採用以下幾種算法:bray_curtis、euclidean、abund_jaccard、unweighted_unifrac、weighted_unifrac等計算任意兩個樣本間的距離從而獲得樣本距離矩陣,這些算法主要分為兩大類:加權(如Bray-Curtis和Weighted Unifrac)與非加權(如Jaccard和Unweightde Unifrac)。

利用非加權的計算方法,主要比較的是物種的有無,如果兩個群體的β多樣性越小,則說明兩個群體的物種類型越相似。而加權方法,則需要同時考慮物種有無和物種豐度兩個層面。

Bray curtis 距離基於物種的豐度信息計算,是生態學上反應群落之間差異性常用的指標之一。 Weighted Unifrac 距離是一種同時考慮各樣品中微生物的進化關係和物種的相對豐度,計算樣品的距離,而(Unweighted Unifrac)則只考慮物種的有無,忽略物種間的相對豐度差異。Uweighted Unifrac 距離對稀有物種比較敏感,而 Bray curtis 和 Weighted Unifrac 距離則對豐度較高的物種更加敏感。

最後,基於以上的距離矩陣,通過多變量統計學方法主坐標分析(PcoA,Principal co-ordinatesAnalysis),非加權組平均聚類分析(UPGMA, UnweightedPair-groupMethod with Arithmetic Means)等分析,進一步從結果中挖掘各樣品間微生物群落結構的差異和不同分類對樣品間的貢獻差異。

1、樣本距離heatmap圖

β多樣性分析首先需要計算任意兩個樣本間的距離從而獲得樣本距離矩陣,輸入抽平的out_table,選擇合適的距離算法(通常為Bray_Cutis),使用usearch軟體計算任意兩個樣本間的距離,得到相異係數距離矩陣,對矩陣進行層級聚類,可以清楚地看出樣本分支的距離遠近。

圖1 樣本距離heatmap圖

顏色越藍表示樣本間距離越近,相似度越高,越紅則距離越遠。熱圖中對樣本間做了聚類,通過聚類樹亦可看出樣本間的距離關係。

2、PCA分析

PCA(Principal componentanalysis,主成分分析)分析是一種非約束性的數據降維方法,常用於簡化數據集。它基於euclidean(歐式距離),運用方差分解尋找造成樣本間差異的主成分(特徵值)及其貢獻率。PCA分析能夠從原始數據中提取樣本間最主要的差異特徵,並根據這些差異特徵將樣本在新的低維坐標系中依次排序,使得樣本在新坐標系中的距離遠近能在最大程度上還原樣本間的實際差異。在這排序過程中,每一坐標軸對原始數據中樣本差異的解釋比例依次下降。

因此,通常選取PCA分析得到的前二維(PC1和PC2)或三維(PC1、PC2和PC3)數據作圖,可以得知群落樣本的主要分布特徵,從而量化樣本間的差異和相似度。

使用R軟體,基於euclidean相異係數計算結果,對OTU水平的群落組成結構進行PCA分析,並以二維或三維圖像描述樣本間的自然分布特徵。如樣本的物種組成越相似,它們在PCA圖中的距離越接近。

圖2 PCA分析二維排序圖

註:一個點代表一個樣本,不同顏色的點屬於不同樣本(組)。選取前兩個主成分PC1和PC2作圖,坐標軸括號中的百分比代表了對應的主成分所能解釋的原始數據中差異的比例(方差貢獻率)。十字交叉線僅作為0點基線存在,起到輔助分析點作用,並無實際意義。橫、縱坐標軸的刻度是相對距離,也無實際意義。點與點空間距離表示物種組成結構的差異程度。

圖3 PCA分析三維排序圖

註:一個點代表一個樣本,不同顏色的點屬於不同樣本(組)。選取前三個主成分PC1、PC2和PC3作圖,坐標軸括號中的百分比代表了對應的主成分所能解釋的原始數據中差異的比例(方差貢獻率)。點與點空間距離表示物種組成結構的差異程度。

3、PCOA分析

PCoA(Principal coordinateanalysis,主坐標分析)是一種經典的MDS分析方法(Ramette, 2007),與PCA最大的差別是PCoA可以基於除歐式距離以外的其他距離尺度評價樣本之間的相似度。PCoA通過對樣本距離矩陣作降維分解,從而簡化數據結構,展現樣本在某種特定距離尺度下的自然分布。

使用R軟體,調用除歐式距離以外的其他距離矩陣,對OTU水平的群落組成結構進行PCoA分析,並以二維或三維圖像描述樣本間的自然分布特徵。如樣本的物種組成越相似,它們在PCoA圖中的距離越接近。

圖4 PCoA分析二維排序圖

註:一個點代表一個樣本,不同顏色的點屬於不同樣本(組)。選取前兩個主成分PC1和PC2作圖,坐標軸括號中的百分比代表了對應的主成分所能解釋的原始數據中差異的比例(方差貢獻率)。十字交叉線僅作為0點基線存在,起到輔助分析點作用,並無實際意義。橫、縱坐標軸的刻度是相對距離,也無實際意義。點與點空間距離表示物種組成結構的差異程度。

圖5 PCoA分析三維排序圖

註:一個點代表一個樣本,不同顏色的點屬於不同樣本(組)。選取前三個主成分PC1、PC2和PC3作圖,坐標軸括號中的百分比代表了對應的主成分所能解釋的原始數據中差異的比例(方差貢獻率)。點與點空間距離表示物種組成結構的差異程度。

4、NMDS分析

NMDS與PCoA類似,也是一種基於樣本距離矩陣的多維尺度分析方法,與PCoA不同的是,NMDS不再依賴特徵根和特徵向量的計算,而是通過對樣本距離進行等級排序,使樣本在低維空間中的排序儘可能符合彼此之間的距離遠近關係(而非確切的距離數值)。因此,NMDS分析不受樣本距離的數值影響,僅考慮彼此之間的大小關係,是非線性的模型,對於結構複雜的數據,排序結果可能更穩定。

使用R軟體,調用任意距離矩陣,對OTU水平的群落組成結構進行NMDS分析,並以二維或三維圖像描述樣本間的自然分布特徵。如樣本的物種組成越相似,它們在NMDS圖中的距離越接近。

圖6 NMDS分析二維排序圖

註:一個點代表一個樣本,不同顏色的點屬於不同樣本(組)。十字交叉線僅作為0點基線存在,起到輔助分析點作用,並無實際意義。橫、縱坐標軸的刻度是相對距離,也無實際意義。Stress是反映NMDS分析結果優劣的指標,通常認為stress<0.2時可用NMDS的二維點圖表示,其圖形有一定的解釋意義;當stress<0.1時,可認為是一個好的排序;當stress<0.05時,則具有很好的代表性。點與點空間距離表示物種組成結構的差異程度。

5、聚類分析

聚類分析主要指層次聚類(Hierarchical clustering)的分析方法,以等級樹的形式展示樣本間的相似度,通過聚類樹的分枝長度衡量聚類效果的好壞。與MDS分析相同,聚類分析可以採用任何距離評價樣本之間的相似度。常用的聚類分析方法包括非加權組平均法(Unweighted pair-groupmethod with arithmetic means,UPGMA)、單一連接法(single-linkage clustering)、完全連接法(complete-linkageclustering)和平均連接法(average-linkage clustering)等。

通常,為了更深入地了解 PCoA 的結果,分別基於 Weighted Unifrac 距離矩陣和 Unweighted Unifrac 距離矩陣,通過 UPGMA(非加權組平均法)方法對樣品進行聚類分析,並將聚類結果與各樣品在門水平上的物種相對豐度整合展示。

圖7 非加權組平均法樣本層次聚類樹

註:左側是UPGMA聚類樹結構,每個分支代表一個樣本,右側是各樣本在門水平的物種/功能相對豐度柱狀圖。圖中左下角的圖例為距離標尺,兩樣本在聚類樹上點分支距離越短,表明它們的群落結構越相似。

以上就是美格基因對於擴增子-β多樣性分析介紹的全部內容了,更多的精彩高分文章都在美格基因公眾號。

您可能還喜歡:乾貨‖擴增子—α多樣性分析

擴增子-環境因子關聯分析

擴增子-物種注釋四部曲

擴增子裡妥妥的C位是它,你想到了嗎?

相關焦點

  • 基於擴增子與GeoChip 5.0 聯合分析的噬菌體與原核微生物群落研究
    圖2 (A) 噬菌體豐度、 (B) 原核微生物豐度、 (C) 噬菌體α多樣性、(D) 原核微生物α多樣性的時空變化註:BJ: Beijing samples; QD: Qingdao samples; Ningbo-M: samples from Ningbo anaerobic digester maintained at mesophilic temperature
  • 課程免費領取 | 微生太擴增子分析第一節:α多樣性分析及繪圖
    通過檢測16S rDNA的序列變異和豐度,可以了解環境樣品中群落多樣性信息。基於16S rDNA的分析在微生物分類鑑定、微生態研究等方面起到重要作用,目前是研究海洋、土壤、腸道糞便等環境中的微生物群落構一種重要普遍的研究方法。針對擴增子測序的統計分析流程,我們製作了8節免費系列分析課程來對擴增子分析進行介紹。
  • 人類微生物組研究設計、樣本採集和生物信息分析指南
    接下來,我們討論了微生物組研究中常用的統計分析方法,重點關注多重比較的問題以及組間β多樣性分析的方法。最後,我們介紹了生物信息學分析的具體流程。總之,嚴謹的研究設計是獲得有意義結果的關鍵步驟,而適當的統計方法對於準確解釋微生物組數據很重要。通過閱讀這篇文章,研究者能獲得研究設計、樣本採集和生物信息分析等全方位的微生物組學知識。
  • Cell | 翻譯後修飾介導tau蛋白致病性的分子結構多樣性 ​
    翻譯後修飾(posttranslational modification,PTM)或是解釋tau病多樣性的原因之一,多種tau蛋白的PTM已經被鑑定,而且不同的tau病中檢測出不同的翻譯後修飾譜【2】。目前的假設是胺基酸序列的翻譯後修飾將調節tau單體的構象狀態,並在tau纖維的結構中表現出來,進而導致tau病多樣性。
  • 與紐約市原汙水相關的原生生物多樣性模式
    Patterns of protist diversity associated with raw sewage in New York City與紐約市原汙水相關的原生生物多樣性模式作者:Julia M. Maritz, Theresa A. Ten Eyck, S. Elisabeth Alter, Jane M.
  • 【科普】種質資源——遺傳多樣性分析
    獲得基因分型之後,我們可以藉助一系列的數據分析軟體對標記基因型進行分析。遺傳多樣性分析軟體主要有:POWERMARKER3.0、Genalex6.2、NTSYSPC2.10e、POPGene32,STRUCUTRE V2.0和CLUMPP2.0等(後續會介紹軟體的使用方法)。
  • 微生物群落多樣性測序與功能分析
    對微生物群落進行測序包括兩類,一類是通過16s rDNA,18s rDNA,ITS區域進行擴增測序分析微生物的群體構成和多樣性;還有一類是宏基因組測序,是不經過分離培養微生物,而對所有微生物DNA進行測序,從而分析微生物群落構成,基因構成,挖掘有應用價值的基因資源。
  • ​R語言計算群落多樣性分析中常見Alpha多樣性指數
    上篇已經對群落多樣性分析中的幾種常見Alpha多樣性指數的概念作了普及。
  • 北林大「全國高校黃大年式教師團隊」在生物多樣性形成機制上取得...
    大樣地與網格樣地構成點面結合的研發平臺團隊通過研究,為東北森林生物多樣性緯向梯度格局提供了機制性的解釋。研究區橫跨暖溫帶、中溫帶及寒溫帶,不同氣候帶之間的生態過渡區通常具有較大的環境變異性,從而導致較高的物種周轉率。
  • 尹玉新團隊發現抗癌基因 PTEN 家族新成員 PTENβ
    PTENβ定位於核仁, 參與調控 rDNA 轉錄和核糖體生成,從而抑制腫瘤細胞生長。該研究成果於 2017 年 3 月 23 日在線發表於 Nature Communications,論文題目為「PTENβ is an alternatively translated isoform of PTEN that regulates rDNA transcription」。
  • Cell | 共生微生物通過誘導IFN-β調節抗病毒感染
    隨著DNA測序技術和生物信息學的進步,在過去的20年中,我們對微生物群的多樣性和動態變化了解得越來越多。IFN-I反應,並闡述了特定共生微生物誘導IFN-β的分子機制。(ISG)的表達情況,發現最主要的共生微生物定植場所胃腸道、以及脾臟和淋巴結中的ISG表達均受影響,並利用IFN-β敲除小鼠模型證明了共生微生物通過IFN-β局部和全身性地調節IFN-I反應;隨後,研究人員利用IFN-β-YFP報告基因小鼠發現IFN-β主要表達在結腸LP的DC上,並分離不同組織的DC後檢測進行確認。
  • β-氨基烯丙醛衍生物合成研究獲進展
    中國科學院廣州生物醫藥與健康研究院朱強博士組在利用銅/鐵共催化的炔丙基胺衍生物通過類Meyer−Schuster重排反應合成β-氨基烯丙醛衍生物方面取得新進展
  • 植物所在土壤細菌群落多樣性和酶動力學過程研究中獲進展
    人類活動導致的氮沉降上升威脅著全球陸地生態系統生物多樣性。土壤細菌群落多樣性佔陸地生物多樣性的很大比例,對於調節陸地生物地球化學循環和生態系統功能至關重要。已有研究發現,土壤細菌群落多樣性和結構受植物群落的影響,但不確定土壤細菌對氮沉降的響應是否與地上植物群落的響應一致。
  • 國家微生物中心精品網課:鄧曄 微生物生態與組學大數據分析
    國家微生物科學數據中心特別邀請我國微生物組學技術及大數據領域十位名師,推出網絡系列精品課程,本期邀請中國科學院生態環境研究中心鄧曄研究員分享《微生物生態與組學大數據分析》。團隊研究內容環境微生物組的檢測技術熱點宏基因組技術的開發功能基因擴增子高通量測序方法構建的功能基因資料庫
  • 醫學部基礎醫學院尹玉新團隊發現抗癌基因PTEN家族新成員PTENβ
    北京大學醫學部基礎醫學院系統生物醫學研究所尹玉新教授課題組最近取得研究突破,首次鑑定出抗癌基因PTEN家族的新亞型蛋白PTENβ。PTENβ定位於核仁,參與調控rDNA轉錄和核糖體生成,從而抑制腫瘤細胞生長。
  • 十年一劍 歐陽證帶領清譜科技推出Mini β小型質譜分析系統
    10月11日上午,清譜科技2017產品發布會成功舉行,會議上隆重推出了三款新品,包括脂質組學雙鍵定位系統Ω反應器、MS Mate快速檢測方案及Mini β小型質譜分析系統。Graham Cooks和歐陽證教授的團隊就推出了用於氣相分析的小型化質譜技術。此後十餘年時間,歐陽證教授帶領研發團隊進行了13次產品迭代更新,在2017年推出了具備非揮發性物質檢測能力的Mini β 小型質譜分析系統,填補了國際市場上小質譜非揮發有機物檢測的空白。十年一劍,本產品於清譜科技2017產品發布會上正式推出,儀器信息網對發布會進行了全程報導。
  • 微生物多樣性16S+宏基因組的組合您見過嗎?| 醫學篇
    前言很多老師會遇到這樣的問題:通過微生物多樣性測序可以篩選到關注的差異菌群,但想要進行功能研究該如何做呢?;extreme:挑選β多樣性最極端的樣本;representative:挑選β多樣性最能反映整體差異特徵的代表性樣本;