今天給大家介紹雲平臺宏基因組個性化分析之一:物種與功能網絡與模型預測分析。
物種與功能網絡與模型預測分析
物種與功能網絡與模型預測分析是針對特定的研究對象和目的,對特定的樣品及其數據集進行關聯與模型預測分析,進一步挖掘數據中的有效信息。此項屬於個性化分析,通常需要雙方溝通評估。
Network分析
1、共線性網絡
共現性網絡分析可以用來展示樣本與物種/功能之間的分布情況,通過對不同樣本間的物種/功能豐度信息進行相關性分析,可以獲得物種/功能在環境樣本中的共存在關係,能夠凸顯出樣本之間的相似性和差異性,針對大型複雜的數據來說是一種非常有效的方式。該分析步驟根據樣本之間共有的物種生成聚類,也即共有的物種越多,樣本之間的關係越接近。
共線性網絡圖示例:
在網絡圖中有兩類節點(node),一類是species-node,一類是sample-node,如果有一個物種在一個樣本中出現的話,那麼該物/功能種與樣本之間就有一條連線(edge)。
2、相關性網絡
基於物種/功能樣本間的相對豐度,使用R軟體計算pearson或spearman相關係數,獲得樣本內或樣本組內的物種/功能之間的相互關係,然後用展示物種間/功能相互關係的可視化軟體進行物種相互作用network構建及展示。
1、【相關性計算方法】選擇合適的相關性計算方式
2、【相關係數閾值】設定合適的相關性係數的閾值
3、【環境因子表格】可以選擇是否上傳並使用環境因子表格
4、【網絡圖相關數據】可以下載網絡圖相關數據,利用Cytoscape對網絡圖進行重新繪製。
相關性網絡圖示例:
圓圈代表一個物種,大小代表其相對豐度,不同的顏色代表不同的物種/功能分類,圓圈之間的線條代表這兩個物種/功能間的相關性,線條的粗細代表相關係數的大小。
Random_Forest分析
隨機森林算法(Random Forest,RF)是一種新興起的高度靈活的機器學習算法,它是由Leo Breiman和Cutler Adele 在2001年開發完成的一種數據挖掘方法,常用於建立預測模型。此分析點非常全面且操作性很大,可自行選擇是否結合兩組/多組差異分析(多種檢定方法)挑出的顯著物種/功能,再搭配自行設定隨機比例/自行選取訓練集及驗證集,進行隨機森林分析。
1、【分析類型選項】選擇分析類型的選項
2、【驗證方法選項】選擇驗證方法的選項
3、【決策數數量】數量越多結果預測越可靠,但預測速度也會變慢,默認值是500
您可能還喜歡:
雙喜迎新 蓄勢騰飛|美格基因啟動IPO&壹健生物正式落戶蘇州
產品升級|美格基因重磅推出微生物組+代謝組聯合分析解決方案