6. 基於OTUs的距離計算

2021-02-13 生信小札記

## 簡介

生態相似性(Ecological resemblance)以計算樣方之間的群落組成相似程度或相異程度(距離)為基礎,是處理多元生態數據的基本方法之一。在群落數據分析中,對於兩個共享相同物種的群落,如果所有物種的豐度也一致,那麼這兩個群落就具有最高的相似程度(或最低距離0),常用其反映Beta多樣性。

**數據樣式**:常見OTU豐度表,列為樣本,行為OTU,交叉區域為每種OTU在各樣本中的豐度。

otu_table  <-  read.delim("16S-amplicon-analysis/otutab.txt",   header=T, sep="\t", row.names=1, stringsAsFactors = FALSE)
Transp_otu <- t(otu_table )library(vegan)
jacc_dis <- vegdist(Transp_otu , method = 'jaccard', binary = TRUE)jacc_sim <- 1 - jacc_dis
eucl_dis <- vegdist(Transp_otu, method = 'euclidean') otu_chord <- decostand(Transp_otu, method = 'normalize')chord_dis <- vegdist(otu_chord, method = 'euclidean') otu_hell <- decostand(Transp_otu, method = 'hellinger')hell_dis <- vegdist(otu_hell, method = 'euclidean') bray_dis <- vegdist(Transp_otu, method = 'bray')bray_sim <- 1 - bray_dis
bray_dis<- as.matrix(bray_dis)write.table(bray_dis, "bray_curtis_distance.txt", col.names = FALSE, sep = '\t', quote = FALSE)

Beta多樣性研究中,最常見的是用Weighted Unifrac 距離或者Unweighted Unifrac 距離來衡量兩個樣本間的相異係數,其值越小,表示這兩個樣本在物種多樣性方面存在的差異越小,常常直接進行熱圖可視化或利用對角線熱圖在同一面熱圖上展示差異度。

library(phyloseq)
otu_table <- read.delim("16S-amplicon-analysis/otutab.txt", header=T, sep="\t", row.names=1, stringsAsFactors = FALSE)tree <- read_tree('otu_tree.tree')
physeq <- phyloseq(otu_table(otu, taxa_are_rows = TRUE), phy_tree(tree)) wei_unif_dis <- distance(physeq, method = 'wunifrac')
unwei_unif_dis <- distance(physeq, method = 'unifrac')

除熱圖外,Weighted Unifrac 距離或者 Unweighted Unifrac 距離還可以通過箱線圖直觀的反映組內物種多樣性的中位數、離散程度、最大值、最小值、異常值。同時,亦通過T-test檢驗,wilcox秩和檢驗和anova檢驗(TukeyHSD對組間進行檢驗),分析組間物種多樣性差異是否顯著。

相關焦點

  • MPB:中科院微生物所蔡磊組-​基於擴增子數據的系統發育樹的構建和展示
    本文主要介紹基於IQ-TREE、MUSCLE、 USEARCH10等軟體的下載安裝、使用方法和步驟以及結果分析,實現從擴增子數據集的提取、數據處理到系統發育樹的構建和美化等流程,方便研究者能更高效準確地實現基於擴增子數據的系統發育樹構建以及下遊系統發育樹的編輯和展示,為發表高水平研究論文提供技術支持。
  • 基於FIFO的目標距離脈衝模擬電路
    在雷達模擬器中,目標航路通常是由計算機實時計算產生的。如何將實時計算的目標距離數據轉化為模擬的目標回波是設計雷達模擬器需要解決的關鍵問題之一。對高重複頻率的雷達而言,由於存在距離模糊,雷達通常使用多個不同的重複頻率,這就要求回波模擬電路必須具備適應不同重複頻率的功能,而且在雷達切換重複頻率的瞬間模擬電路必須能夠快速適應。
  • 基於混合雲霧計算的物聯網架構
    雲計算是聚合度很高的計算服務,其使用方式雖然廉價、簡單且方便,但云伺服器遠離行動裝置,數據傳輸的距離大,導致延遲和通信開銷增大甚至不可容忍[3-4]。物聯網終端設備和用戶終端設備基本都是能量受限的,將數據傳到遠程雲中心執行,會導致物聯網終端能耗過大而過早失效,或用戶終端設備待機時間大大減小。
  • 常用的相似度和距離計算方法
    歐幾裡德距離計算多維空間各個點的絕對距離,又稱L2範數距離。同類型的還有曼哈頓距離,明可夫斯距離等。適用場景使用歐式距離計算距離的時候,需要消除量綱問題。因為計算是基於各維度特徵的絕對數值,所以歐氏度量需要保證各維度指標在相同的刻度級別,比如對身高(cm)和體重(kg)兩個單位不同的指標使用歐式距離可能使結果失效。同時參考餘弦距離的適用場景。
  • 基於LLVM的內存計算
    最近業界有很多技術和產品都被認為屬於內存計算的範疇,並且大家都覺得內存計算是未來大數據方面的核心技術,特別是類似Spark和HANA這樣的產品和技術湧現,使得內存計算已經在大數據技術方面成為主流。
  • 小範帶你學空間計量之十:基於經緯度距離的空間權重矩陣設定
    第二步,在經緯度的基礎上計算經緯度距離,並由此設定空間權重矩陣。當然,如果後續需要進行面板數據空間計量分析,還需在此基礎上設定時空權重矩陣,小範前幾次更新中已有相關介紹。;% 甘肅省1233個鄉鎮,87個縣,14個市州的空間權重矩陣設計;空間權重矩陣採用經緯度距離平方的倒數;經緯度距離基於xgeocoding批量獲取。
  • 基於超聲波傳感器的社交距離解決方案
    打開APP 基於超聲波傳感器的社交距離解決方案 TDK株式會社 發表於 2020-12-01 16:05:20 作為一種可準確測量員工之間距離的手段,基於超聲波傳感器*1 技術的解決方案引起了人們的關注。 在企業中確保社交距離 為了防止傳染性疾病的傳播,與他人保持安全距離並最大程度減少接觸是十分必要的。對企業來說,降低那些會危及供應鏈、企業聲譽和生產力的感染風險也非常重要,更不用說創造一個讓員工安心工作的環境了。
  • 地球到月球的距離,你知道是如何計算出來的嗎?科學家給出了答案
    什麼是地球到月球間的距離理論上講,從地球到月球的距離是指兩者間中心的距離,而且是可以測量的,但是,通過日常生活中常用的方法來衡量這個距離是不可能的。因此,只能通過三角公式來計算它們間的距離。人們通常談到地球到月球的距離是指平均距離,即:384,399公裡。到達月球的時間宇宙飛船將不得不花費很長的時間飛向月球,而且這種飛行形式並不是以直線飛行。按照第二空間速度(11.2公裡/秒)計算的話,理論上,其飛行時間將需要10個小時,但事實上,花費的時間會更長。
  • 輻射防護的安全距離計算方法及區域劃分
    從一個例子中來說明輻射防護的安全距離計算。假設現場探傷時採用60Ci的Ir192放射源,計算探傷人員距離放射源15米時受到的劑量是多少?查表得f的值0.00925戈·倫-1代入公式(2)D物質/t=1.16×10-3戈/時(3)由(3)可得,探傷人員在15米處的吸收劑量率為1.161.16×10-3戈/時,由於1戈瑞=1焦耳/千克,1希沃特=1焦耳/千克,所以就可以計算出待了多長時間後該人吸收劑量了。
  • NVIDIA發布基於圖靈架構的計算用卡
    在GTC 2018圖形技術大會日本站上,我們的黃教主發布了一款基於圖靈架構的全新計算卡:Telsa T4,一起來看一下。  規格上,其搭配了2560個CUDA核心(基於圖靈架構),這個數字是小於RTX 2080的2944個的,但是高於RTX 2070的2304個。同時他還有320個Tensor核心用於AI計算,而關於RTX實時光線追蹤部分可能由於用途不同而被閹割。  顯存位寬為16GB GDDR6,但帶寬卻只有320GB/s,目測降低了位寬或者頻率。
  • 基於NETFPGA的可重構科學計算平臺
    本項目的研究目標是探索和建立圖形化數學算法向硬體轉換的理論方法,研究開發數學算法向硬體邏輯轉換的工具,與科學計算軟體相結合建立起基於FPGA陣列的科學計算平臺原型。研究目標結構流程如下:目前,可重構計算已有較大發展,主要目標是希望通過硬體可編程,來自適應計算任務的需求,以期達到最佳性能;而且這種硬體結構的變化,能實時地適應計算任務要求的變化。可重構計算的底層技術是FPGA編程技術,可重構計算的優點是硬體設計的實現基於軟體的靈活性,並且保持了傳統的基於硬體方法的執行速度。其體系結構可變的特點,很好地適應了實際應用中的多元化需求。
  • NN中常用的距離計算公式:歐式距離、曼哈頓距離、馬氏距離、餘弦、漢明距離
    3 Mahalanobis馬氏距離馬氏距離的淺顯解釋,見我的博文:https://blog.csdn.net/weixin_41770169/article/details/80759195馬氏距離和歐式距離的對比,見我的博文:https://blog.csdn.net/weixin_41770169/article/details/80759236
  • 輻射防護的安全距離計算方法
    帶著這些疑問我們先來普及下國家對探傷人員個人吸收的劑量的規定:從一個例子中來說明輻射防護的安全距離計算。假設現場探傷時採用60Ci的Ir192放射源,計算探傷人員距離放射源15米時受到的劑量是多少?公式P/t=AKr /R2(1)Kr經查表得0.472R·m2/(h·Ci)已知,A=60Ci,R=15m;帶入式子中計算得:P/t=0.125867(R/h)將空氣中某店的照射率換算成該點被照射物質的吸收劑量率 公式D物質/t=f·P/t(2)式中f---換算因子,或稱轉換係數,它是以「倫琴」
  • 如何計算地球到太陽的距離?
    快來看看吧↓↓↓在克卜勒三定律提出後,人們已經能夠根據太陽系中各個行星的公轉軌道周期之比,計算出各個行星到太陽的距離之比。但是如果不知道地球到太陽的距離,還是沒辦法為度量太陽系找到一把合適的「尺子」。最早「成功」計算地球到太陽距離的是克裡斯蒂安惠更斯。
  • 機器不學習:基於深度學習CNN的短文本相似度計算方案
    機器學習深度學習乾貨棧 www.jqbxx.com基於CNN模型的短文本相似度的計算方法可以大致分為兩類:一類是基於Siamese結構的神經網絡模型,先分別學習輸入的文本對兒的句子向量表達,再基於句子向量計算相似度;另一類是直接以詞語粒度的相似度矩陣作為輸入,學習並計算文本相似度。
  • 大引力場下螺旋光線存在的必然性,光年直線距離不同計算方法1-2
    這個軌道通常用3ct計算。現在的計算方式是3*138=414億光年左右。由於黑洞在萎縮,質量在減小,引力在減小,這個遠方的圓形軌道依然在微微的螺旋性擴散。直到光子衰竭消失或者被宇宙真空「凍結」。這裡舉例用的光子,如果發出來的是r射線呢?這個外圓就會再擴大一些,這被現代的理論稱為量子時空。又增加了幾十光年的半徑。
  • 明日方舟推人距離怎麼算 推人距離計算方法
    在明日方舟中相信許多玩家都有一個疑惑,那就是具有位移的幹員在推吧不同怪的時候距離都是不同的,那麼推怪的距離是如何計算的呢?別著急,今天小編就為大家來解答一番。 推人距離怎麼算 推人的距離是跟推動的怪物質量有關。