可用於分析微生物與代謝產物之間相互作用的人工神經網絡

2020-10-18 谷禾信息

最近, 國際頂級方法學期刊《Nature Methods》發表了由加利福尼亞大學聖地牙哥分校兒科、加州大學計算機科學與工程系 、加州大學合作質譜創新中心以及加利福尼亞大學聖地牙哥分校微生物群創新中心 多學科合作研究的最新成果:「Learning representations of microbe–metabolite interactions(可用於分析微生物與代謝產物之間相互作用的人工神經網絡)」,此項研究恢復微生物與代謝物之間關係的能力,並證明了該方法如何發現微生物產生的代謝產物與炎症性腸病之間的關係。

摘要

研究人員表示,整合多組學數據集對於微生物組研究至關重要。但是,推斷整個組學數據集之間的交互具有多種統計學上的挑戰。文章中通過使用神經網絡來解決了此問題,其能夠在存在特定微生物的情況下估算每個分子存在的條件概率。研究人員以已知的環境(沙漠土壤溼潤生物結殼)和臨床(囊性纖維化肺)實例為例,展示了這一方法恢復微生物與代謝物之間關係的能力,並證明了該方法如何發現微生物產生的代謝產物與炎症性腸病之間的關係。

背景

雖然已經有廣泛的努力來開發整合多組學數據的方法,但一些概念上的挑戰限制了整合不同組學數據的技術,例如,將微生物測序和非靶向質譜聯繫起來。因此,需要新的方法來處理不同的數據類型。為此,研究人員提出了「mmvec」(微生物-代謝物載體),一種神經網絡,可以從單個微生物序列預測整個代謝物豐度曲線。通過迭代訓練,mmvec可以學習微生物和代謝物之間的共現概率。微生物-代謝物相互作用可以通過標準的降維界面進行排序和可視化,從而產生可解釋的結果。

主要結果

使用模擬囊性纖維化生物膜的數據集,將mmvec與Pearson’s、Spearman’s、SPIEC-EASI、SparCC和proportionality方法進行基準比較。證明了mmvec優於所有旨在推斷成對微生物-代謝物豐度數據集之間相互作用的現有工具。

圖a.兩個微生物和多個分子之間的相互作用被模擬成單分子動力學和擴散過程,(發酵劑由θf表示,銅綠假單胞菌由θp表示)從推導的微分方程模擬的微生物和代謝物的絕對豐度,圖b. 為圖a.中絕對豐度的比例。這裡模擬了五種代謝物,即糖(SG)、抑制劑(I)、酸(F)、銨(P)和胺基酸(SA)

圖c. 在每種微生物的前100個代謝產物中,使用 F1 score、precision(精確率)和recall curves(召回率)比較了mmvec與Pearson’s、Spearman’s、SparCC、SPIEC-EASI(生態關聯的稀疏逆協方差估計與統計推斷)、比例度量(φ和ρ)。圖中表示mmvec和SPIEC-EASI的隨機表現(Random)優於其它所有工具,其中mmvec表現最好。

圖d.從絕對豐度和從所有基準測試方法獲得的相對豐度的係數比較。圖中顯示mmvec是唯一對比例偏差具有魯棒性的方法。這對於保持絕對豐度和相對豐度之間的一致性至關重要,否則可能導致虛報假陽性和假陰性。

2.沙漠土壤生物潤溼事件,測試mmvec是否可以解決微生物-代謝物相互作用中無法解釋的差異。結果是mmvec解決了陰道分枝桿菌釋放的體外驗證代謝物與環境樣品的測序和質譜分析之間的衝突發現。

圖a. 陰道分枝桿菌-代謝物相互作用的比較,根據Spearman『s和mmvec估計(n = 19個樣品)。由陰道分枝桿菌釋放的所有經實驗驗證的代謝物都被標記。所有與生物潤溼實驗結果和體外實驗結果相矛盾的代謝物都用紅色突出顯示。Spearman『s標記的13個標籤中有7個具有負相關性,表明這些分子被陰道分枝桿菌消耗而不是釋放。

圖b. 經實驗驗證的分子在不同統計方法中的檢測率的基準比較。mmvec具有相當高的真陽性率。

圖cd. 陰道分枝桿菌(c)和4-胍丁酸(d)在生物潤溼事件後的比例

MMVEC和Spearman's之間的衝突結果可以用生物潤溼後微生物生物量的增長(c)和可用資源(d)的轉移來解釋。

3. 囊性纖維化患者的肺粘液微生物組研究,進一步驗證mmvec是否可以檢測已知的微生物-代謝物相互作用。結果表明mmvec可以可靠地識別由銅綠假單胞菌產生的所有經實驗驗證的感興趣的分子。

圖a.依據mmvec在囊性纖維化數據集中估計的條件概率做的雙標圖。箭頭代表微生物,圓點代表代謝物。x軸和y軸表示由mmvec (n = 138個樣本)估計的微生物代謝產物的條件概率的奇異值分解(SVD)的主成分(PCs)。點之間的距離量化了代謝物之間的共現強度,較小的距離表明代謝物有很高的共現概率。箭頭尖端之間的距離可以量化微生物之間的共現強度。箭頭的方向性可以用來確定哪些微生物可以解釋代謝產物的共現模式。綠色箭頭表示推測的囊性纖維化病原體,黃色箭頭表示已知的厭氧菌。只有銅綠假單胞菌產生的已知分子被標記。mmvec清楚地分離了厭氧菌和病原體,左側是已知的厭氧微生物,右側是顯著的病原體。

圖b.從mmvec學習到的第一主成分與代謝物在氧梯度上的對數倍數變化之間存在負相關 ( Pearson『s r=−0.59,P=1.8×10−44,n=442個分子)。Pearson『s法未發現氧梯度與第一微生物主成分之間的這種相關性(r=0.11,P=0.16,n=138個分子)。

圖c. 第一主成分與樣本數量的關係,其中分類群是該樣本中最豐富的分類群。

圖d. 銅綠假單胞菌和鏈球菌最豐富的樣品的熱圖(log ratio t test = 6.51, P = 4.4 × 10−8, n = 49 個樣本)。這提供了證據表明,在本研究的背景下,代謝組學特徵在很大程度上受到最豐富的微生物的影響。

圖e. 與銅綠假單胞菌和鏈球菌共生的前100個代謝物分子的熱圖。圖中表示僅是預測銅綠假單胞菌代謝物譜就可以解釋這些樣品中10%的代謝物變異(r = 0.319, P = 1.18×10−11,n = 442個分子)。

4.膽汁酸研究。證明mmvec能夠在複雜的生物系統中進行探索性分析,並簡化特定代謝物的微生物來源的發現

圖a. 微生物共生模式的可視化,其中點之間的距離近似於微生物之間的Aitchison距離,它量化了微生物發生的情況。較小的距離表明微生物具有很高的共生概率。微生物根據它們與HFD(高脂肪飲食)的關聯被著色,這是通過多項式回歸用差異豐度分析估計的。mmvec的使用顯示了與HFD相關的不同微生物群。

圖b. 微生物-代謝物相互作用的雙圖,代謝物根據它們與HFD的關聯而著色。HFD關聯性通過多項式回歸的差異豐度分析進行估計。點之間的距離近似代謝物之間的Aitchison距離,箭頭間距近似微生物之間的Aitchison距離。表明mmvec根據飲食對質譜數據進行了清晰的分層。

5.炎症性腸病中微生物-代謝產物的相互作用。結果表示mmvec能夠確定IBD研究中對代謝物豐度最強的微生物貢獻,並發現了在最初的研究中被遺漏的一種微生物(Propionibacterium)


圖a.和圖b.分別為在三種菌屬Klebsiella,Roseburia和Clostridium bolteae存在的情況下,推斷各種膽汁酸(a)和肉鹼(b)的條件概率的熱圖

圖c.從宏基因組的概要文件和C18負離子模式LC-MS中學習到的微生物-代謝物相互作用的多組學雙圖。微生物(箭頭)和代謝物(球體)根據多項式回歸估計的差異著色。Klebsiella似乎與IBD密切相關,而Propionibacterium有強烈的負相關。

圖d. 前300條邊緣的網絡,只有包含Klebsiella和Propionibacterium的邊緣可見。

結論

作者表示,鑑於這些發現,目前的方法仍有局限性。目前還不清楚如何使用共現概率來獲得相互作用的統計意義。同樣,還不能計算每個微生物-代謝物相互作用強度的置信區間,還需要理論工作來處理連續值的輸入。

Tips:文章末尾有關於mmvec算法的推導公式。

相關焦點

  • 人工神經網絡發展歷程及特點
    人工神經網絡ANN簡稱為神經網絡或類神經網絡。深度學習實際上是深度神經網絡DNN,即深度學習從人工神經網絡ANN模型發展起來的,因此有必要對人工神經網絡ANN作進一步探討。 人工神經網絡ANN從信息處理角度對人腦神經元網絡進行抽象,建立某種簡單模型,按不同的連接方式組成不同的網絡。人工神經網絡ANN是一種運算模型,由大量的節點(或稱神經元)之間相互聯接構成。每個節點(神經元)代表一種特定的輸出函數,稱為激勵函數(activation function)。
  • 史丹福大學實現高性能低功耗人工突觸,可用於神經網絡計算
    現在,史丹福大學和桑迪亞國家實驗室的研究人員取得了重要進展,該研究可以幫助計算機模擬某塊大腦高效設計,亦即人工突觸。Alberto Salleo,材料科學與工程學副教授,研究生 Scott Keene 在確知用於神經網絡計算的人工突觸的電化學性能。他們是創造這一新設備團隊的成員。
  • 微生物所創製出用於高效生物製造的「Y型人工菌群」
    利用微生物將生物質原料轉化為燃料、材料和化學品是生物製造領域的研究熱點,其關鍵挑戰是如何實現生物質中葡萄糖等六碳糖和木糖等五碳糖的同等高效利用。  已經有很多研究嘗試對單一菌株的代謝途徑進行改造,或採用不同的菌株進行分工合作,以實現五、六碳糖的同步利用。但受限於五碳糖不能被高效利用,目標化學品的生產效率普遍不高。
  • AI的人工神經網絡
    人工神經網絡是模擬人和動物的神經網絡的某種結構和功能的模擬,所以要了解神經網絡的工作原理,所以我們首先要了解生物神經元。其結構如下圖所示:   對於從同一樹突先後傳入的神經衝動,以及同一時間從不同樹突輸入的神經衝動,神經細胞均可加以綜合處理,處理的結果可使細胞膜電位升高;當膜電位升高到一閥值(約40mV),細胞進入興奮狀態,產生神經衝動,並由軸突輸出神經衝動;當輸入的衝動減小,綜合處理的結果使膜電位下降,當下降到閥值時。細胞進入抑制狀態,此時無神經衝動輸出。
  • 人工神經網絡及其應用
    1 人工神經網絡的發展歷史及其意義1.1 人工神經網絡的發展歷史神經網絡的發展可以追溯到19世紀末,其發展可以分為四個階段。2 人工神經網絡的種類及應用領域2.1人工神經網絡的種類人工神經網絡的模型很多,可以按照不同的方法分類進行分類。其中比較常用的分類方法是,按網絡連接的拓撲結構分類和按網絡內部的信息流向分類。
  • 最新研究進展 | 行為和神經退行性疾病中的腸道微生物分子
    其中許多可穿過血腦屏障,因此源自腸道的循環色氨酸代謝產物可有助於大腦中的水平。吲哚衍生物(如吲哚丙酸)具有抗氧化性能,使其成為阿爾茨海默氏病的誘人靶標,而其他衍生物(如吲哚酚硫酸鹽)在慢性腎臟疾病模型中誘發神經炎症。
  • 最新研究進展 | 行為和神經退行性疾病中的腸道微生物分子|微生物...
    其中許多可穿過血腦屏障,因此源自腸道的循環色氨酸代謝產物可有助於大腦中的水平。吲哚衍生物(如吲哚丙酸)具有抗氧化性能,使其成為阿爾茨海默氏病的誘人靶標,而其他衍生物(如吲哚酚硫酸鹽)在慢性腎臟疾病模型中誘發神經炎症。
  • 微生物16S+代謝組學文章喜登微生物一區頂刊Microbiome
    (2)16S rRNA基因測序分析;(3)代謝組學實驗:LC-MS非靶向代謝組學分析,胺基酸\神經遞質LC-MS靶向分析,5-磷酸吡哆醛、吡哆胺和吡哆醇靶向分析同時4周齡的KO小鼠表現出刻板行為增加和對社交氣味興趣降低,進一步暗示異常行為與EphB6缺失小鼠中腸道微生物紊亂之間的可能關係。
  • 用於英文字母識別的三種人工神經網絡的設計
    摘要分別採用單層感知器、BP網絡和霍普菲爾德網絡三種神經網絡對26個英文字母進行識別,通過實驗給出各網絡的識別出錯率,從中可以看出三種人工神經網絡各自的優缺點,為選擇神經網絡進行字符識別提供了一定的依據。
  • 對人工神經網絡「開刀」,利用神經科學消融法檢測人工神經網絡
    但大部分人認為,黑箱問題需要被解決,當我們將神經網絡應用到一些對安全性,穩定性要求很高的行業,如醫療,我們就必須進行精準控制,出現錯誤或問題時,我們要對內部結構進行分析改正,這時黑箱問題就希望得到解決。
  • 人造突觸問世,可用於搭建神經網絡
    科學家用有機材料製成了人工突觸,可模仿神經元之間的信息傳遞。多年以來,雖然計算機技術飛速發展,但是科學家們仍然難以構建出高效而精巧的大腦仿生計算機。過去,科學家在這個領域努力耕耘,基於人工智慧算法建立了高性能的神經網絡,但因為目前算法仍然依賴於能耗較高的傳統計算機硬體,所以還遠遠稱不上模擬人腦。構建大腦在學習時,大腦中的神經元之間會傳遞電信號。這其中,信號在突觸之間的首次傳遞是最耗能的。此後的每一次,所需的能量都會減少。
  • 深度|人工神經網絡深入分析
    本文與吳老師的講解方式不同,筆者希望能從神經網絡的起源揭開神經網絡的面紗,從而幫助更多的對神經網絡感興趣但卻沒有相關理論基礎的朋友們。說起人工神經網絡的起源肯定要追溯到生物的神經網絡。在簡單情況下可以是一個高斯函數、邏輯函數、雙曲線函數或者甚至上是一個線性函數。利用神經網絡可讓其實現三個基本功能:與、或、非(AND, OR, NOT)。
  • LC-MS代謝組學對阿爾茨海默病腸道微生物資料庫全面研究
    腸道微生物在宿主健康中起著重要的作用,與很多疾病(如癌症、糖尿病、肥胖、神經發育障礙等)的發生發展有密切的關係,寄主和共生腸道微生物在食物和異物物質的代謝過程中共同產生大量的代謝物。腸道微生物的種類以及功能的不同會對存在於宿主的體液以及組織中的小分子代謝物的種類和數量產生重要的影響。
  • 腦科學日報:腸道微生物或可防輻射;吸菸與精神問題有什麼關係?
    3,《科學》突破性發現:腸道微生物或可防輻射 來源:小柯生命 Ting研究組,利用輻射倖存者的多組學分析發現了能夠輻射保護的微生物和代謝物。研究成果發表在10月30日出版的《科學》上。 研究人員調查了從高劑量輻射中恢復到正常壽命的小鼠種群。細菌類群Lachnospiraceae和Enterococcaceae成員的豐度升高與放射後造血功能恢復和胃腸道修復有關。
  • Nature | 微生物膽酸代謝產物調節腸道RORγ + 調節性T細胞穩態
    人體腸道微生物群編碼的代謝流可以通過各種各樣的生物活性分子與宿主之間不斷產生相互作用。然而,上述這種宿主-微生物通過膽酸介導的相互作用網絡對後天的適應性免疫系統的影響仍然需要進一步闡明。因此,作者在本篇文章研究中發現飲食和微生物因素都能夠影響腸道BA池的組成,且可以調控結腸中的一類表達轉錄因子RoRγ的FOXP3+調節性T細胞(Treg)的群體水平。
  • 這可能取決於腸道微生物!
    2019年6月30日訊 /生物谷BIOON /——人體微生物群落是一個複雜的微生物生態系統,其組成對人的終身健康起著至關重要的作用。然而,人們對健康狀況與腸道微生物群之間的具體分子機制知之甚少。
  • 科技:人工神經網絡的進步
    這些重大新故事中的一些與人工神經網絡有關,人工智慧研究中的一個相對較新的現象正在推動從娛樂到醫學等許多領域的各種進步。人工神經網絡依賴於這樣的思想:技術可以使用對應於個體人類神經元和神經元組的小單元來模擬人類大腦的生物學工作,以基於輸入產生輸出。
  • 你的大腦與人工神經網絡有本質區別嗎?答案令人驚訝!
    經過幾十年的開發,研究人員創建了深層神經網絡,在特定的任務達到甚至超過了人類的表現。 但是,用於深度學習的人工神經網絡是否類似於我們大腦中的生物神經網絡?這個問題困擾著無數人工智慧的研究者。 許多人認為人工神經網絡是對大腦結構的粗略模仿,人工神經網絡只是個統計推理引擎,大腦的許多功能都沒有。
  • 初識人工神經網絡
    這也就是神經網絡的魅力所在。人工神經網絡(artificial neural networks) 是一種模仿生物神經網絡行為特徵,進行信息處理的算法數學模型。在人工神經網絡模型中使用單元節點模擬神經元,通過調整神經網絡內部大量節點(神經元)之間相互連接的權重來達到處理信息的目的。
  • 胖不胖:看人工神經網絡怎麼「稱」
    總計測試了1000人,其中男女各500人,年齡在20歲至76歲之間,體質指數(BMI)在16.2—42.7 kg/m2之間。進一步線性相關分析發現,三個公式同Inbody3.0儀器測試均呈現出顯著的相關關係。相比原公式推導時的驗證的相關係數,本次實驗數據均達到或超過了原實驗的相關係數,可以看出三個經典方程對於估測體脂百分比均有較好的效度。