微生物組具有服務疾病診治與生態監控的巨大潛力,但是其影響因素錯綜複雜。如何通過菌群檢測實現快速精準的疾病診斷呢?中國科學院青島生物能源與過程研究所單細胞中心發明了基於菌群大數據搜索的疾病檢測方法,為此共性問題提供了原創的解決方案。該工作於3月17日在線發表於mSystems(美國微生物學會會刊)。
作為與生俱來、無處不在的「小夥伴」,微生物組與人體、環境的健康有著千絲萬縷的關聯。同時,菌群檢測具有非侵入性、可量化、可預警等優勢。因此,如何用菌群來判斷和識別人體或環境的健康狀態,一直是精準醫學和大健康的熱點問題之一。但是,作為一種疾病診斷手段,菌群面臨著三個關鍵的挑戰。
首先,「漏診」問題:現有的檢測手段通常只針對特定疾病,並依賴於該疾病已知的標識微生物來構建檢測模型。然而很多疾病尚無明確標識物,而且同一種疾病在不同人群中的生物標識物種經常不盡一致,因此難以普適性地判斷待檢樣本是否健康。其次,「誤診」問題:同一種生物標識經常與多種疾病相關聯,導致難以準確地分辨具體的疾病類型。此外,由於元基因組數據的極端高通量、高度異質性、多種測序平臺共存等特點,菌群診斷模型的構建、訓練和更新,均具有突出的挑戰性。
針對上述關鍵問題,副研究員蘇曉泉帶領的單細胞中心組群生物信息研究組,利用前期開發的微生物組搜尋引擎MSE,發明了基於菌群大數據搜索的疾病檢測新策略(圖1)。與現有基於模型訓練的機器學習手段相比,該方法不再依賴於疾病相關的特定標識微生物,而是利用待測菌群元基因組與已有菌群元基因組大數據的整體相似度來實現檢測。首先,計算待測樣本相對於資料庫中所有健康樣本的異常程度,即可評估其是否健康。其次,與資料庫中的多種疾病的參照樣本進行比對,即可識別具體的患病種類。基於超過3000例腸道菌群樣本的測試表明,針對炎症性腸病(IBD)、結直腸癌(CRC)、愛滋病毒感染(HIV)和腸腹瀉病(EDD)等,MSE在回答「是否健康」和「哪種疾病」這兩個問題上的準確率均超過80%,顯著高於目前常用的機器學習算法,從而有效地降低了「漏診」和「誤診」的可能。另一方面,與常規手段相比,該方法在跨研究、跨測試人群、跨測序平臺、樣品汙染等因素影響下的適應性和抗幹擾能力等方面,也具有顯著優勢。
此外,得益於其強大的高通量菌群結構搜索能力,MSE的使用與百度、谷歌一樣簡單,通常在0.5秒內即能完成診斷。同時,MSE能夠通過其菌群大數據系統的實時更新,來提升檢測的可靠性以及拓寬其適用範圍。因此,隨著微生物組測序數據的爆發式增長,該方法在實際應用中的便捷性、可延展性等特色將愈發突出。
單細胞中心開發的MSE是目前國內外最大的微生物組數據科學研究體系之一,其參照資料庫包括來自腸道、皮膚、口腔、室內環境、海洋、土壤等廣袤生態系統的超過23萬例高質量、標準化、可比較的元基因組樣本。與本研究提出的診斷手段相結合,MSE為建立針對各種慢性疾病或生態災害的菌群診斷系統和幹預手段效能評價體系奠定了一個共性的方法學基礎。(生物谷Bioon.com)
小編推薦會議 2020(第六屆)腸道微生態與健康國際研討會
http://meeting.bioon.com/2020MicIntestin?__token=liaodefeng