編者按:
人工智慧(AI)是當前研究領域的熱點。然而,最近越來越多的研究者開始嘗試將 AI 應用於另一個熱門領域——微生物組研究。
由於微生物組數據的龐大性和複雜性,研究人員在解析微生物組數據的時候面臨著巨大的挑戰。而 AI 為研究人員提供了一種分析微生物組數據的新工具,藉助 AI 或能幫助我們獲得更多微生物組與宿主健康之間的聯繫。
那麼最近都有哪些利用 AI 推動微生物組發展的研究呢?今天,我們共同關注 AI 是如何在微生物組領域發揮作用的。
AI+微生物組
微生物組產生的測序數據十分龐大,每一個來自人類的微生物樣本可能都包含了高達 10,000 個物種的碎片數據。過去幾年,人類腸道微生物組基因集不斷擴充,研究人員發現了一批又一批微生物新基因。
雖然數據的增加意味更多的信息,但是要從如此龐大的數據中提取並挖掘有用的信息,無疑是一個巨大的挑戰。
實際上,如果把這些海量數據說成一個「重大的計算挑戰」可能太輕描淡寫了。當你擁有上萬個物種的 DNA 數據時,你究竟要從哪裡開始呢?怎樣做才能找到最重要、最關鍵的信息呢?是否會遺漏什麼線索呢?
為了解決這個計算挑戰,很多研究人員將目光投向了 AI。人工智慧能夠幫助我們更好地了解這些數據背後的生物學秘密。比如個性化營養初創公司 Viome 就正在利用獨有的 AI 算法分析腸道微生物組數據,為用戶提出更合理的飲食建議。
(關於 Viome 公司的更多信息,《腸道產業》曾報導過:腸道菌群+人工智慧,這家公司殺出一條血路!)
那麼,究竟都有哪些研究人員在利用 AI 分析微生物組數據呢?都做出了什麼新結果呢?
微生物組預測年齡
大量證據表明,人類腸道微生物組隨著年齡不斷變化,甚至可能會影響成年人的衰老。但是腸道微生物組和其它部位的微生物組與年齡之間的相關程度差異,以及是否可以通過微生物組樣本預測人的年齡尚不清楚。
近期,南昌大學徐振江和加州大學聖地牙哥分校的 Rob Kinght 團隊共同闡明了這一問題1。研究人員利用機器學習的方法對皮膚、口腔和腸道三種不同來源的人類微生物組數據進行分析,以預測年齡。
《熱心腸日報》對該研究也做過報導:
南昌大學徐振江等:微生物組或可預測人的實際年齡
mSystems
[IF:6.519]
結合公開數據,用隨機森林模型,評價糞便、唾液及皮膚(手和前額)樣本微生物組預測成年人年齡的能力; 皮膚微生物組可提供最佳的年齡預測(mean±SD為3.8±0.45年,口腔和腸道微生物組年齡預測mean±SD分別為4.5± 0.14和11.5 ±0.12年); 多個隊列研究均表明腸道微生物組與實際年齡有關; 手微生物組年齡預測模型可應用到前額微生物組年齡預測,反之亦然; 與老年人富集的細菌相比,年輕人富集的細菌,豐度更高,且在多個群體中普遍存在。
Human Skin, Oral, and Gut Microbiomes Predict Chronological Age
02-12, doi: 10.1128/mSystems.00630-19
具體地,研究小組從 18 到 90 歲的受試者中收集了近 9,000 個微生物組樣本,並使用這些數據對隨機森林回歸模型進行優化、訓練和測試,獲得了微生物組與年齡之間的關係。
研究表明,在三種來源的微生物組中,皮膚微生物組預測年齡的準確性最高,其次是口腔,最後是腸道微生物。
研究人員認為皮膚微生物之所以最為準確可能是由於年齡的增長,皮膚生理經歷了明顯的變化,比如皮膚含水量減少,皮膚變得更加乾燥。
徐振江教授表示:「將微生物與年齡相關聯的新能力可能有助於我們進一步研究微生物在衰老過程以及和年齡相關的疾病中所起的作用,並且或許能夠幫助我們更好地測試針對微生物組的潛在治療性幹預措施。」
該研究由 IBM Research AI 資助,對該研究的結果,IBM 人工智慧健康生活計劃項目的負責人 Ho-Cheol Kim 表示:「研究結果的準確性表明了應用人工智慧技術或能更好地了解人類微生物組。」
然而,微生物組的預測力量可能不至於此,1 月 22 日,Science發表文章特別關注了兩篇通過微生物預測疾病和死亡的預印文章2。
腸桿菌是人類腸道中生活的多種微生物之一。圖片來源:KTSDESIGN
Science:微生物組預測死亡?
這兩項最新的研究發現,我們腸道中的微生物可以比基因更加準確地揭示某些疾病,並且甚至可以預見未來 15 年內面臨死亡的風險。
關於該Science新聞,《熱心腸日報》也做過報導:
Science 新聞:腸道微生物預測你在 15 年內死亡的可能性
Science
[IF:41.037]
近期兩份預印報告顯示,腸道微生物或可比人體自身基因更能準確預估人死於15年內的可能性; 腸道菌群基因組區分人體健康和疾病的能力比人體自身基因高20%,預測結腸癌的能力比人體自身基因高50%; 芬蘭數千人長達15年的跟蹤調查顯示,糞便中腸桿菌門(如大腸桿菌和沙門氏菌)豐度高的人更有可能在15年內死去; 無論腸道菌群是以某種形式導致疾病和死亡還是只展示了身體別處發生的未知,都值得醫生和科學家的關注。
The microbes in your gut could predict whether you’re likely to die in the next 15 years
01-22, doi: 10.1126/science.abb0111
【主編評語】這是Science的一位科學記者主要根據今年1月預印的兩份研究報告撰寫的新聞稿。第一份(https://www.biorxiv.org/content/10.1101/2019.12.31.891978v1)比對了菌群基因組和人體自身基因組預測受環境影響巨大的複雜疾病(如結腸癌、高血壓和肥胖等),發現只有1型糖尿病是唯一一種人體自身基因組預測能力高於腸道菌群基因組預測能力的疾病。第二份(https://www.medrxiv.org/content/10.1101/2019.12.30.19015842v2)發現不同地區的7211名芬蘭人(包括不同的基因背景、生活方式和死亡率)中糞便的菌群組成腸桿菌門可預測人15年內死亡的概率。雖然這兩份報告顯示腸道菌群具有潛在預測疾病與死亡的能力,但仍未通過同行評議,因此僅供新聞觀點閱讀,不具備臨床指導能力。(@瀟灑小姐陳)
在第一項研究中,研究者回顧了 47 項研究工作,並探究了腸道微生物的共有基因組和 13 種常見疾病之間的相互聯繫。這些疾病包括精神分裂症、高血壓、哮喘等,它們都被認為屬於「複雜性疾病」,因為上述疾病同時受環境和遺傳因素影響。
研究人員把這些分析結果和 24 個通過全基因組關聯分析(GWAS)將特定遺傳變異與人類疾病關聯起來的研究結果放在一起進行了比較分析。
該團隊在公開於 bioRxiv 上的文章中表示,總體而言,在區分健康個體和生病個體時,相比使用基因組信息,利用腸道微生物的遺傳特徵進行分辨,最終效果可提升 20%。而在預測結腸癌方面,通過腸道微生物組進行預測,效果可提升 50%。僅僅在預測I型糖尿病方面,利用基因組分析優於微生物組。
雖然該研究的作者 Braden Tierney(一名來自哈佛醫學院的計算生物學家) 承認,該項分析只是初步的探索,但他認為這項工作最終將造福大眾。
Braden 說:「在臨床上,我們可以通過微生物組學和人類遺傳學的方法來改善病人的生活質量。我們的目標是努力找到並確定微生物基因組和人類基因組中有助於我們診斷這些複雜疾病的關鍵標誌因子。」
不過也有人提出了另一種看法。VIB-KU 魯汶微生物中心的微生物研究者Jeroen Raes 認為:「雖然我們十分清楚我們的基因如何工作,但是我們對於體內的微生物的了解還少之又少。所以,在這種情況先貿然將二者進行比較分析,是十分危險的。」
但是,他同時也認為,利用微生物進行分析的一個優勢是微生物會受人體所處的外部環境影響,比如吃了什麼或者運動量如何。按照這個邏輯,微生物或許可以更好地預測像 II 型糖尿病一樣的受大量環境因素影響的疾病。
而在另一項研究中,研究者分析了人體微生物組和壽命長短的聯繫。
這項分析利用了一項芬蘭研究數據,這項研究從 1972 年便開始收集成千上萬的健康數據。在 2002 年,參與者捐獻了糞便樣本,15 年後這些樣本全部被測序完成。
該研究數據分析的結果顯示,體內一種包括大腸桿菌和沙門氏菌在內的腸桿菌科富集的個體在後續的 15 年內死亡概率會更高。
而且該研究發現,芬蘭的東部和西部人群的腸道細菌和死亡風險都存在相關性,儘管東西方擁有不同的遺傳背景和生活方式。
來自福瑞德·哈金森癌症研究中心 Samuel Minot 表示,他對這項研究印象深刻,因為如此長周期的研究是罕見而且難以重複的。他說:「我希望在未來能看到更多的類似的研究。」
雖然在這兩項研究中,我們依舊無法明確微生物為什麼會和死亡與複雜疾病發生關聯。可能是微生物會通過某種方式導致疾病和縮短人的壽命,也有可能這些微生物的改變只是反映機體正在發生的某些變化。
不管是哪種可能,Tierney 說:「致力於預防和治療人類疾病的醫生和科學家們都應該對這些生活在我們腸道中的微小居民們投入更多的關注。」
雖然關於微生物和複雜疾病之間的關係還有大量未知,但是在另一類疾病中,或許我們離揭示微生物和疾病之間的關係已經更進一步了。
圖. 癌症的微生物信號:微生物可定植在各種組織中,這些微生物的 DNA 和 RNA 信號能在各類組織中發現,包括血液中(此處為了簡化僅展示 DNA)。
Rob Knight 團隊在以前研究的基礎上展示出微生物 DNA 和 RNA 能在腫瘤中檢測得到並可作為癌症標誌物。AI 模型可以利用來源於組織和血液樣本的核酸信號來區分癌症類型,以及區分健康個體和罹患某種癌症的個體。
Rob Knight:微生物組或可診斷癌症
3 月 11 日,Rob Knight 團隊在Nature雜誌上發表了最新的研究成果,該研究分析了血液和組織中的微生物3。
關於該研究,《熱心腸日報》也做過相關報導:
Nature:分析血液和組織的微生物組,或能診斷癌症
Nature
[IF:43.07]
分析33種癌症的全基因組和全轉錄組數據(1萬患者,1.8萬樣本),鑑定腫瘤和正常組織以及血液中的微生物DNA和RNA; 約7.2%的序列為非人類來源,用機器學習模型鑑定出不同癌症和組織類型的微生物特徵; 對於游離腫瘤DNA檢測效果有限的Ia-IIc期和無基因組改變的癌症,血液微生物DNA(mbDNA)能較好的區分不同癌症類型; 分析69例健康人和100例癌症患者證實,mbDNA能用來區分健康人和癌症患者以及不同癌症類型。
Microbiome analyses of blood and tissues suggest cancer diagnostic approach
03-11, doi: 10.1038/s41586-020-2095-1
【主編評語】Rob Knight團隊在Nature發表的一項最新研究,對癌症基因組圖譜(TCGA)項目中的1.8萬個樣本測序數據進行大規模分析,鑑定出癌症相關的血液和組織微生物組特徵。即使經過非常嚴格的去汙染分析(去掉高達92.3%的測序數據),血液微生物DNA也展現出不俗的癌症診斷潛力,或能作為游離腫瘤DNA檢測的補充手段,用於癌症的診斷和監測。(@mildbreeze)
該團隊使用 TCGA 腫瘤資料庫,一個包含 DNA 和 RNA 測序數據的在線資料庫,分析了 33 種類型癌症的數據,總計使用了超過來自 10,000 名病人的 17,000 份樣本。
然後研究者們使用了包括獨立訓練的人工智慧(AI)模型在內的多種算法對這些樣本中的微生物序列過濾、歸一化和分類。
在通過嚴格的過濾方法去除了數據中的潛在汙染和其它變量後,研究小組將總測序片段的 7.2%歸為非人源序列。這些序列中大約有三分之一能被注釋為細菌、古菌或病毒,並且其中又有 12.6%能確定為某一個特定屬。
作者們接著用這些數據訓練了機器學習模型,以辨別不同的癌症類型、同一癌症類型的不同階段,以及區分腫瘤和正常組織。
總體而言,這些模型在辨別癌症類型以及區分癌症和正常組織上表現良好,但是在區分同一癌症不同階段上表現出一定的差異。他們的研究表明,血液中的微生物 DNA(mbDNA)或可用於區分癌症類型。
這些研究結果令人興奮,然而,這項研究存有很多限制,也就是意味著還有非常多的機會來完善這項研究。
缺陷之一就是 TCGA 樣本的採集方式無法控制微生物或 mbDNA 汙染,這種汙染有可能在樣本收集和測序之間的任一時間點被引入。
第二,用於人體研究的 DNA 和 RNA 測序或許無法完全表徵微生物。基於當前已有的工作,未來的研究應該使用恰當的測序技術對精心篩選後的組織和血液樣本進行分析,以表徵微生物。
第三,為了驗證這些微生物在癌症腫瘤和血液中的存在,深入了解其分布和功能非常重要。
Rob Knight 團隊和其它團隊依據核酸序列在腫瘤中鑑定出微生物信號。然而這些微生物定位在哪裡並不知道(在腫瘤細胞內部或周圍,免疫細胞或在像是間質這一結締組織中)並且是否是活的也不清楚。
未來,需要更多的研究來確定這些微生物是來源於癌症還是僅僅是些在腫瘤微環境改變後的過客。
最後,對微生物如何進入並存在於癌組織中,以及研究如何最有效地針對它們治療甚至是預防癌症,都需要我們進一步在機制上深入了解。
儘管有一些限制,但是這項研究為通過監測和調控微生物組推動臨床進展並深化我們的見解提供了誘人的可能。
AI會如何推動微生物組發展?
無疑,AI 在生命科學領域的運用獲得了許多令人驚訝的結果。從 IBM Watson 在 CT 掃描中識別肺栓塞,到 Google Deep Mind 識別視網膜病變,再到最近Cell的一項新研究報導利用機器學習方法從 1 億多個分子中發現了強大的新型抗生素4。
AI 的飛速發展為我們帶來了各種新可能。或許未來,AI 能夠在微生物組領域幫助我們闡明更多微生物組與宿主健康之間的互作機制,為我們帶來更多驚喜的結果。讓我們一起期待吧!
參考文獻或資料:
(滑動下方文字查看)
1.Huang, Shi, etal. "Human Skin, Oral, and Gut Microbiomes Predict ChronologicalAge." MSystems 5.1 (2020).
2.https://www.sciencemag.org/news/2020/01/microbes-your-gut-could-predict-whether-you-re-likely-die-next-15-years
3.Ajami, NadimJ., and Jennifer A. Wargo. "AI finds microbial signatures in tumours andblood across cancer types." (2020).
4.Stokes, Jonathan M., et al. "A deep learning approach to antibiotic discovery." Cell 180.4 (2020): 688-702.