|撰文:阿拉雷
在過往的微生物群落研究中,闡明群落中物種與物種間存在的關聯並非一件簡單的事情,難點在於群落中的屬水平物種數量通常能達到幾百甚至上千,如此龐大數量的群落再加上微生物間錯綜複雜的聯繫,使得找出目標微生物間的關聯變得很困難。
為了能快速篩選出群落核心物種,前人開發了各式各樣的數據篩選方法,在篩選的基礎上,進行網絡的圖的繪製,用點和線組成網絡,來描繪微生物世界的「社會結構」。
在8種主流的網絡圖的構建方法能夠幫助我們構建一個初始的網絡結構,獲得輸入數據兩兩之間的基礎相關性值(如:pearson相關係數),再對基礎相關性信息進行處理,獲得深層級的物種間的相關信息,以此進行物種的相關網絡構建。
基礎網絡構建成功後,緊接著,一個更重要的問題擺在了我們面前:該如何挑選展示物種?
通常,我們對群落的研究不是毫無目的性地「漫灌」,菌海茫茫,大多是我們不需要的噪音信息。
群落研究需要「精確制導」,即專一於某個問題的研究,討論的是某幾類細菌間的互作引發群落某個性質發生改變(如產酸細菌間的互作引起動物腸道pH值的變化、土壤固氮類型細菌間的相關性變化引起土壤性質變化等)。
因此,我們需要使用一些關鍵的評估指標找到關鍵的物種信息,幫助我們快速篩選獲得樣本群落中的核心微生物。
常見的物種網絡篩選指標有:
1.物種中心性
2.物種驅動性
3.核心物種+下遊驗證
中心性(centrality)是網絡構建中最常用來評判核心物種的指標,中心性描述的是網絡的結點與周圍結點連接的線數量。
就像是評價人群網絡的中心性時,查看每個人微信的好友數量,數量越多說明這個人與其他人的連接越多,這個人越有可能是這個人群網絡的核心人物,反之如果這個人與其他人的連接越少,這個人越可能是網絡的邊緣人物。物種的中心性進一步細分又可以分為點中心性(degree centrality)與中介中心性(betweenness centrality)。
1)點中心性(degree centrality):
這是最基礎的中心性指標,即統計網絡中每個結點與周圍結點的連線數量,用來比較組間的物種差異情況,組間整體中心性差異越大說明對應物種在組間的物種關係發生了大的變化,越有可能與組間表型差異的產生有潛在關聯。
如圖1,兩組間的中心性存在明顯差異(線的密度存在差異),這種差異就可能是表型差異的潛在原因。
圖1 主流文章中的相關性網絡圖[1]
2)中介中心性(betweenness centrality):
有時候高中心性的物種可能並不會直接對表型產生影響,他們可能充當著一種中介橋梁的作用。
將對表型有直接影響的物種連接起來,一旦中介物種豐度等指標發生變化,則會影響其他物種間的互作情況。
該類中心性使用範圍較窄,通常為疾病模型中判斷核心物種的中心性變化引起下遊連接的物種間關聯性的變化,從而引起表型上的差異,如圖2。
圖2 文章中的網絡中介中心性評估[2]
微生物之間從不是孤立存在的,它們存在著複雜的聯繫以響應各種環境變化,當所處的環境發生變化時,往往是一類細菌豐度發生變化引發多米諾效應使得整個網絡結構發生變化。
梯度樣本(環境梯度、時間梯度、藥物梯度等)、系統差異比較樣本(如疾病與健康比較、對照與肥料處理比較等)中,我們需要找到驅動微生物網絡響應環境變化的驅動物種(drive species)來解釋群落網絡變化的機理。
NetShift算法就是一種目前主流的網絡物種驅動性強弱的算法,通過引入NESH值(Neighbor Shift)來分析網絡中鄰近結點的變異程度再結合結點數量來評估結點驅動性。該算法假定兩個需要比較的分組網絡A和B,通過計算兩個網絡共有、特有關係對,構建一個評價體系(X、Y、Z值),獲得最終的NESH值,該值越大說明物種驅動性越強,該物種越有可能是驅動網絡產生變異的推手——網絡驅動物種。
圖3 NetShift算法NESH值計算原理[2]
圖4 文章中的驅動物種網絡圖[1]
無數的前人經驗證明:實驗是檢驗真理的唯一標準。通過以上這些標準或是其他標準篩選獲得的物種信息始終是通過各類算法的推測。在有條件的情況下,如果能配合下遊生物學實驗的驗證,進一步證明物種對於表型的影響,將使得說服力更進一步。
當然,實驗驗證的條件同樣是苛刻的:
1)驅動物種或核心物種能夠人工培養,我們才能將物種獨立進行後續驗證;
2)核心物種或驅動物種不完全依賴於網絡環境對表型產生影響。
文獻中有一些經典的驗證思路可以借鑑學習:在某些癌症疾病樣本中通過構建微生物物種與宿主基因變化網絡找到了潛在的癌症特徵微生物,通過調查發現該類微生物可用於人工培養,將該類微生物與宿主細胞共同培養後檢測細胞基因表達量變化發現癌症相關基因表達量發生了相同的上調變化,進而驗證了之前的癌症特徵物種的推測[3]。
核心物種+實驗驗證能夠最大程度闡明微生物的作用機理,為後續分子層面的實驗提供一個方向指導,讓我們的研究從單純的數據推斷上升到數據推斷+實驗驗證的完整邏輯層面,讓我們的研究從各類推測型文章中脫穎而出,結果受認可的程度將會更高。
圖5 文獻中的網絡圖[3]
基迪奧生物Omicsmart平臺針對擴增子項目提供一站式服務,導入下機的fastq原始序列數據即可進行微生物群落流程分析。
針對物種相關性網絡以及環境因子-物種相關性網絡圖,omicsmart平臺提供了高度交互性的構建方案,可根據中心性、相關性、p值等指標進行結點的篩選展示。
實時動態交互方案,隨心所欲調整結點與連線的配色、標籤、字體等20+種參數,做到下載即可用於文章發表的程度。
今天的分享就到這裡啦~
參考文獻:
[1]Zhou Dan, Xuhua Mao, Qisha Liu, Mengchen Guo, Yaoyao Zhuang, Zhi Liu, Kun Chen, Junyu Chen, Rui Xu, Junming Tang, Lianhong Qin, Bing Gu, Kangjian Liu, Chuan Su, Faming Zhang, Yankai Xia, Zhibin Hu & Xingyin Liu (2020): Altered gut microbial profile is associated with abnormal metabolism activity of Autism Spectrum Disorder, Gut Microbes, DOI: 10.1080/19490976.2020.1747329
[2] Kuntal, B.K., Chandrakar, P., Sadhu, S. et al. 『NetShift』: a methodology for understanding 『driver microbes』 from healthy and disease microbiome datasets. ISME J 13, 442–454 (2019).https://doi.org/10.1038/s41396-018-0291-x
[3] Tsay JJ, Wu BG, Badri MH, et al. Airway Microbiota Is Associated with Upregulation of the PI3K Pathway in Lung Cancer. Am J Respir Crit Care Med. 2018;198(9):1188-1198. doi:10.1164/rccm.201710-2118OC