WGCNA分析應用(一):發育調控
此次講解應用的文章信息如下:
Title:A novel microglial subset plays a key role in myelinogenesis in developing brain
Published Date:28 September 2017
Published Journal :The EMBO Journal(2017 IF: 10.557)
第一作者:Agnieszka Wlodarczyk,Department of Neurobiology Research, Institute for Molecular Medicine, University of Southern Denmark(南丹麥大學), Odense, Denmark(丹麥)
數據情況如下:GSE78809(17個樣本)
解讀:主要有17個樣本,每一個類別都有大於三個以上的生物學重複,有與大腦發育相關的新生兒組別和成年組別。
3.結果解讀
文章中主要有8個結果,這裡我們主要看WGCNA部分的結果,結果3:Distinct gene signatures in microglia subsets during development and EAE2.圖A:樣本關係聚類圖,這裡看到三個組成年組,新生兒組以及EAE組都分開了,並且組內的CD11c+和CD11c-也可以區分開。
疑問點:有意思的是作者用來做樣本聚類的數值,我在文章找了老久沒有看到圖中橫縱坐標的值是怎麼算的,有知道的可以下方留言討論哈。一般來說,對樣本進行聚類可以做層次聚類和PCA分析,WGCNA常見的是層次聚類樹。
3.圖B:模塊聚類樹,圖的上部分是對基因進行的聚類樹,下面是根據相似性聚成的模塊,文章中總共得到了7個模塊,我們可以在圖E中看到是那幾個模塊以及每個模塊涉及到的功能。
4.圖E:每個模塊的基因數以及各個模塊的功能,灰色模塊是沒有聚類到任何模塊的基因集合。
5.圖C:表型和模塊相關性圖,這裡可以看出哪些模塊和你關注的表型之間的關係是否顯著
這張圖需要用到一個很重要的表型數據,這裡可以看到作者是如何將分類變量數值化的,文章中是這樣描述的:
Six binary variables were generated that were used to calculate the module trait relationships in which all groups were set to zero with the exception of particular groups of interest:control(1’s for microglia obtained from healthy control brain)CD11c (1’s for both EAE CD11c and neonatal CD11c),EAE (1’s for CD11c negative and microglia obtained from EAE brains),neonatal (1’s for CD11c negative and microglia obtained from neonatal brains),CD11c EAE, and CD11c neonatal.翻譯為表格就是:
具體的模塊與表型以及聯合模塊功能的解讀這裡就不詳細說了,文章中描述非常詳細,如何將所挖掘到的模塊與發育聯繫起來。
4.總結
這篇文章IF在10以上,雖然發表時間比較早了,但是還是值得仔細讀一下的。特別是對結果層面的生物學意義的解讀,很多文章最終結果都只是空泛的說挖掘出了一個biomarker就完了,空洞又無趣。 作為技術層面的細節,這篇文章裡可以看到用於WGCNA分析的目的,樣本數,組內重複樣本數,用來分析的基因,用基因的什麼值,表型數據如何數值化以及對結果如何進行解讀和下遊分析。
歡迎留言討論,下期見~