WGCNA新手入門筆記(含代碼和數據)

2021-01-19 小張聊科研

加權基因共表達網絡分析(WGCNA,Weighted gene co-expression network analysis)是一個很火的生信分析方法,高分文章很多。

然而很多童鞋敬而遠之,因為它是需要跑代碼的。其實,WGCNA用起來也沒那麼難,今天給大家分享一下新手學習WGCNA的經驗、常見問題的解決辦法,以及如何理解WGCNA分析流程中的關鍵點,以達到應用的目的。讓大家能夠入門WGCNA進行實操是我整理這一學習筆記的最終目的。筆記內容涉及到WGCNA的簡介,安裝運行,代碼解析和靈活變換,跑出的圖有什麼意義等,準備分3-4次說。


WGCNA能夠從複雜數據中(N多分組)快速地提取出與樣本特徵相關的基因共表達模塊,以供後續分析。簡單地說,它通過計算基因之間的表達相關性,將具有表達相關性的基因聚類到一個模塊中,然後再分析模塊與樣本特徵(包括臨床特徵、手術方式、治療方法等等)之間的相關性,WGCNA搭建了一座樣本特徵與基因表達變化之間的橋梁

(WGCNA: an R package for weighted correlation network analysis.)

具體的算法和原理這裡不作贅述,這本書裡講得很詳細,然而站在我——生信小辣雞的角度,可能看也看不懂,也用不上。。。

Horvath S (2011) Weighted Network Analysis. Applications in Genomics and Systems Biology. Springer Book. ISBN: 978-1-4419-8818-8


下面通過介紹WGCNA結果中核心的兩張圖,來講講WGCNA具體是幹什麼的。

1、模塊聚類圖

(自己瞎跑的圖)

這張圖是根據你樣本中基因表達情況,將共表達的基因聚類到一個個彩色的模塊當中,其中灰色模塊是沒有被接受的基因,後續分析中這一模塊的基因就沒有什麼用了。


2、模塊—樣本特徵相關性分析

(Temporal network analysis identifies early physiological and transcriptomic indicators of mild drought in Brassica rapa)

這張圖是樣本特徵與各個模塊的關係,X軸是樣本特徵,上圖中的X軸是植物培養時的幾個參數;Y軸對應的就是各個基因共表達模塊了。紅色表示正相關,藍色表示負相關,比如Fv'/Fm'——wM11所對應的矩形中的數字為0.79(4e-6),表明wM11模塊中的基因與Fv'/Fm'的變化是極具相關性的。所以後續我們可以通過分析wM11模塊中的基因來探究這些基因是如何受到Fv'/Fm'的影響,從而對植物表型產生影響的,常用的分析包括GO,KEGG注釋,共表達網絡分析等等。g

那麼這麼牛B的工具,在哪裡可以得到呢?

首先,你要裝一個R語言(https://mirrors.tuna.tsinghua.edu.cn/CRAN/),直接裝最新版本的,目前是3.4.2,不過3.4.3很快就要出了。。。

然後你需要安裝WGCNA這個包(package),這個包會用到很多其它包,所以下載安裝還是需要花點時間的。

連接到bioconductor這個網站,下載WGCNA包。

然後載入WGCNA包就可以使用了。

正式跑程序之前,要改變一下工作目錄(程序在哪個文件夾運行,調用哪個文件夾裡的數據)(咱用不來代碼。。。感覺沒這個快)

然後就可以跑程序了。

前期需要準備兩個文件,一個是樣本信息的文件,一個是基因表達數據的文件。

樣本信息文件:

最簡單的辦法是不做什麼分組,每個樣本一個分組,然後在下圖中進行分析,比如D6,D7和purple這個模塊的基因都有高相關性,那麼也就是說purple模塊的基因可能和D6,D7這兩組樣本共有的樣本特徵具有相關性,比如可能是同為腫瘤遠端轉移樣本。

又比如像下圖這樣根據乳腺癌的臨床特徵進行分組,ER陽性標為1,陰性標為0,其它類似,構建一個樣本特徵的文件。具體的分組需要綜合考慮你的分析思路,重點關注的是樣本的哪些特徵。

(https://www.shengxin.ren/article/88)

基因表達數據的文件:

測序的可以用FPKM的數據

晶片的可以用GEO整理好的表達矩陣

(https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE90841)


我在網盤裡上傳了一份編輯好的數據和代碼,大家可以自己上手先試一試(後面幾步可能跑起來會費點時間,大家運行的時候耐心等待),周五的時候會進行代碼方面的詳細解讀。

網盤連結:http://pan.baidu.com/s/1hsAdsyg

網盤密碼:onp0


參考文獻:

1、http://tiramisutes.github.io/2016/09/14/WGCNA.html

2、https://www.shengxin.ren/article/88

3、http://www.stat.wisc.edu/~yandell/statgen/ucla/WGCNA/wgcna.html

4、WGCNA: an R package for weighted correlation network analysis. PMID: 19114008

5、Temporal network analysis identifies early physiological and transcriptomic indicators of mild drought in Brassica rapa. PMID: 28826479


關注後獲取《科研修煉手冊》1、2、3、4、5,基金篇精華合集


相關焦點

  • 新手如何快速入門數據分析?
    CDA數據分析研究院原創作品, 轉載需授權隨著網際網路迅猛發展,各大公司沉澱了很多的數據,如何找出藏在這些數據背後的規律,利用這些數據來給公司創造價值,作為一個新手面對這些問題的時候,你是不是考慮怎麼快速學習數據分析呢?
  • 《漫漫長夜》故事模式新手入門指南
    《漫漫長夜》故事模式比起生存模式,該模式是新手上手遊戲的好選擇,其中包括了一些基礎教學,能讓玩家逐漸了解遊戲,下面小編就為大家帶來一篇「Donald」分享的故事模式新手入門指南,一起來看看吧。,下面小編就為大家帶來一篇「Donald」分享的故事模式新手入門指南,一起來看看吧。
  • 全能型工具 Notion:筆記應用的終結者
    沒有「文件夾」的筆記應用之所以強大,是因為它幾乎無所不包。個人筆記需要的「記錄」「管理」「搜索」、團隊工作需要的「多人協作」「項目管理」「數據整理」,都能在 Notion 中完成。擁有這樣大而全的系統,它的內容組成方式也和一般的筆記產品不同,我們會從介紹 Notion 的內容構成開始,方便新手了解它的強大、並且更容易上手。Notion 中沒有文件、文件夾的概念,新建一個項目的方式是添加一個 Page。新建的 Page 會顯示在左邊的菜單欄中,所有的 Page 支持無限向下疊加。
  • 動態二維碼製作新手入門教程
    剛給大家分享了一篇創意二維碼製作教程,今天再給大家分享一篇動態二維碼制製作的新手入門教程,算是上一篇二維碼製作教程的輔助篇。
  • 微分幾何入門與廣義相對論-筆記(一)
    梁燦彬的微分幾何入門與廣義相對論視頻,是一套可以坐在家裡自學的優良教材,前五章講述微分幾何入門知識,包含流形、張量、微分形式及其積分等內容
  • 一文看懂WGCNA 分析(2019更新版)
    其中第一步數據準備反而是最複雜的,取決於大家的R語言水平,這個數據GSE48213-wgcna-input.RData我已經保存下來咯,如果大家不會做,又想體驗一下這個WGCNA流程,就可以直接load我保存好的數據文件即可。
  • 地下蟻國新手入門經驗分享 新手怎麼玩?
    導 讀 地下蟻國新手怎麼玩?新手入門地下蟻國還是有一定難度的,接下來就給大家帶來了玩家「丨�酒趁年�A丨」的地下蟻國新手入門經驗分享,小夥伴們快來看看吧。
  • AI從入門到放棄:BP神經網絡算法推導及代碼實現筆記
    前言:作為AI入門小白,參考了一些文章,想記點筆記加深印象,發出來是給有需求的童鞋學習共勉,大神輕拍!【毒雞湯】:算法這東西,讀完之後的狀態多半是 --> 「我是誰,我在哪?」 沒事的,吭哧吭哧學總能學會,畢竟還有千千萬萬個算法等著你。本文貨很乾,堪比沙哈拉大沙漠,自己挑的文章,含著淚也要讀完!
  • 《無人深空》新手入門教程 新手入門玩法攻略
    導 讀 《無人深空》新手怎麼上手這款遊戲呢?不少萌新玩家都想知道,下面就為大家帶來無人深空新手入門教程,一起來看看。
  • 黑色沙漠MOBILE捏臉數據大全 好看的捏臉代碼匯總[多圖]
    黑色沙漠MOBILE這個遊戲的畫面非常出眾,同時遊戲中也採用了捏臉的玩法,玩家可以自由隨意的捏臉,這是韓國遊戲的正常操作,大家都坐下,下面小編就來分享一下好看的捏臉代碼。黑色沙漠MOBILE捏臉數據大全玩家進入遊戲第一件事肯定是創建角色,創建角色那就需要開始你的捏臉之路了
  • 《我射手特牛》新手怎麼玩 新手入門玩法思路指南
    導 讀 我射手特牛新手該怎麼玩,很多新手玩家都不知道如何開局,那麼前期資源裝備怎麼獲取,那麼裝備比較適合新手呢,下面為大家分享詳細的入門攻略。
  • 《方舟生存進化》新手入門需要注意什麼 新手注意事項介紹
    今天小編給大家整理關於《方舟生存進化》新手入門注意事項,供大家參考,希望對大家有所有所... 《方舟生存進化》最近在epic上免費放送了,想必又有許多新手玩家摩拳擦掌入坑。那麼新人入坑有哪些需要注意的事項呢?
  • 入門生物信息,門在哪?
    這一篇內容列舉幾個入門生物信息的角度 ,可以讓想要入門的夥伴知道門在什麼地方。另一篇文章會相對全面的列舉生物信息學常用軟體和方法。你既可以把它當成一個入門學習清單,也可以用來對照查找自己的知識盲區。如果要在相關社區提問,附上你的原始碼和幾行有問題的原始文件是基本的禮貌和要求。習慣用英文來搜索如果一個問題用中文搜不出來你想要的答案,還是用英文來搜索吧。
  • 入門Python爬蟲——解析數據篇
    作者:李菲 來源:人工智慧學習圈首先,讓我們回顧一下入門Python爬蟲的四個步驟吧:而解析數據,其用途就是在爬蟲過程中將伺服器返回的HTML原始碼轉換為我們能讀懂的格式。比如網頁頭部分的代碼中含有<head>以及</head>,網頁體部分的代碼中含有<body>以及</body>。在了解過HTML的基本信息之後,下一步我們就可以去解析這些數據了。
  • 零基礎如何入門學習電腦編程?
    零基礎如何入門學習電腦編程?有哪些好的方法呢?現在帶著疑問一起去了解一下吧。2、選擇入門語言這個問題在入門階段一直是爭議十分大的問題,n多語言,n多推薦,到最後搞到新手一會聽說這種語言適合新手,於是學習這種語言,一會又有人會開始推薦你xxx語言,於是新手們又開始學習這種語言,搞到最後,什麼語言都沒搞懂,時間大把大把的流失,熱情消耗殆盡。要解決這個問題,首先要明白一個根本問題,怎樣挑選適合入門的程式語言?我推薦從難度這個角度來考慮。
  • Tensorflow 全網最全學習資料匯總之Tensorflow 的入門與安裝【2】
    《TensorFlow極速入門》連結:http://www.leiphone.com/news/201702/vJpJqREn7EyoAd09.html本文介紹了 graph 與 session 等基本組件,解釋了 rank 和 shape 等基礎數據結構概念,講解了一些 variable 需要注意的地方並介紹了
  • 新手入門吉他推薦
    入門吉他不一定要買貴的,但是也不能買太差的,建議在500-2000之間的價位選擇。500以下的吉他很難保證其質量以及售後。除非家裡有礦,太貴的也不現實。一是調節不當和保養不好,會損壞了一支好琴,二是你不會彈不會調也彈出不了好琴應有的音色。所以建議新手儘量買把千元以上的吉他,實在不行也要買把五百元以上的吉他。2.
  • 《方舟生存進化》恐龍筆記方位代碼大全 包含孤島和焦土筆記
    導 讀 第1頁:恐龍名稱 展開 《方舟生存進化》中有很多恐龍,今天小編為大家帶來了「最終生命體」《方舟生存進化》恐龍筆記方位代碼大全 包含孤島和焦土筆記,想要快速找到恐龍的玩家
  • 吳恩達深度學習筆記(13)-多樣本梯度下降和向量化處理多批次數據
    所以看來你需要一個for循環遍歷所有n個特徵當你應用深度學習算法,你會發現在代碼中顯式地使用for循環使你的算法很低效,同時在深度學習領域會有越來越大的數據集。所以能夠應用你的算法且沒有顯式的for循環會是重要的,並且會幫助你適用於更大的數據集。所以這裡有一些叫做向量化技術,它可以允許你的代碼擺脫這些顯式的for循環。
  • 《死亡細胞》新手怎麼玩 新手入門技巧分享
    導 讀 死亡細胞新手入門須知 死亡細胞在進入遊戲前應該要注意什麼呢,有沒有什麼遊戲時的技巧呢,下面就給大家分享死亡細胞新手入門須知