大樣本分析神器WGCNA正式上線!

2021-01-19 基迪奧生物
WGCNA(weighted gene co-expression network analysis,權重基因共表達網絡分析)能將多個樣本中的上萬個基因,根據它們的表達模式劃分到數個至數十個模塊當中,然後以模塊為單位進行分析。這不僅減少了我們的運算量,也提高了分析的準確性。在轉錄組數據分析裡,這種適合大樣本的分析方法真是越來越香了,大家也一直在詢問什麼時候能在線上做WGCNA。今天,Omicsmart WGCNA分析平臺正式上線啦!

一種分析,我們除了要知道能得到哪些結果,更需要了解其分析的意義,這樣才能知道如何利用結果去探索得到我們想要的信息。下面我們就一起來看下,究竟該如何利用WGCNA去找到那些與樣本及性狀最相關的基因,以及確定基因與基因之間的關聯關係。 WGCNA起手最關鍵的一步,就是要確定power值的大小。WGCNA會對基因間的相關性取β次冪進行冪函數處理。少量強相關性的關係不受影響或影響較少;相關性弱的關係取β次冪後,相關性下降明顯,那麼這個β值就是power值了。接著對相關關係進行無尺度化。無尺度網絡中大部分基因只和少數基因相關,少數的hub基因位於核心位置。通過這種無尺度化,更容易找到起到關鍵調控作用的基因。

在線分析的好處就是可以隨意調整參數,不用再糾結於power值到底怎麼定才好,可以先看結果再選擇。當然,Power值也不是越高越好,相關性太高,連通性同時也會降低,所以一般是選擇相關性(左圖縱坐標)剛達到平臺期的power值進行分析。首先要找到使數據整體符合無尺度分布的power值,構建基因聚類樹,並根據基因間的聚類關係進行基因模塊的劃分,再根據模塊特徵值的相似度對表達模式相近的模塊進行合併。模塊特徵值(module eigengene,ME)是模塊中的所有基因進行PCA分析後得到的主成分1(PC1)的值。PC1相當於模塊中所有基因表達量的加權,可代表該模塊內基因的整體表達模式。根據基因間的聚類關係進行基因模塊的劃分,是指對聚類樹的分支進行剪切區分,產生不同的模塊,每個顏色代表一個模塊,灰色表示無法歸入任何一個模塊的基因,表達模式相似的基因將被劃入同一個模塊。在進行初步的模塊劃分之後,獲得初步劃分的模塊結果Dynamic Tree Cut,每個模塊都用顏色來命名。由於有些模塊非常相似,所以需要根據模塊特徵值的相似度對表達模式相近的模塊再進行合併,獲得最終劃分的模塊Merged dynamic。能劃分到一個模塊的基因,就代表了這些基因的表達模式是相近的。所以後續我們才能以劃分好的模塊為單位,對基因進行分析。

劃模塊不是目的,看哪些模塊和樣本有關,找到最相關的那些基因才是我們的目標。而將基因、模塊、樣本三者關聯起來的方法,是依據各模塊內的基因在各樣本中的表達量來計算各模塊在各樣本中的模塊特徵值。

熱圖呈現了在各樣本中各基因的表達量,柱狀圖表示該模塊在各樣本中的模塊特徵值。熱圖以基因為單位,對表達量進行z-score歸一化的處理。在各樣本中,默認基因如果呈現紅色,說明表達量處於升高的水平,如果是綠色,說明處於降低的水平。而柱狀圖表示的模塊特徵值也與之相對應,正值表示模塊內大部分基因發生上調,負值說明大部分基因發生下調。 有了這個「組合拳」,一方面,我們能知道這個模塊和重點關注的樣本是呈正相關還是負相關;另一方面,我們還能具體了解到,到底是哪些基因佔到了主導的地位。掌握了這些信息,我們可以根據研究目的挑選出正相關或負相關的模塊,或者直接選擇高表達或低表達的基因用於後續分析。 WGCNA結果中還會輸出模塊-模塊關聯,模塊-基因關聯的分析結果。但在挑選目標模塊的時候,除了結合基因的表達量去看,另一個需要重點關注的是基因的功能。一般而言,劃分到一個模塊內的基因的表達模式是相近的,功能也可能是相近的。所以我們能以模塊為單位,對模塊內所有基因進行GO、KEGG富集分析,再去了解一下樣本中大部分基因上調或下調的模塊主要是有哪些功能。

除了找和重點關注的樣本最相關的模塊,WGCNA在文章中被應用的最多的,就是通過輸入性狀數據,找到和性狀最相關的模塊。性狀數據就是樣本的表型數據,比如身高、年齡或者性別。對於年齡這種有具體數值的數據,可以直接輸入數值進行分析;如果是性別,需要轉化為「0,1」數據再進行相關性計算。最終可獲得模塊與性狀、基因與性狀的相關係數。
這一步需要重點關注的數值有三個:MM,GS,K.in。

1. MM值

module membership,是計算基因的表達量和模塊特徵值之間的相關係數,相關性越高,說明基因和模塊的關聯性就越高;如果相關性都小於0.7,呈現弱相關,那麼說明這個基因不屬於任何一個模塊。

2. GS值

gene significance,每個基因與性狀的相關性。

3. K.in

intramodular connectivity,通過計算基因在所屬模塊內鄰接值的總和,作為該基因在模塊內的連通性。如果GS值和MM值高度相關,則表明該基因是模塊內很重要的元素,並且和性狀顯著相關。同時,如果MM值和K.in值高度相關,則表明這個基因比給定的模塊來說,對於這個性狀的意義更大。綜合來講,核心(hub)基因通常是有高GS值,高MM值和高K.in值,它們與其他基因高度相關,通常位於調控網絡的中心,具有更重要的功能意義。我們的Omicsmart平臺,可以在線查看MM-GS相關性散點圖和K.in-GS相關性散點圖,覺得哪些基因重要,就圈哪裡,隨時隨地動態查看基因信息。

WGCNA構建了基因間的鄰接矩陣,分析了他們之間的關聯關係,並不是直接輸出了一個網絡圖出來。如果我們想要獲得文章中的那種網絡圖,則需要自行將數據導入到Cytoscape中進行繪製。而在畫網絡圖中,點和線是兩個基本要素,點是基因,線是基因和基因之間的關聯。 通過WGCNA我們能得到基因與所有基因的連通性(All.k.total)和該基因在模塊內的連通性(All.Kwithin),以及上面提到的GS值和MM值。根據這些信息,我們已經可以根據我們的需求,按各個值的大小去篩選出來一些基因進行圖形繪製了。能夠幫助我們篩選基因的工具有兩個,一個是富集分析,另一個是轉錄因子注釋信息。根據富集分析結果,我們可以挑選出重點關注的顯著富集通路內的基因去畫圖,而轉錄因子通常是調控網絡中的核心基因,如果有「明星基因」,那麼我們可以直接依據這個信息去繪圖。確定了畫圖的點後,如果把和這些點全部相關的基因都畫出來,那可能有上百條線,所以我們還需要進一步根據線的信息去過濾。基因和基因間除了直接地關聯,還能通過別的基因迂迴相關。給不同的相關程度賦予一個權重係數,最終可以得到兩個基因的相關性的權重值(weight)。Weight值越高,說明兩個基因越相關。之後我們可以依據Weight值挑選每個基因相關性較高的一些關係對去繪圖。Omicsmart平臺可以在線挑選基因和關係對,基於Cytoscape一鍵生成網絡圖,還可以調整節點和線的大小、顏色等等多種參數,調起來像閃耀的燈球……

自己做WGCNA分析還是比較複雜的,而Omicsmart的WGCNA分析平臺,能幫你實現用最簡潔的操作,找到最核心的基因!歡迎登錄Omicsmart試用帳戶體驗。



實用科研工具推薦      
詳實生信軟體教程分享
前沿創新組學文章解讀
獨家生信視頻教程發布


相關焦點

  • WGCNA新手入門筆記(含代碼和數據)
    WGCNA能夠從複雜數據中(N多分組)快速地提取出與樣本特徵相關的基因共表達模塊,以供後續分析。簡單地說,它通過計算基因之間的表達相關性,將具有表達相關性的基因聚類到一個模塊中,然後再分析模塊與樣本特徵(包括臨床特徵、手術方式、治療方法等等)之間的相關性,WGCNA搭建了一座樣本特徵與基因表達變化之間的橋梁。
  • 一文看懂WGCNA 分析(2019更新版)
    大家首先可以看到3個教程:2016-WGCNA-HCC-hub-gene.pdf 中文文章範例)WGCNA_GBMTutorialHorvath.pdf    WGCNA_YeastTutorialHorvath.pdf其中第一個是我4年前的WGCNA分析教程最主要的參考文獻,後面兩個是英文教程,我相信你大概率是不會去看的
  • 中科普瑞IPA分析服務正式上線
    2018年4月,中科普瑞IPA分析服務正式上線。
  • WGCNA分析詳解專題(一)
    此次分析詳解專題將講述以下內容,老規矩,如有理解錯誤,還請各位大俠批評指正!我該選取哪些基因進入分析?是全部的基因還是只用差異表達的基因?2.數據使用(WGCNA分析使用數據)數據情況如下:GSE78809(17個樣本)解讀
  • WGCNA-最短教程掌握高級分析
    ,很多同學已經迫不及待想要學習整個WGCNA的分析流程了。整體來講,WGCNA的分析流程是很繁瑣的,一個全套的分析可能會涉及8-9個步驟,但是,這裡面有很多步驟其實無關緊要,跟分析的主線,也就是「篩選與表型相關的核心基因」是脫離的。
  • 劍與遠徵:九尾冰魔大增強?法師神器分析!
    最新的法師神器還是有點東西的,對很多法師都有很明顯的加強。一起來看看吧!下面一神器20點暴擊增幅計算。法師家具自帶至少12點暴擊增幅,部分英雄紅家具還會提高暴擊增幅。對於只有12點暴擊增幅的英雄。爆傷由209.3%變成了232.2%,提升了10.9%光女9紅降低35點暴擊抗性,搭配法師神器,暴擊增幅直接拉滿。【技能介紹及分析】戰鬥開始時立即獲得300點能量,第一次釋放必殺技後5秒內共損失200點能量。
  • 汕頭華僑試驗區大宗商品服務平臺正式上線
    1月8日上午,汕頭華僑試驗區大宗商品服務平臺正式上線,將運用網際網路信息技術有力支撐供應鏈服務產業發展,更好地服務汕頭及粵東地區,乃至海內外華人華僑的大宗商品市場。
  • GWAS+WGCNA分析——挖掘微效位點新思路
    即,在第一階段使用較低的閾值獲得獲選候選位點,然後再使用另一組獨立樣本對候選位點進行驗證;代謝通路/功能類型水平(pathway/function based)的關聯分析。所謂代謝通路/功能類型水平的關聯分析,其基本邏輯如圖2。圖中藍線代表基因組,紅色區域代表與某個性狀相關的微效基因(僅僅對表型有0.1%的貢獻率)。
  • 「地質雲·陝西」正式上線服務
    「地質雲·陝西」作為中國地質調查局「地質雲2.0」重要省級節點,在本次大會上正式上線運行。 10月10日下午,在中國地質調查新進展專題論壇上,中國地質調查局黨組成員、副局長王昆高度評價了「地質雲·陝西」,表示將與陝西省地質調查院共同打造區域地質信息共享平臺。
  • 因素分析的樣本量得多少
    作者:晃晃悠悠 審核:X 封面:自己想吧        樣本量就是樣本中所包含的單位的個數,即抽樣單位數。樣本量直接影響抽樣誤差、調查的費用、調查所需的時間、調查訪員的數量以及其他一些重要的現場操作的限制條件。樣本量過大,會造成人力、物力和財力的浪費;樣本量過小,會造成抽樣誤差增大,影響抽樣推斷的可靠程度。
  • OmicShare差異分析工具上線了!
    萬眾期待的差異分析工具終於上線OmicShare Tools了!從此以後,不需要寫代碼就可以隨心所欲分析自己的數據了!想怎麼比較就怎麼比較!炒雞凍的是不是?那麼趕緊跟著小師妹學習一下如何使用這個差異分析工具吧!
  • 前海自貿版塊正式上線!船舶放行時間由1天縮短到1小時
    金羊網訊 記者李天軍報導:18日記者從深圳市前海管理局獲悉,深圳市單一窗口前海蛇口自貿片區版塊(以下簡稱「前海自貿版塊」)正式上線運行,根據試運行期間的測算,企業應用該版塊後,其貨物申報數據項減少1/3,船舶申報數據項減少80%,船舶放行時間由1天縮短到1小時,標誌著前海蛇口自貿片區貿易便利化水平進入新階段。
  • 血液樣本分析前變量對組學研究的影響:邁向精準樣本存儲
    實驗的分析前部分,無論是生物樣本採集、處理、儲存,還是運輸到實驗室,都可能導致研究數據、結果和判讀的明顯變化。現有的綜述和生物樣本庫創新分析提供了新的見解,總結了這樣的分析前變量,例如,採血管類型、離心條件、樣本長期儲存溫度和保存時間,對血液來源的生物樣本進行組學分析:全血、血清、血漿、血沉棕黃層和外周血單核細胞。
  • 高校學生寫論文必備神器:百度學術論文助手改版上線
    近日,百度學術上線全新改版的論文寫作神器——論文助手,從論文開題、查重檢索、英文論文潤色等多個方面解決論文寫作過程中的難題。開題助手:全面分析研究熱點,多維度推薦參考文獻在搜索結果的內容層面,用戶能看到關鍵詞的核心研究點分析,從研究走勢、關聯研究、學科滲透、相關學者、相關機構等多方面,來滿足論文寫作過程中對學術文獻的需求。在應對用戶不同的寫作標準方面,頁面對搜索結果進行多項優化排列。分別從相關性、被引頻次、發表時間等維度,來設置經典論文、最新論文、學術論文轉換標籤,便於用戶根據需求查詢。
  • 北京朝陽醫院醫學研究中心成功上線生物樣本庫溫溼度監測項目
    ,歷來注重樣本的質量管理,高品質的生物樣本將是保證各科室順利開展科學研究的關鍵要素,為此,醫學研究中心於今年年初就為其生物樣本庫引進了由威斯盾網絡科技有限公司提供的專業化的生物樣本庫溫溼度監測平臺,在經過3個多月的試運行,平臺於本月20日通過驗收並正式交付醫學研究中心使用。
  • CF:又一把gp機槍神器即將上線,網友:這不是逆戰的雷霆999嘛?!
    近日,在穿越火線美服上線了一把永久的GP機槍-AEK-999,小編第一次見這把槍時,總覺的有些眼熟,再看幾眼,我去!這不是逆戰中的第一把神器雷霆999嗎?確實,這把槍與逆戰中的雷霆999從外貌上來看幾乎是一個模子裡出來的,相比雷霆999除了沒有皮膚,並加裝了一個兩腳架,以及沒有逆戰中無需換彈的逆天屬性外,其他方面近乎一模一樣。
  • 「全球科研項目資料庫」正式上線
    由中科院蘭州文獻情報中心開發建設的「全球科研項目資料庫(ProjectGate)」日前正式上線,該資料庫可向科研用戶提供全球主要國家科技部署和科研項目信息並進行分析。  科研項目信息反映了一個國家的科技部署、科研實力以及研究重點的變化、科技創新的軌跡。
  • 湖南衛星雲遙系統正式上線
    在省政府新聞辦8月27日召開的新聞發布會上,湖南省影像統籌及衛星應用系統(簡稱「衛星雲遙系統」)正式上線。該系統多項功能為全國首創或領先,服務對象包括各廳局政務用戶和公眾群體。湖南遙感影像統籌工作一直處於全國領先。
  • 哈勃分析系統整裝再出發 打造用戶身邊的「安全專家」
    11月2日,騰訊電腦管家旗下的國內知名安全輔助平臺「哈勃分析系統」改版升級上線。升級後的「哈勃分析系統」將加強精準鑑定、極速響應、全網監控的能力,並依靠海量分析集群、基於大數據處理的智能檢測技術和業內頂尖的反病毒分析團隊三大「法寶」保障用戶網絡安全。
  • 《荒野大鏢客Online》正式登陸Steam平臺 中文翻譯BUG解決方法
    《荒野大鏢客Online》於今日(12月2日)正式在Steam上線,本作作為《荒野大鏢客2:救贖》的在線模式,R星官方宣布將其單獨作為一款遊戲來售賣,《荒野大鏢客Online》現已在Steam商店正式上線,目前價格為35元!