抖音最火slogan:
「很多網友留言想看網絡圖,今天他來了,你看他一身華彩,絢麗多姿,別問落地價,因為paper無價!」。
網絡圖(Network)一直以來,受到眾多高分文章的追捧。它能夠簡潔、直觀地反應出Gene-Gene之間的相互作用關係,特別是能夠通過自身的拓撲結構突顯出某些核心的關鍵基因(Hub gene),就像下面這樣的。
有一次跟學員聊天,她說自己找外包公司做了一個蛋白互作的網絡圖,花了5000塊,做出來的圖還不好看,讓人氣憤的是,調整一下數據重新做個圖,又要5000塊!讓人無法接受。當時我就跟她說,做個互作網絡,根本花不了5000元,5分鐘就能幫你做好。不信,我們看過來。
所謂網絡圖,看似複雜,其實構成非常簡單。網絡圖是一種圖解模型,形狀如同網絡,故稱為網絡圖,它由節點(node)和連線(edge)兩個因素組成的。其中node又分為source node(源節點)和target node(目標節點)。這裡的node就是我們的基因,edge就是基因間的相互作用關係。任何網絡圖都不外乎這些構成成分。知道了網絡圖的構成之後,再做圖做分析就很簡單了。
下面我們就按照網絡圖的構成逐一進行講解:
所謂的節點,就是我們要分析的基因。在一個網絡圖當中往往有數十個乃至上百個節點,那就意味著,我們需要分析的基因有數十個或者上百個。這些基因是怎麼來的呢?這就跟我們的研究目的相關了,這些基因可能是我們篩選出來的差異表達的基因,可能是腫瘤患者中高頻突變的一些基因,也可能是某一個miRNA的下遊靶基因,抑或僅僅是你感興趣的一群基因,都是可以的。
在進行網絡圖分析的時候,我們往往對基因的來源不做要求,只要是你認為有意義的一群基因,就OK了。但是,在基因的數量上,我們往往有一定的限制。因為,基因數少了,網絡圖中edge太少,圖做不出來,或者做出來很醜;而基因數多了,網絡圖太大,導致沒辦法導入軟體中進行分析,耗時太久,同時背景噪聲和混雜影響也會更多。因此,我個人一般建議的要分析的網絡圖基因數量在50-300個左右,這樣的網絡圖比較適中,不會太大,也不會太小。
所謂的edge就是基因之間的相互作用關係。比如我隨便列舉兩個基因:TP53和CXCL12,這兩個基因是否有相互作用關係?我們通過何種方法進行判斷呢?這是一個比較困難的問題。好在,有一些非常好的資料庫幫我們解決了這一問題,比如最著名的就是STRING database。STRING (https://string-db.org/) 是一個非常全面的蛋白互作網絡資料庫,裡面存儲了非常多物種和基因的相互作用關係。我們只要把基因名字提交上去,就能夠判定它們之間是否有互作關係了。
下面,我們就從實例出發,教大家如何製作一個發表質量的網絡圖。
分析處理組和對照組共得到100多個差異基因,分析其相互作用關係,並找到其中的關鍵基因。
(測試數據見文末,聯繫胖雨小姐姐)
看到這個研究內容,可能一下子有點懵,不要緊,我們先來理理思路:有了基因,我們得分析基因互作,這一步好辦,剛才已經講了STRING資料庫能做。那麼有了基因互作,我們怎麼做網絡圖?怎麼分析關鍵基因呢?這個時候,我們就需要一個軟體來幫我們實現了。 他是誰呢?大名鼎鼎的Cytoscape(Cytoscape最新版安裝包見文末,聯繫胖雨小姐姐)。
Cytoscape(https://cytoscape.org/)是一套完整的網絡圖分析系統,它不僅僅是個軟體,它還包含了一系列程式語言接口、app store等諸多內容,是網絡分析領域的龍頭老大。(突然發現,Cytoscape的主色調和我們科研貓居然是一致的,What a coincidence!)
Cytoscape能夠幫我們實現基因互作的可視化網絡圖,並且通過其諸多分析插件幫我們找到這裡面的關鍵基因,因此掌握Cytoscape之後,我們的這個問題就迎刃而解了。所以,理清思路之後,我們的研究方法如下。
利用String資料庫獲取基因相互作用網絡,並使用Cytosacpe軟體對網絡進行可視化和核心基因篩選。
那麼,我們的分析步驟也就一目了然了:
Step1: 從 基因列表 到 基因互作
Step2: 從 基因互作 到 互作網絡
Step3: 從 互作網絡 到 關鍵基因
先給大家看看我們的分析結果,後面的教程中,我們會帶領大家實際操作,逐一講解這裡面的分析步驟。
本期乾貨
·
網絡圖分析數據
&
Cytoscape安裝包
關注「科研貓」公眾號,聯繫客服
胖雨小姐姐
or
折耳貓小姐姐
領取
更多科研新鮮資訊、文獻精讀和生物信息技能,請關注科研貓公眾號
往期資源連結
R語言從入門到精通系列
從今天開始,每天學點R語言~(領取教材)
R語言從入門到精通:Day1 (領取安裝包)
R語言從入門到精通:Day2 (領取RStudio操作視頻)
R語言從入門到精通:Day3 (領取測試代碼)
R語言從入門到精通:Day4 (領取代碼)
R語言從入門到精通:Day5 (領取代碼)
R語言從入門到精通:Day6 (領取代碼)
科研作圖系列
【科研貓·繪圖】看·箱線圖·如何美麗動人(代碼分享)
【科研貓·繪圖】優雅版·小提琴圖(帶R代碼分享)
【科研貓·繪圖】繽紛版·韋恩圖(帶R代碼分享)
【科研貓·繪圖】今夏最熱的「熱圖」(帶R代碼分享)
【科研貓·繪圖】朋友圈最火熱的「火山圖」(帶R代碼分享)
生存分析系列
【科研貓】生存分析的正確姿勢(1)視頻+R代碼分享
【科研貓·出品】TCGA超大批量生存分析教程
GEO數據挖掘系列
GEO資料庫挖掘(1)--SCI文章速成
GEO資料庫挖掘(2)--快速鎖定目標數據
挖掘GEO速成SCI文章系列教程(3)-R語言基礎
重磅:GEO資料庫挖掘教程(4)一體化分析代碼(帶視頻+R代碼分享)
GO/KEGG功能富集系列
3分鐘了解GO/KEGG功能富集分析
乾貨預警:3分鐘搞定GO/KEGG功能富集分析(2)
終極篇:3分鐘搞定GO/KEGG功能富集分析-柱狀圖
終極篇:3分鐘搞定GO/KEGG功能富集分析-氣泡圖
TCGA數據挖掘系列
隔壁實驗室的「禿鷲」師兄又發SCI啦--TCGA數據挖掘實戰
TCGA數據挖掘終結者:cBioPortal
生物信息入門系列
大咖聊「生信」—生物信息系列(1)
生物信息系列課程-R語言入門
以上內容均為「科研貓」公眾號原創,嚴禁未經許可擅自轉載及資源分享,如需轉載,請申請獲得許可。