從網絡圖探尋基因互作的蛛絲馬跡(1)

2022-01-09 科研貓

抖音最火slogan:

「很多網友留言想看網絡圖,今天他來了,你看他一身華彩,絢麗多姿,別問落地價,因為paper無價!」。

網絡圖(Network)一直以來,受到眾多高分文章的追捧。它能夠簡潔、直觀地反應出Gene-Gene之間的相互作用關係,特別是能夠通過自身的拓撲結構突顯出某些核心的關鍵基因(Hub gene),就像下面這樣的。

有一次跟學員聊天,她說自己找外包公司做了一個蛋白互作的網絡圖,花了5000塊,做出來的圖還不好看,讓人氣憤的是,調整一下數據重新做個圖,又要5000塊!讓人無法接受。當時我就跟她說,做個互作網絡,根本花不了5000元,5分鐘就能幫你做好。不信,我們看過來。

所謂網絡圖,看似複雜,其實構成非常簡單。網絡圖是一種圖解模型,形狀如同網絡,故稱為網絡圖,它由節點(node)連線(edge)兩個因素組成的。其中node又分為source node(源節點)和target node(目標節點)。這裡的node就是我們的基因,edge就是基因間的相互作用關係。任何網絡圖都不外乎這些構成成分。知道了網絡圖的構成之後,再做圖做分析就很簡單了。

下面我們就按照網絡圖的構成逐一進行講解:

所謂的節點,就是我們要分析的基因。在一個網絡圖當中往往有數十個乃至上百個節點,那就意味著,我們需要分析的基因有數十個或者上百個。這些基因是怎麼來的呢?這就跟我們的研究目的相關了,這些基因可能是我們篩選出來的差異表達的基因,可能是腫瘤患者中高頻突變的一些基因,也可能是某一個miRNA的下遊靶基因,抑或僅僅是你感興趣的一群基因,都是可以的。

在進行網絡圖分析的時候,我們往往對基因的來源不做要求,只要是你認為有意義的一群基因,就OK了。但是,在基因的數量上,我們往往有一定的限制。因為,基因數少了,網絡圖中edge太少,圖做不出來,或者做出來很醜;而基因數多了,網絡圖太大,導致沒辦法導入軟體中進行分析,耗時太久,同時背景噪聲和混雜影響也會更多。因此,我個人一般建議的要分析的網絡圖基因數量在50-300個左右,這樣的網絡圖比較適中,不會太大,也不會太小。

所謂的edge就是基因之間的相互作用關係。比如我隨便列舉兩個基因:TP53和CXCL12,這兩個基因是否有相互作用關係?我們通過何種方法進行判斷呢?這是一個比較困難的問題。好在,有一些非常好的資料庫幫我們解決了這一問題,比如最著名的就是STRING database。STRING (https://string-db.org/) 是一個非常全面的蛋白互作網絡資料庫,裡面存儲了非常多物種和基因的相互作用關係。我們只要把基因名字提交上去,就能夠判定它們之間是否有互作關係了。

 

下面,我們就從實例出發,教大家如何製作一個發表質量的網絡圖。

分析處理組和對照組共得到100多個差異基因,分析其相互作用關係,並找到其中的關鍵基因。

(測試數據見文末,聯繫胖雨小姐姐)

看到這個研究內容,可能一下子有點懵,不要緊,我們先來理理思路:有了基因,我們得分析基因互作,這一步好辦,剛才已經講了STRING資料庫能做。那麼有了基因互作,我們怎麼做網絡圖?怎麼分析關鍵基因呢?這個時候,我們就需要一個軟體來幫我們實現了。 他是誰呢?大名鼎鼎的Cytoscape(Cytoscape最新版安裝包見文末,聯繫胖雨小姐姐)。

Cytoscape(https://cytoscape.org/)是一套完整的網絡圖分析系統,它不僅僅是個軟體,它還包含了一系列程式語言接口、app store等諸多內容,是網絡分析領域的龍頭老大。(突然發現,Cytoscape的主色調和我們科研貓居然是一致的,What a coincidence!)

Cytoscape能夠幫我們實現基因互作的可視化網絡圖,並且通過其諸多分析插件幫我們找到這裡面的關鍵基因,因此掌握Cytoscape之後,我們的這個問題就迎刃而解了。所以,理清思路之後,我們的研究方法如下。

 

利用String資料庫獲取基因相互作用網絡,並使用Cytosacpe軟體對網絡進行可視化和核心基因篩選。

 

那麼,我們的分析步驟也就一目了然了:

Step1: 從 基因列表 到 基因互作

Step2: 從 基因互作 到 互作網絡

Step3: 從 互作網絡 到 關鍵基因

先給大家看看我們的分析結果,後面的教程中,我們會帶領大家實際操作,逐一講解這裡面的分析步驟。

本期乾貨

·

網絡圖分析數據

&

  Cytoscape安裝包


關注「科研貓」公眾號,聯繫客服

胖雨小姐姐

or

折耳貓小姐姐

領取

更多科研新鮮資訊、文獻精讀和生物信息技能,請關注科研貓公眾號

往期資源連結


R語言從入門到精通系列

從今天開始,每天學點R語言~(領取教材)

R語言從入門到精通:Day1   (領取安裝包)

R語言從入門到精通:Day2    (領取RStudio操作視頻)

R語言從入門到精通:Day3    (領取測試代碼)

R語言從入門到精通:Day4    (領取代碼)

R語言從入門到精通:Day5    (領取代碼)

R語言從入門到精通:Day6    (領取代碼)

科研作圖系列

【科研貓·繪圖】看·箱線圖·如何美麗動人(代碼分享)

【科研貓·繪圖】優雅版·小提琴圖(帶R代碼分享)

【科研貓·繪圖】繽紛版·韋恩圖(帶R代碼分享)

【科研貓·繪圖】今夏最熱的「熱圖」(帶R代碼分享)

【科研貓·繪圖】朋友圈最火熱的「火山圖」(帶R代碼分享)

生存分析系列

【科研貓】生存分析的正確姿勢(1)視頻+R代碼分享

【科研貓·出品】TCGA超大批量生存分析教程

GEO數據挖掘系列

GEO資料庫挖掘(1)--SCI文章速成

GEO資料庫挖掘(2)--快速鎖定目標數據

挖掘GEO速成SCI文章系列教程(3)-R語言基礎

重磅:GEO資料庫挖掘教程(4)一體化分析代碼(帶視頻+R代碼分享)

GO/KEGG功能富集系列

3分鐘了解GO/KEGG功能富集分析

乾貨預警:3分鐘搞定GO/KEGG功能富集分析(2)

終極篇:3分鐘搞定GO/KEGG功能富集分析-柱狀圖

終極篇:3分鐘搞定GO/KEGG功能富集分析-氣泡圖

TCGA數據挖掘系列

隔壁實驗室的「禿鷲」師兄又發SCI啦--TCGA數據挖掘實戰

TCGA數據挖掘終結者:cBioPortal

生物信息入門系列

大咖聊「生信」—生物信息系列(1)

生物信息系列課程-R語言入門

以上內容均為「科研貓」公眾號原創,嚴禁未經許可擅自轉載及資源分享,如需轉載,請申請獲得許可。


相關焦點

  • 【科研貓·繪圖】趣味 餅圖 -從「披薩」到「圓形彩虹」
    換言之,餅圖只能表示一個數據系列,特別是能夠表徵各項的大小與各項總和的比例。餅圖中的數據點顯示為整個餅圖的百分比。餅圖的繪製方法有很多,像常用的Excel、GraphPad都可以,當然最靈活多變的還是首推R語言,其他軟體繪製餅圖都沒有什麼特別的,非常簡單,這裡就不做贅述,今天我們重點學習一下R語言中餅圖的製作。
  • 【科研貓·繪圖】bar(霸)圖繪製之霸氣滿屏
    很多同學也許會問,bar圖有什麼難的,我科研論文做第一張圖就是bar圖,so~so~easy。當然實驗設計和內容絕對佔99.99%因素,可是縱覽所有高分論文,可以有灌水的文章,卻沒有不好看的圖。很多同學可能遇到這種情況,論文投稿後,reviewer的意見就有:親,圖能否做得更規範(更好看,更美觀)些?
  • 釋疑|什麼是基因互作現象?基因互作的實質是什麼?
    實際上該類題有一定的解題方法和思路,這類題常見的變式比也就是12:3:1;9:6:1;9:3:4;15:1;13:3;9:7等形式。了解這些變式比例有利於解答遺傳題。問題:什麼是基因互作現象?基因互作的實質是什麼?試題1:(Z20模擬試題)某種甘藍的葉色有綠色和紫色。只含隱性基因的個體表現隱性性狀,其他基因型的個體均表現顯性性狀。
  • Metascape:基因注釋、功能富集分析、蛋白質互作分析
    這個強大的集基因注釋、功能富集分析、蛋白質互作分析於一體的基因分析網站就是我們要安利的Metascape(http://metascape.org/)。它能幫助用戶將當前流行的生物信息學分析方法應用到批量基因和蛋白質的分析中,以實現對基因或蛋白功能的認知。
  • 一種近距離染色質互作形式-chromatin loops 的研究進展
    其實,即使在常染色質開放活躍的區段,染色質區段間的互作也會動態修飾染色質拓撲結構,從而影響區域內基因的表達。進一步地,通過高解析度Hi-C圖譜發現,TAD內還可以進一步劃分出互作頻率高的區域,這一部分就是染色質環(chromatin loops)。染色質環通過拉近基因和其調控區域的空間距離,影響基因的表達和轉錄(圖1示染色質環)。
  • 探究蛋白質和lncRNA的互作
    題目探究蛋白質和lncRNA的互作摘要長非編碼RNA通過和蛋白質互作行使功能(可能是一對多或者多對一的互作關係
  • New Phytologist | 一種近距離染色質互作形式-chromatin loops 的研究進展
    其實,即使在常染色質開放活躍的區段,染色質區段間的互作也會動態修飾染色質拓撲結構,從而影響區域內基因的表達。進一步地,通過高解析度Hi-C圖譜發現,TAD內還可以進一步劃分出互作頻率高的區域,這一部分就是染色質環(chromatin loops)。染色質環通過拉近基因和其調控區域的空間距離,影響基因的表達和轉錄(圖1示染色質環)。
  • Science亮點 | 遺傳互作圖譜新應用:蛋白複合體結構鑑定
    相對於結構生物學家,遺傳生物學家青睞於研究遺傳互作解析基因間的功能,並利用酵母為生物模型,繪製了大量基因互作圖譜。Charles Boone課題組等在2001和2004年分別發表了Science論文工作【1, 2】,發布了SGA(Synthetic Genetic Array)技術,利用該方法研究雙突變基因酵母細胞表型,繪製了酵母內的基因互作圖譜,解析了多種蛋白的潛在新功能。
  • cytoscape的cytohubba及MCODE插件尋找子網絡hub基因
    不太長的總結版本,基因的蛋白互作網絡圖可以類比於人群社會關係連接圖,然後子網絡hub基因,類似於人群裡面的不同派系,各個派系的首腦人物!正文分割線,作者JOJO剛剛接觸cytoscape,應該怎麼學習呢?感覺這個軟體參數賊多,還是英文,一看就頭大,怎麼入手呢?JOJO表示不慌,下面是一些JOJO熟悉cytoscape的思路,可供參考。
  • WGCNA 簡明指南|1. 基因共表達網絡構建及模塊識別
    基因共表達網絡構建及模塊識別參考簡介數據導入、清洗及預處理自動構建網絡及識別模塊確定合適的軟閾值:網絡拓撲分析一步構建網絡和識別模塊往期參考本文主要參考官方指南Tutorials fornetwork analysis)是用來描述不同樣品之間基因關聯模式的系統生物學方法,可以用來鑑定高度協同變化的基因集, 並根據基因集的內連性和基因集與表型之間的關聯鑑定候補生物標記基因或治療靶點。
  • 建立量化網絡中直接關聯性的部分互信息新方法
    該成果首次提出「部分互信息」的新概念和理論,通過「部分互信息」量化網絡中節點之間的直接相關性,可實現由觀測數據直接構建網絡。 在數據分析中,定量的標識變量的直接依賴性是一件非常重要的事情,特別是對於科學和工程中各種類型的網絡重構和因果推斷問題,都需要高精度的理論和方法。
  • 計算機輔助藥物設計(CADD)——蛋白質分子對接和網絡互作研討班
    授課對象:有生物分子互作分析需求的或者希望深入了解並掌握生物分子互作生物信息學分析資料庫及工具的研究生、科研工作者。學員基礎:由於培訓具備一定的深度和廣度,我們希望學員應具有學習生物分子互作軟體的興趣、基本的生物概念和相關基礎知識。
  • 動物所揭示非模式哺乳動物與其寄生蛔蟲協同演化的基因組學機制
    已有的關於協同演化遺傳機制的研究較多集中於候選基因水平,缺乏基因組水平的研究。隨著基因組測序技術的發展,一些和人類及家養動物健康相關的寄生蟲基因組被解析。然而,目前多數研究著眼於寄生蟲基因組的結構和功能解析,未探討相應宿主基因組的相關變化,以及宿主與寄生蟲兩者間協同演化的基因組學機制。
  • 中國農大孫振鈞團隊Nature子刊封面文章:通過全基因組學分析揭示蚯蚓全球分布的分子機制
    在這以後,越來越多的科學家發現蚯蚓的存在可以顯著提升土壤的肥力,降低土壤有毒物質,增加土壤微生物群落的多樣性,是土壤汙染狀況的指示生物。這個被達爾文視為卑微卻又偉大的「土壤生態系統工程師」和人類協作了幾千年,幫助人類高質量和高效地從土地獲取食物。
  • 福建高校青年暑期社會實踐探尋紅色文化基因 感受鄉村蝶變
    福建師範大學馬克思主義學院青年學生探尋紅色文化基因同學們在進行實踐走訪 馬克思主義學院供圖為探尋紅色文化基因,探索「校地合作」助力鄉村振興新路徑,福建師範大學馬克思主義學院福建農林大學經濟學院一「網」情深農經實踐隊:「雲」遊溪背,探訪幸福小村的脫貧之路同學們在駐村書記付松程帶領下,進行實踐採訪 經濟學院供圖福建農林大學經濟學院一「網」情深農經實踐隊
  • 非腫瘤純生信:Tuner症候群的核心基因篩選
    作者希望通過分析GSE46687這個比較TS患者和正常女性外周血單核細胞基因表達差異的數據集,去揭示可能的TS致病基因,探究其發病機制。二. 文章思路三. 結果解析1.;1|,adjp<0.05,並取交集。
  • 蘇科大機械院實踐團開展「探尋紅色基因,傳承紅色文化」系列活動
    特值建黨九十九周年之際,為號召當代青年人不忘初心、牢記使命,堅定信仰、堅定理想信念,做社會主義核心價值觀的堅定信仰者、積極傳播者、模範踐行者,蘇州科技大學機械工程學院積極參與「三下鄉」暑期社會實踐活動並組建了「紅色基因追夢人」團隊。
  • 基因能量圖流日 | 10號閘門
    收錄於話題 #基因能量圖 各位螺旋夥伴大家好!
  • 高中生痴迷網絡色情 上課互傳祼照黃書(圖)
    課間互發色情圖片石河子部分學生痴迷網絡色情上課互傳祼照黃書亞心網iyaxin.com訊(本網記者 白素君)下課進網吧、課間互發色情圖片……黃禍正在石河子一些學校蔓延。王明說,對學生進網吧或包夜的現象,老師和家長已不奇怪,最近讓他煩心的是,越來越多的學生,上課傳字條、通過手機藍牙功能轉發圖片,同學間相互傳閱的內容「除網路遊戲和情愛話題外,還有很多黃色小說和裸照」。在王明老師收繳的字條上,記者看到,上面除了談論網路遊戲如何升級外,還有從網吧伺服器及從某些醫院網站下載下來的關於性愛的話題。