2、cytoscape使用舉例
3、圖形美化
4、子網提取
5、String-蛋白質相互作用資料庫
建議閱讀時間:20分鐘。
Cytoscape 是一個專注於開源網絡可視化和分析的軟體。它的核心是提供基礎的功能布局和查詢網絡,並依據基本的數據的結合成可視化網絡。
Cytoscape 源自系統生物學,用於將生物分子交互網絡與高通量基因表達數據和其他的分子狀態信息整合在一起,其最強大的功能還是用於大規模蛋白質-蛋白質相互作用、蛋白質-DNA和遺傳交互作用的分析。
通過Cytoscape,可以在可視化的環境下將這些生物網絡跟基因表達、基因型等各種分子狀態信息整合在一起,還能將這些網絡跟功能注釋資料庫連結在一起。
Cytoscape 的核心是網絡,簡單的網絡圖包括節點(node)和邊(edge),每個節點可以是基因、miNRA或蛋白質等等;節點與節點之間的連接 (edge) 代表著這些節點之間的相互作用,包括蛋白與蛋白相互作用(pp),DNA與蛋白相互作用(pd)等。
註:Cytoscape安裝前需安裝Java
主頁面
註:版本為cytoscape_3.5.1
主窗口有以下幾個成分組成:
菜單欄
工具欄
網絡處理面板
網絡主視圖窗口
屬性瀏覽板塊(展示選擇的點或邊的屬性和能夠修改屬性值)
1.菜單欄:
File菜單:open(打開一個Cytoscape文件);New(建立一個新的網絡,空的或已經存在的網絡);Import(導入網絡數據和屬性);Export(輸出數據和圖)等
Eidt菜單:Undo(撤銷);Redo(重做);create/destory view (創建/撤銷視圖)等
View菜單:Hide/Show Control Panel(打開或隱藏網絡處理板塊);Show Results Panel(網絡瀏覽)等
Select菜單:不同點和邊選擇選項;過濾器等
Layout菜單:安排可視化網絡,
Plugins菜單:管理插件(install/update/delete)和添加已經安裝的插件
註:把需要的插件從網絡上下載,並複製到系統盤的Cytoscape程序下的Plugins下就可以使用了。
2.工具欄:
主要為菜單欄file的快捷鍵:打開、保存、導入(本地、資料庫、表格)/導出(網絡、表格、圖片)以及網絡主視圖窗口中網絡大小調整等
3.網絡處理板塊:
network:包括所有創建的網絡,可以選擇相應的網絡進行操作
style:屬性(node/edge/network)
Node:對點進行設置,包括:點的形狀、顏色、大小;點邊界線的類型、顏色、寬度;點標籤的顏色、大小;點背景色的透明度等
Edge:對邊進行設置,包括:邊的類型、顏色、寬度;目標處箭頭類型等。
Network:對網絡整體屬性進行設置,包括:背景標題等
Select:面板用於篩選符合特定標準的邊
4.屬性瀏覽版塊:
查看node/edge/network屬性
cytoscape-實例
本文將具體操作怎樣用Cytoscape繪製網絡圖
Cytoscape所支持的數據格式:
1.*.sif格式:
nodeA<interaction>nodeB
nodeC<interaction>nodeD
…
即文件分為三列,第一列和第三列是有相互作用關係的基因名或蛋白質名等,第二列是相互作用的名稱
*.sif格式簡單,容易處理,但它不能規定每個節點的位置、大小、形狀等。
2. xgmml格式,它是一種xml格式,可以規定節點和邊的許多信息,但也更複雜。
3.*.txt格式:用tab分割的純文本文件
可以將文件設置成兩列,每一列都是基因名(或蛋白質名),同一行的兩個基因(或者蛋白質等)代表有互作關係;也可以加其他參數放在第三列,例如兩基因調控的強弱係數
二、應用實例
本文以txt格式的數據進行演示繪製網絡圖
網絡文件:net.txt:共表達網絡;共四列,前兩列是gene id,第三列是共表達類別(正1/負-1),第四列是相關係數,以tab鍵分隔
節點屬性文件:
步驟:
導入網絡文件:file->import->network->file(net.txt)
其中不同標識代表著不同的含義
導入後
導入節點屬性文件:file->import->table->file(node.txt)(此處為table而非network)
註:node.txt:節點屬性文件。四列,包含三種屬性;第一列為gene id,與網絡文件中一致,第二列為gene name(symbol),第三列為分子類型(蛋白編碼基因/lncRNA),第四列為節點在網絡中的度。
上方紅色方框中「Target Table Data」的信息表示將導入的節點屬性表與之前的網絡圖相關聯,其中「Network Collection」選擇的是我們之前導入的網絡文件,其他參數默認如下,可不用修改,如為其他選項,則需要通絡下拉列表重新選擇。
下方紅色方框中「Preview」中:gene,name,molecular type,degree
第一列gene,設置為「Key」,保證gene id不重複,第二三四列均為屬性「Attribute」,如需修改,同樣點擊名稱右側的三角形標誌。
點擊確定後,乍看感覺圖形沒有變化,但此時下方的Table Panel中已自動多出了molecular type,degree兩列
可以通過style中進行簡單網絡圖格式設置
得到網絡圖:
也可以自行拖拽進行微調
導出文件:數據的導出可以是網絡文件,表格文件或者是圖片文件,圖片文件包括多種圖片格式以及pdf格式,在工具欄中對應選擇即可
點擊菜單欄的圖片導出*.pdf(同樣可以採用export導出其它格式)
註:注意調整網絡圖後再保存,否則會出現網絡圖不完整
三、網絡美化
應用上篇所得到的網絡圖進行美化
1.統一模板美化:
採用模板進行簡單美化
得到網絡圖
2.根據數據含義進行美化
根據的molecluar type標註節點所代表lncRNA或者protein
點擊網絡處理面板中style->node->shape進行設置點的形狀,並勾選「Lock node width and height」。
點擊網絡處理面板中style->node->fill color進行設置點的顏色Column選擇「molecluar type」和Mapping Type選擇「Discrete Mapping」,並將lncRNA與protein設置成兩種顏色區分
根據節點的大小來顯示dregee大小,dregee值越大節點直徑越大。
同樣可以對點進行類似的細化設置(根據下列參數進行設置)
根據correlation的值調整邊的顏色:
點擊網絡處理面板中style->edge->stroke color進行設置
Column設置為correlation,mapping type設置為continues mapping,current mapping(默認為白-黑)
註:可以雙擊灰色圖標進行設置其它顏色,點擊set min and max 設置數值,雙擊圖形右上角的倒三角選擇最大值顯示的顏色;同樣雙擊左上角倒三角選擇最小值的顏色;如果需要增加圖注,可點擊「Add」按鈕
同樣也可以對邊進行細化設置
最後再調整「Layout」得到滿意的圖
得到網絡圖:
最後點擊菜單欄的圖片導出*.pdf(同樣可以採用export導出其它格式)
註:注意調整網絡圖後再保存,否則會出現網絡圖不完整
四、子網提取
導入文件:file->import->network->file(ppi.txt)(HPRD中處理後的文件)
註:注意第一行是否為標題行,若是記得在advanced中去掉√
節點選擇:Select->node
注:節點的選擇可以通過將目標節點放在一個文件中導入,如果節點數少的話可以手動點選
註:黃色點為所選的目標節點
若想把其與大網絡分離的話就點擊菜單的圖標欄裡倒數第四個圖標,獲得子圖
同樣可對子網進行修飾
如:改變節點顏色性質並將蛋白質換成對應的gene symbol(label中設置)
最後導出圖片
用MCODE插件,篩選出子網
註:Mcode下載地址:http://apps.cytoscape.org/apps/mcode
導入文件:file->import->network->file(net.txt)
用MCODE插件篩選子網,參數可根據數據自行設置
分析後得到5個子網
可以將它創建到主窗口進行style調整或者導出
創建到主窗口後
對創建到主圖的子圖進行修飾
保存子網即可
MCODE詳細介紹可參考http://baderlab.org/Software/MCODE/UsersManual
四、String-蛋白質相互作用資料庫
STRING是蛋白質相互作用資料庫,可進行是搜索已知蛋白之間和預測蛋白質之間相互作用
主頁:
按照蛋白質名稱,胺基酸序列等信息進行檢索某個特定的蛋白質相互作用的其他蛋白質
例如:TP53 人類,選擇人類
繼續點continue,得到檢索結果
圓圈代表蛋白質,點擊圓圈可以查看蛋白質相關信息
直線代表蛋白質之間相互作用,點擊可以查看互作信息
Setting中可以設置網絡邊代表的意義
evidence:不同顏色的線表示不同證據
confidence:兩個蛋白質相互作用越強連線越粗
actions:不同顏色和形狀的線表示不同的作用
例如confidence
cluster聚類
得到結果
還可以對網絡進行分析、視圖放大縮小或保存
輸入某些蛋白質名稱或胺基酸序列,檢索其相互作用關係
例如:輸入TP53、BCL2、MDM2、CDK2,並選擇人類
檢索結果
String與Cytoscape聯用
將String的蛋白互作數據下載到Cytoscape本地中
Cytoscape中apps->stringApp
安裝完畢後,回到文件>import>network>public databases
選擇string資料庫,以基因或蛋白輸入
以TP53為例,選擇score為0.2,連接的基因最大為80個。
也可以在已構建好的網絡中可以擴展新的連接蛋白數或者重設confidence score來調整網絡大小。
例如重新調整confidence score
可以進一步保存修改調整網絡