STRING:蛋白相互作用資料庫的使用

2021-02-23 如沐風科研
昨天我們介紹了一些網絡分析當中用到的一些基礎的知識(相互作用網絡分析基礎)。對於基因組數據分析而言的話,我們能用到網絡分析的就是蛋白相互作用分析(protein-protein ineraction, PPI)分析了。



蛋白相互作用分析的資料庫有很多,至於為什麼選擇STRING,還是在於其強大的可視化,以及自定義功能。這樣我們可以得到數據結果的同時,還可以得到相對好看的圖。下面我們就來介紹一下STRING 資料庫如何使用吧~



我們在打開資料庫之後,在菜單欄可以看到很多種來進行相互作用關係預測的選項。如果我們有一個目標蛋白,想要查看這個蛋白的可能的相互作用蛋白可以選擇Protein by name;如果我們有很多蛋白,想要查看這些蛋白之間的相互作用關係,那就可以選擇Multiple proteins


由於我們在之前的差異表達分析的時候,可以得到很多基因,所以我們這裡選擇Multiple proteins來進行下一步分析。這裡我們需要的輸入的就是基因名即可,基因名與基因名之間通過通過換行來間隔。另外需要做的就是選擇目標物種,由於我們做的是人的分析,所以選擇人即可。


接下來點擊SEARCH即可。這個時候需要注意的是,點擊完之後,頁面會馬上彈出來。但是對於目標蛋白是不是全部都輸入全了。我們需要一直往下拉頁面,在最下面看到continue這個按鈕。點擊最下面這個才算是加載完了。

我們點擊完之後,就可以看到直接分析的結果了。



首先我們看到的分析結果是就是一個相互作用網絡的圖。對於這個網絡,我們可以通過滑鼠來拖動每個node。來使得圖形更好看一些。這樣也可以導出來直接用了。

下面就是關於這個網絡的這種設定以及自定義了。



首先我們可以看到對於結果的注釋,裡面標註了不同的node和不同的edges代表什麼。(如果不知道node和edge是什麼,建議看一下昨天的帖子哦。)



在設定裡面,我們可以設置自定義來設定不同的結果。我們可以選擇不同的數據來源,可以設定相互作用的界限以及設定網絡圖的設置。



對於輸入的基因,這個資料庫也是可以進行GO和KEGG分析的。另外呢,由於是網絡分析,所以對於網絡的基本信息也是有簡單的描述的。



對於網絡的結果,我們可以在導出當中導出相關的結果。其中就包括,一開始看到的網絡圖,以及包含網絡edge信息的數據結果。


寫在最後:

基本上對於STRING的蛋白相互作用分析就是這麼多。這個只是通過資料庫確定基因之間的相互作用關係,但對於尋找核心基因,還沒進行查找。明天我們來介紹一下如何進行核心基因的查找。


相關焦點

  • STRING:蛋白質相互作用(PPI網絡)資料庫簡介
    研究蛋白之間的相互作用網絡,有助於挖掘核心的調控基因,目前已經有很多的蛋白質相互作用的資料庫,而string絕對是其中覆蓋的物種最多,相互作用信息做大的一個,網址如下https://string-db.org/該資料庫的最新版本為version 10.5, 更新於2017年5月14號,
  • String:蛋白互作網絡(PPI)分析資料庫
    String資料庫是一個搜索已知蛋白質之間和預測蛋白質之間相互作用的資料庫,該資料庫可應用於2031個物種,包含960萬種蛋白和1380萬中蛋白質之間的相互作用。它除了包含有實驗數據、從PubMed摘要中文本挖掘的結果和綜合其他資料庫數據外,還有利用生物信息學的方法預測的結果。
  • R:STRINGdb包用於string蛋白互作分析
    使用STRING資料庫進行蛋白互作分析是生信常規下遊分析項目之一。
  • BioGRID 蛋白質相互作用資料庫
    生物通用交互數據集庫(BioGRID)是一個公共資料庫,用於存檔和傳播來自模型生物和人類的遺傳和蛋白質相互作用數據。BioGRID目前擁有超過1,500,000種來自高通量數據集和個人重點研究的互動,這些研究來自於初級文獻中的63,000多份出版物。
  • JMC | 深入研究非常規蛋白-配體相互作用
    一些多極相互作用方式的重要性也被強調,除了陽離子-π外,陰離子-π也得到了一些認可。這些有利的潛在相互作用類型,在本文中統稱為非常規的相互作用(unusual interactions)。作者將Taylor的概念應用於蛋白質-配體結合位點,探究了蛋白質資料庫(RCSB)中不同類型的作用模式,洞察分子間的相互作用偏好,並對其與分子識別的相關性進行統計評估。
  • 蛋白組學/代謝組學如何快速從主流資料庫中獲取人/小鼠數據?
    (4)點擊下載MYH9基因序列NCBI Reference Sequence: NC_000022.11,起個合適的文件名,推薦使用基因名或者資料庫登錄號 (3)查看P35579蛋白的生物學信息:肌球蛋白9(Myosin-9);
  • 蛋白組學/代謝組學如何快速從主流資料庫中獲取人/小鼠數據?
    (4)點擊下載MYH9基因序列NCBI Reference Sequence: NC_000022.11,起個合適的文件名,推薦使用基因名或者資料庫登錄號;(5)物種基因組和蛋白組序列的下載選擇Genome子資料庫,同樣在搜索框輸入物種英文名或拉丁學名,例如,輸入human,我們查找人的基因組數據,
  • Co-LncRNA:lncRNA與蛋白編碼基因的共表達網絡資料庫
    在生物信息學中,對於基因功能的挖掘,通常的做法就是利用GO和KEGG等功能資料庫,但是這些資料庫中都是蛋白編碼基因的功能,為了利用這些資料庫中的信息,我們需要在lncRNA與mRNA之間建立起聯繫,常見的思路有以下幾種通過lncRNA和mRNA之間的相互作用很多文獻和資料庫中都有報導的lncRNA與mRNA之間相互作用,也可以通過軟體來預測二者之間的結合
  • 拓展G蛋白和G蛋白偶聯受體相互作用「圖譜」
    來自日本海德堡大學和仙臺大學的研究人員使用新生物技術方法研究人類細胞如何對外部信號進行反應和進一步處理。
  • ​Uniprot,一個熟悉又陌生的資料庫|使用Uniport獲取相關蛋白注釋信息(一)
    Uniprot是一個免費、老牌的生物信息學資料庫,很多文章都使用了Uniprot中的數據。我們仍然使用PD-1蛋白作為例子,講述Uniprot中怎樣獲取該蛋白的注釋信息。打開www.uniprot.org,在UniprotKB界面中的檢索框中輸入「programmed cell death protein 1」,並點擊「Search」,獲得結果列表。
  • Science:利用基因共同進化揭示蛋白相互作用網絡
    論文通訊作者、華盛頓大學醫學院生物化學教授David Baker說道,「蛋白-蛋白相互作用是生物功能的基礎。如今能夠使用近年來產生的大量基因組序列數據來預測它們,這是非常了不起的。」細胞中充滿著蛋白,其中的許多蛋白必須在物理上相互作用才能發揮作用。這意味著它們聚集在一起複製DNA,或者形成長纖維,就像在肌肉中發現的那樣。
  • 一站式 lncRNA 查詢資料庫|lncRNA|資料庫|亞細胞|查詢|序列|預測|...
    這個資料庫沒有使用基因名數據的方式來進行查詢,而是使用了輸入Fasta序列的方式來進行查詢的。我們需要做的就是選擇物種、輸入序列、提交結果。在結果界面,首先能看到一個在左側側邊欄有一個主要的結果,這個是資料庫對於一個lncRNA所有相關的注釋的條目,我們可以點擊某一個標題就可以直接跳轉到這個地方了。
  • 一站式 lncRNA 查詢資料庫
    這個資料庫沒有使用基因名數據的方式來進行查詢,而是使用了輸入Fasta序列的方式來進行查詢的。我們需要做的就是選擇物種、輸入序列、提交結果。在結果界面,首先能看到一個在左側側邊欄有一個主要的結果,這個是資料庫對於一個lncRNA所有相關的注釋的條目,我們可以點擊某一個標題就可以直接跳轉到這個地方了。
  • 上海生科院揭示組蛋白分子伴侶DAXX和染色質重塑蛋白ATRX相互作用...
    蛋白與染色質重塑蛋白ATRX相互作用的結構基礎。  ATRX蛋白是染色質重塑蛋白SNF2家族中的一員,與地中海貧血症、智力發育遲緩、癌症等疾病密切相關。DAXX蛋白(死亡結構域相關蛋白)作為組蛋白H3.3的分子伴侶,介導含H3.3組蛋白變體的核小體的組裝,參與細胞核內基因轉錄、調控細胞周期等生理過程。此外,DAXX能與多種細胞因子、細胞蛋白和病毒蛋白相互作用,抑制病毒轉錄,具有內在的抗病毒防禦作用。
  • 在unity中用C#連接資料庫步驟
    歐陽小白之前做的一直是單機遊戲,所以根本用不到資料庫和伺服器。不過最近我開始折騰聯網遊戲。所以本文就介紹一下unity連MySQL資料庫所遇到的一些坑。unity連接資料庫,首先你需要導入如圖所示的五個數據連結庫。
  • 如何在ubuntu20.04安裝MySQL並修改資料庫密碼
    帳號debian-sys-maint,進行登錄8、進入資料庫後,輸入命令,查看資料庫show database;查看資料庫 show databases;9、使用資料庫mysql,用命令use mysql;
  • TSGene:腫瘤抑癌基因資料庫
    TSGene是一個從文獻中收集整理的抑癌基因資料庫,文章發表在Nucleic Acids Research,連結如下https://academic.oup.com/nar/article/41/D1/D970/1074154資料庫的網址如下https://bioinfo.uth.edu
  • 研究蛋白質你的資料庫用對了嗎?常用蛋白質資料庫分享
    結構域結構、轉錄後修飾、修飾位點、變異度、二級結構、三級結構等,同時提供其他資料庫,包括序列資料庫、三維結構資料庫、2-D凝聚電泳資料庫、蛋白質家族資料庫的相應連結。(蛋白家族、蛋白質功能、蛋白質網絡、蛋白質互作、基因組等資料庫)存在著交叉應用。
  • Cell | 應激顆粒中多樣的蛋白相互作用
    本文通訊作者是加州大學聖地牙哥分校的Gene W.Yao,其實驗室的主要方向是研究幹細胞中RNA結合蛋白以及RNA修飾是如何影響細胞穩態。   Stress Granules (SGs, 應激顆粒) 是在細胞壓力條件下短暫形成的核糖核蛋白聚集物,其越來越被認為跟神經退行性疾病相關。
  • ...磷酸化密碼被破解-阻遏,蛋白,複合物,徐華強,通路,相互作用...
    原標題:中科院上海藥物所成果刊發《細胞》雜誌 磷酸化密碼被破解  目前,40%左右的上市藥物以G蛋白偶聯受體(簡稱GPCR)為靶點。2015年中國科學院上海藥物研究所徐華強研究員領銜國際上28個實驗室,利用世界最強的X射線雷射成功解析了一個經典的GPCR視紫紅質與阻遏蛋白複合物的晶體結構,揭示了GPCR如何激活阻遏蛋白信號通路。時隔兩年,徐華強合作團隊繼續發現了磷酸化視紫紅質與阻遏蛋白相互作用的「密碼」,而這一「密碼」對整個GPCR蛋白組具有普遍性,將有助於研發高效低毒藥物。