你會預測蛋白的三級結構嗎?

2021-02-23 基迪奧生物

關於蛋白的同源建模,大家可能首先會想到Swiss-Model,我們之前也有文章對Swiss-Model的操作使用進行詳細介紹,見《SWISS-MODEL預測蛋白三級結構》。

但在同源建模過程中,可能會遇到過自己的預測模型和模板完全一樣的尷尬。今天給大家推薦一個在線工具——Phyre2,它的Intensive 模式可解決這一問題。

Phyre2是一個可以對蛋白結構、功能和變異進行預測和分析的在線工具,Phyre2是Phyre的升級版本,主要使用遠程同源檢測的方法進行3D建模,預測配體結合位點和胺基酸變異影響(e.g., nonsynonymous SNPs)。據作者稱,每天有700~1000個用戶在用Phyre2分析預測(Kelley, 2015)。

Phyre2的網址是http://www.sbg.bio.ic.ac.uk/phyre2/html/page.cgi?id=index,在電腦端打開這個網址,即可進入用戶界面,如下圖。

蛋白的預測方法一般有三種:template-based modeling(TBM)也稱為同源建模法(homology modeling)、線串法(threading)和重頭預測法(ab initio),其中TMB是使用最廣泛的一種方法。Phyre2有兩種建模方式Normol mode和Intensive mode。Normol mode就是常規的同源建模,建模算法示意圖如下。

(Nature Protocols, 2015)

Intensive mode綜合了multiple template modeling 和 ab initio 兩種算法,在Normol mode的基礎上嘗試建立更完整的模型(full-length model),建模步驟如下圖。

(Nature Protocols, 2015)

用法很簡單,網站不需要註冊,粘入蛋白序列,給這次預測任務(Job)命名,Modelling mode一般默認的「Normol mode」即可。點Pryre Search按鈕就可以進行預測。注意,最好留電子郵箱,預測完成後會自動把預測結果發到這個郵箱,中間的建模過程就可以關閉網頁,愉快的玩耍了。

建模一般需要30min-2小時,點擊郵件中第2個連結(如下圖,建好的模型如紅色線框所示),進入結果頁面。

在結果頁面,可以看建模基於的模板(這裡是c4ybqB)和模型的可信度(confidence),點擊模型的黑底圖片,也可以下載模型文件(pdb格式),如下圖。

當然在網頁上也可以查看模型與模板的相似性、跨膜結構域、結合位點預測(見下圖)等等。

最後,建議大家看《SWISS-MODEL預測蛋白三級結構》,學會同時用這兩個工具進行建模,然後在PyMol中比較兩個模型是否一致。

相關文章:

□ SWISS-MODEL預測蛋白三級結構

□ ProtParam預測蛋白質基本理化性質

□ 常用的蛋白可視化軟體——PyMOL

□ 如何預測蛋白質的亞細胞定位?

參考文獻:

【1】Kelley L A, Al E. The Phyre2 web portal for protein modeling, prediction and analysis.[J]. Nature Protocols, 2015, 10(6):845-858.

作者:莫北

編輯:小瑤

相關焦點

  • 蛋白質二級、三級結構預測
    ,由於實驗方法需要的蛋白樣品質量高,儀器昂貴且費時,急需一種更高效的方法,於是,計算機預測蛋白結構技術發展起來。蛋白質二級結構單元預測:對於有蛋白結構的序列,可以用DSSP軟體展示二級結構原件;對於未知蛋白結構的序列,可以用一些預測軟體:Fromhttps://www.icourse163.org/learn/SDU-1001907001?tid=1206629207#/learn/announce三級結構預測:方法有從頭計算法、同源建模法、穿線法和綜合法。
  • 精準預測蛋白結構的Al,會砸了結構生物學家的飯碗嗎?
    這些激動人心的表述,讓網友們驚呼:如果機器預測蛋白結構這麼準,結構生物學家們的飯碗,要被機器搶走了嗎?其中,一級結構指線性的胺基酸序列;二級是形成穩定結構的胺基酸鏈,比如線圈狀的α螺旋、鋸齒狀的β摺疊;三級是幾個二級結構形成的三維結構;四級結構是蛋白質複合物。 目前DeepMind展示的建模模型處於二級結構到三級結構之間。
  • 預測蛋白結構的AlphaFold,會砸了結構生物學家飯碗嗎?
    這些激動人心的表述,讓網友們驚呼:如果機器預測蛋白結構這麼準,結構生物學家們的飯碗,要被機器搶走了嗎?李賽解釋,蛋白越大、摺疊的不確定性就越大。對於蛋白中穩定的結構域,通過胺基酸序列就可預測二級結構。但隨著結構尺度「升級」,會出現一些摺疊不確定的部分,「這些對於預測是蠻難的,即使是實驗方法都不能保證測出來。
  • 精準預測蛋白結構的AlphaFold,會砸了結構生物學家的飯碗嗎?
    這些激動人心的表述,讓網友們驚呼:如果機器預測蛋白結構這麼準,結構生物學家們的飯碗,要被機器搶走了嗎?從簡單到複雜、分子量從低到多,蛋白質結構可分為四級。其中,一級結構指線性的胺基酸序列;二級是形成穩定結構的胺基酸鏈,比如線圈狀的α螺旋、鋸齒狀的β摺疊;三級是幾個二級結構形成的三維結構;四級結構是蛋白質複合物。目前DeepMind展示的建模模型處於二級結構到三級結構之間。
  • 蛋白質的三級結構與結構域
    肌紅蛋白的三級結構在三級結構中,多肽鏈的盤曲摺疊是由分子中各胺基酸殘基的側鏈相互作用來維持的。二硫鍵是維持三級結構唯一的一種共價鍵,能把肽鏈的不同區段牢固地連接在一起,對於整體構象的穩定起著重要作用。一般二硫鍵的改變引起的失活也可看作變性。
  • 人工智慧預測蛋白結構能力堪比實驗室水平
    不過,傳統的實驗室方法費時(數月到數年)、費力、燒錢,很多人在嘗試尋找新的方法預測蛋白質的三級結構。複雜蛋白質的摺疊過程(圖源:deepmind.com)實際上,咱們現在耳熟能詳的「一級結構決定三級結構」的假說,最早是Christian Anfinsen在1972年諾貝爾化學獎的獲獎感言中提出的,他認為:理論上,蛋白質的胺基酸序列應該完全決定其結構。
  • 蛋白質的三級結構
    蛋白質的三級結構要點:
  • 在線預測蛋白質三級結構,讓文章提升逼格的策略!(附攻略)
    而要更好地從空間結構的觀點來理解蛋白質相應的生物機制,就需要解析蛋白的具體分子結構,因此,採用計算機模擬( in silico) 的方法進行蛋白的結構預測就顯得十分必要。基於序列決定結構的基本思想,通過對預模擬的蛋白序列與PDB資料庫中的序列進行相似性搜索,根據相似序列的結構來測序。一般而言,同源建模的預測結果是比較可靠的,也是目前比較主流的預測方法。2) 從頭預測(ab initio)對於沒有同源模板或者同源性過低的序列,則無法採用同源模建的方法進行蛋白質結構預測。
  • 蛋白質結構研究入門,你都知道嗎(上)?
    PS:結構預測獲得的結構不一定準確,不過近年來隨著資料庫的擴大以及算法的改進,結構預測的準確性越來越高。關於核酸RNA二級結構的預測,之前我們公眾號介紹過RNAstructure的使用:《如何繪製高大上的RNA 二級結構圖?》(關於RNA三級結構的預測,我們稍後會有推文。)我們先來介紹一下蛋白質結構的預測。
  • 【AlphaFold精準預測蛋白結構】|蛋白質|胺基酸|生物學|複合物...
    研究人員使用蛋白質資料庫中接近17萬個不同的蛋白質結構,通過不斷地迭代,AlphaFold系統學習到了基於胺基酸序列精確預測蛋白結構的能力。這一基於原子坐標近乎「暴力」的算法是全新的途徑,是全新算法與強大算力的強強聯合。  正如馬裡蘭大學帕克分校計算生物學家,CASP共同創始人John Moult所言,從某種程度上而言,結構預測問題得到了解決。
  • 第四節 DNA的三級結構與功能
    第四節 DNA的三級結構與功能   (一)DNA超螺旋   雙螺旋DNA進一步扭曲盤繞則形成其三級結構,超螺旋是DNA三級結構的主要形式。對於真核生物來說,雖然其染色體多為線形分子但其DNA均與蛋白質相結合,兩個結合點之間的DNA形成一個突環(loop)結構,類似於CCC分子,同樣具有超螺旋形式。超螺旋按其方向分為正超螺旋和負超螺旋兩種。真核生物中,DNA與組蛋白八聚體形成核小體結構時,存在著負超螺旋。研究發現,所有的DNA超螺旋都是由DNA拓撲異構酶產生的。
  • 谷歌開發AI系統預測蛋白結構取得革命性突破
    相關結果在11月30日CASP舉行的會議上予以總結和展示,AlphaFold預測的蛋白結構可以與使用X射線晶體衍射、核磁共振(NMR)或冷凍電鏡(CryoEM)等實驗技術解析的3D結構相媲美。在過去的幾十年中,我們已經利用X射線晶體衍射、核磁共振(NMR)或冷凍電鏡(CryoEM)等實驗手段確定了171588(PDB資料庫中最新收錄情況)個蛋白質的3D結構,但與自然界中幾千萬條已知基因序列相比,這些結構仍然只佔據了很小一部分,同時上述蛋白結構解析手段都比較耗時費力。為了填補這之間的巨大空隙,蛋白質結構預測一直是科學家們研究的熱點和努力解決的重大生物問題之一。
  • 蛋白質結構分析系列(一)
    我對該領域的狹隘的基本認識        通常情況下,我們認為的蛋白質結構分析可能都是三級結構分析、蛋白和蛋白互作或蛋白與其他生物分子互作的分析,這種分析通常在結構生物學領域常見。事實上,做生物信息學的學生也會經常涉及蛋白質結構分析。
  • 科學家構建RNA三級結構自動化新方法
    三級結構運算方法只能精確預測小體積,簡單拓撲結構的問題。 非編碼RNA(ncRNA)作為催化和調控因子參與了多種生物學進程,這些分子為了能完成其功能,需要形成特殊的三級結構,目前可供分析的可溶性RNA三級結構數量有限,因此研究人員採用了不少計算生物學的方法進行分析,預測RNA三級結構,比如MANIP2,RNA2D3D3,FARNA5/FARFAR6,MC-Fold/MC-Sym7,iFoldRNA8,NAST9,BARNACLE10
  • 乳腺結節三級怎麼調理 良性乳房結節會長大嗎
    乳房對於女性而言是一個極其脆弱需要呵護的部位,有很多的女性朋友們都受到了乳房結節疾病的侵害,如果不及時的去接受治療,很可能會發生惡變的情況,為此大家一定要引起高度重視,那麼乳腺結節三級怎麼調理 ?良性乳房結節會長大嗎?
  • PNAS-葉克窮王金風-MitoNEET蛋白結構功能
    MitoNEET的結晶結構,認為MitoNEET等具有CCCH結構域的蛋白具有電子傳遞功能。肽鍵連接成肽鏈稱為蛋白質的一級結構。不同蛋白質其肽鏈的長度不同,肽鏈中不同胺基酸的組成和排列順序也各不相同。肽鏈在空間捲曲摺疊成為特定的三維空間結構,包括二級結構和三級結構二個主要層次。有的蛋白質由多條肽鏈組成,每條肽鏈稱為亞基,亞基之間又有特定的空間關係,稱為蛋白質的四級結構。所以蛋白質分子有非常特定的複雜的空間結構。一般認為,蛋白質的一級結構決定二級結構,二級結構決定三級結構。
  • 值得收藏——10個蛋白結構分析預測和相關信號轉導網站
    https://scansite4.mit.edu/4.0/#home Scansite可以幫助我們預測蛋白質內部的磷酸化位點、特定結構域結合區、序列查找、蛋白質分子量等等。網站提供基本的使用教程,感興趣的小夥伴可以瀏覽該網站,學習使用相關的工具。
  • 這 11 個可以預測蛋白質結構的網站,通通都安利給你!
    由線性胺基酸組成的蛋白質需要摺疊成特定的空間結構才具有相應的生理活性和生物學功能。解析蛋白質的空間結構對於認識蛋白質的功能、功能的執行、生物大分子間的相互作用,以及醫學和藥學的發展(如藥物靶點的設計等)具有重要意義。為了更快速地了解蛋白質功能,不能只等待蛋白質的測定結果,尤其是對未知蛋白質開展研究之前,通過對蛋白質結構進行預測具有明顯的優勢。
  • 血藍蛋白的結構特點有哪些
    血藍蛋白是蝦血淋巴中的含銅呼吸蛋白,每個氧結合位點有2個銅原子,其氧的結合位點與另一種銅離子結合蛋白——酚氧化酶的氧結合位點的結構具有很高的相似性。血藍蛋白在脫氧狀態為無色,結合氧為藍色。柱結合聚丙烯醯胺凝膠電泳及電鏡技術,鱟魚血藍蛋白的結構特點,純化的血藍蛋白在電泳中出現4個條帶],純化的血藍蛋白再經32層析得到5個洗脫峰,每個峰在電泳下可分辨出4個條帶,電鏡下,血藍蛋白分子出現環形、五角形、十字形和蝴蝶結形等構型並與其他解離的中間的構型同時存在。
  • DeepMind抗疫:預測新冠病毒相關蛋白結構
    「在共享的蛋白質資料庫中,我們的系統準確地為SARS-CoV-2刺突蛋白提供了預測實驗,這使我們相信,我們對其他蛋白質的模型預測可能是有用的。」DeepMind在博客文章中寫道。DeepMind的底氣,來自於AlphaFold——這個2018年12月問世便驚呆科學家的系統,它主要功能是用人工智慧加速科學發現。