JCIM:計算提升蛋白質-蛋白質相互作用的預測精度

2020-11-30 生物谷

蛋白質-蛋白質相互作用和識別在生物學過程中有著非常重要的作用。儘管結構生物學已經取得了較大的進展,但直接採用

實驗方法

確定蛋白質-蛋白質複合物結構仍然非常困難。分子對接技術是預測蛋白質-蛋白質複合物結構的有效方法。蛋白質-小分子之間的相互作用一般蛋白質受體有結合口袋,相互作用區域比較明確,而蛋白質-蛋白質相互作用則有可能發生在兩個蛋白質表面上任何區域。因此,蛋白質-蛋白質相互作用的預測,需要對蛋白質表面進行全局且充分的搜索,然而全局搜索計算非常耗時。快速傅立葉變換方法(fast Fourier transform, FFT)是蛋白質-蛋白質對接中應用最廣泛的搜索方法,因為該方法可以對蛋白質表面的互補情況進行充分且高效的全局搜索。為了推進蛋白質-蛋白質複合物結構預測的發展,歐洲

生物信息學

中心從2001年開始舉辦CAPRI預測競賽(Critical Assessment of PRedicted Interactions),採用尚未公開發表的蛋白質-蛋白質複合物結構對不同課題組的預測方法進行測試。


儘管CAPRI預測競賽已經取得了較大進展,但基於FFT全局搜索的蛋白質-蛋白質分子對接方法仍然存在一些明顯的局限性。首先,任何原子對打分函數,如原子對接觸勢能,必須定義成相關函數的形式才可以採用FFT方法計算。因此,更精確的距離相關(distance-dependent)原子對打分函數,則難以表示成相關函數形式,從而也限制了精確打分函數在FFT方法中的應用。其次,指定結合位點的分子對接對於提高蛋白質-蛋白質分子對接的準確性非常重要,但位點約束條件也不容易寫成相關函數形式。因此,很少有基於FFT方法的蛋白質-蛋白質分子對接程序能夠在全局搜索中加入殘基位點約束條件。第三,FFT全局搜索中使用的打分函數,一般基於晶體結構進行訓練,這些打分函數對於蛋白質結構的微小變化非常敏感。因此,很多FFT對接方法在結合態(Bound)表現較好,而對於更接近真實情況的自由態(UnBound)對接,則因為蛋白質結構柔性變化而無法預測得到正確複合物構象。因此,有必要改進傳統的FFT全局搜索策略,發展能夠同時實現全局搜索、精確打分和位點約束的蛋白質-蛋白質對接方法。


圖1. CoDockPP程序流程圖


基於FFT的蛋白質-蛋白質對接方法會產生~1010個複合物構象,但傳統的方法僅保留了103-104個構象進行後續精確評分。因此,大量正確的複合物構象在初始階段就已經被排除掉了。常珊課題組建議了一種新的基於FFT的蛋白質-蛋白質對接方法CoDockPP(流程如圖1),伺服器的網址是http://codockpp.schanglab.org.cn。該方法充分運用了FFT方法全局搜索的優點,選擇了幾何匹配較好的對接複合物構象。搜索初期保留了任何有表面接觸的複合物構象,大約108個構象到下一步。這樣可以確保正確的複合物構象進入後續的精確評分。同時,複合物構象被轉化到笛卡爾坐標空間。為了加速計算,應用位點約束信息和快速查表的原子對打分函數,在保證一定精度的前提下逐漸減低候選複合物構象數量(~105)。最後,候選複合物構象進一步通過精確的距離相關原子對打分函數進行排序。CoDockPP程序在benchmark 5.0上進行測試,與ZDOCK程序進行全局分子對接的比較,與RosettaDock程序進行指定位點分子對接的比較。測試比較發現,CoDockPP程序均能顯著改進了成功率和準確預測的數量。特別是在構象變化比較大的困難(difficult)體系上,CoDockPP程序仍然能夠在Top10中準確預測出近天然複合物構象(圖2)。論文發表在2019年第8期的Journal of Chemical Information and Modeling雜誌上。


圖2. CoDockPP程序在構象變化比較大的困難(difficult)體系上(PDB依次為1EER, 2IDO, 3F1P和3L89)表現較好。黃色和藍色表示複合物晶體結構中的受體蛋白質和配體蛋白質。粉紅色表示CoDockPP預測的Top10中最佳的配體蛋白質結構。


為了推動蛋白質多聚體複合物結構的預測,從2014年開始,CAPRI組委會與著名的蛋白質結構預測CASP(Critical Assessment of protein Structure Prediction)組委會共同組織了聯合競賽。在最新的CASP-CAPRI聯合競賽中,常珊課題組的CoDock團隊獲得CASP+CAPRI整體排名第8,CAPRI參賽組排名第4的好成績。特別是在困難(Hard)類型預測中CoDock表現突出,排名第1(圖3,排名截圖自CASP評估官網http://predictioncenter.org/casp13/zscores_multimer.cgi)。


2019年4月,CAPRI組委會在英國劍橋大學舉辦了第七屆CAPRI評估會,此次評估會上谷歌公司的DeepMind團隊介紹了AlphaFold程序在蛋白質單體結構預測中表現。江蘇理工學院常珊課題組也受邀參加了此次評估會,是特邀口頭報告中唯一的中國團隊,課題組主要介紹CoDock團隊在CAPRI預測競賽中的表現,並獲得了CAPRI組委會的肯定。


圖3. CASP-CAPRI聯合競賽中,困難(Hard)類型預測CoDock團隊排名第1


發表論文和連結:


[1] Kong R, Wang F, Zhang J, Xu X J, Chang S. CoDockPP: a multistage

app

roach for global and site-specific protein-protein docking. Journal of Chemical Information and Modeling. 2019, 59(8): 3556-3564.


https://pubs.acs.org/doi/10.1021/acs.jcim.9b00445

相關焦點

  • ...Journal of Molecular Sciences:提出預測蛋白質相互作用的計算...
    蛋白質相互作用研究能夠從分子水平上揭示蛋白質的功能,幫助揭示生長發育、新陳代謝、分化和凋亡等細胞活動的規律在全基因組範圍內識別蛋白質相互作用對是解釋細胞調控機制的重要一步。隨著蛋白質相互作用實驗技術的發展,人們能夠獲得大量的蛋白質相互作用數據,甚至能夠在全基因組範圍內對蛋白質相互作用進行分析。然而,由於實驗技術的限制,很多高通量實驗方法測得的蛋白質相互作用數據的錯誤率都比較高。此外,傳統實驗的方法不適用於檢測大規模數據。
  • 科學網—提出預測蛋白質相互作用的方法
    本報訊(記者彭科峰)日前,中科院新疆理化所王延斌在尤著宏研究員指導下,提出一種使用蛋白質序列信息預測蛋白質相互作用的計算方法
  • 中科院新疆理化所提出預測蛋白質相互作用的方法—新聞—科學網
    本報訊(記者彭科峰)日前,中科院新疆理化所王延斌在尤著宏研究員指導下,提出一種使用蛋白質序列信息預測蛋白質相互作用的計算方法
  • 獨創方法提升蛋白質結構預測精度 騰訊AI Lab聯合研究登上Nature子刊
    通過自研的提升蛋白質結構預測精度的新方法,聯合研究團隊首次解析了II型5a還原酶(SRD5A2)的三維結構,揭示了治療脫髮和前列腺增生的藥物分子「非那雄胺」對於該酶的抑制機制,這將有助於深化研究相關疾病的病理學機制及藥物優化。
  • Nature:計算機預測技術對數十億種藥物-蛋白質相互作用進行排序
    在預測了某種蛋白質是否能與化合物結合之後,藥物研發者們必須在細胞中檢測藥物對這種蛋白質的作用,從而觀察藥物對蛋白質功能的實際影響,以及藥物在不同情況下所需要的劑量等。隨後再進行動物實驗;如果幸運的話,研究者們接下來還可以進行人體試驗。但是加利福尼亞大學(University of California)舊金山分校的計算生物學家Brian Shoichet指出,醫藥公司往往持有這些額外數據的專利。
  • 預測新冠病毒「蛋白質摺疊」重磅武器:AlphaFold!精度碾壓生物與...
    DeepMind:COVID-19相關蛋白結構的計算預測「人類對冠狀病毒的研究已經有幾十年的歷史,所以利用以往的資料庫對COVID-19疫情能做出較快的反應,短短幾天就研究出了新病毒的檢測方法。精度碾壓友商和人類預測出新冠病毒的蛋白質結構至關重要,可以使科學家能夠通過模擬和模型獲得更多關於蛋白質形狀及其運作方式的知識,也給新藥物的開發開闢了新的潛力,降低了實驗成本,並極大的加快科學家找出更有效治療方法的流程,最終得以拯救全世界患者。而此次DeepMind用來預測新冠病毒蛋白質結構的重磅武器,就是其在2018年底推出的、被各路媒體熱捧的AlphaFold。
  • 蛋白質結構預測:生命科學的又一場競爭
    因為「對控制蛋白質鏈摺疊原理的研究」,安芬森獲得1972年諾貝爾化學獎。     然而,蛋白質的空間結構極其複雜,該如何確定呢?現在有兩種方法:一種是實驗測量,包括用X射線衍射和核磁共振成像;一種是理論預測,利用計算機根據理論和已知的胺基酸序列等信息來預測,方法包括同源結構模擬、摺疊辨識模擬和基於第一性原理的從頭計算。
  • JCIM|結合自由能計算能否預測藥物選擇性?
    引言當今鍊金術自由能計算方法已經被廣泛應用於小分子先導化合物的優化過程中,計算精度已經達到了1 kcal/mol左右。儘管如此,在已發表的研究中使用自由能計算來推動作用於兩個相似靶標的化合物的選擇性優化方面相對較少。
  • 騰訊AI Lab 聯合研究登上Nature子刊,獨創方法提升蛋白質結構預測...
    通過騰訊自研的提升蛋白質結構預測精度的新方法,聯合研究團隊首次解析了II型5a還原酶(SRD5A2)的三維結構,揭示了治療脫髮和前列腺增生的藥物分子「非那雄胺」對於該酶的抑制機制,這將有助於深化研究相關疾病的病理學機制及藥物優化。
  • 在線預測蛋白質三級結構,讓文章提升逼格的策略!(附攻略)
    一般而言,同源建模的預測結果是比較可靠的,也是目前比較主流的預測方法。2) 從頭預測(ab initio)對於沒有同源模板或者同源性過低的序列,則無法採用同源模建的方法進行蛋白質結構預測。此時,則採用從頭預測的方法,其主要思想是基於能量計算,尋找能量最低點時的摺疊模式。由於計算量巨大,一般可以預測的蛋白胺基酸數目較小。
  • 分布式計算蛋白質摺疊有何科學意義?
    蛋白質摺疊(Protein Folding)問題被列為「21世紀的生物物理學」的重要課題,它是分子生物學中心法則尚未解決的一個重大生物學問題。蛋白質可憑藉相互作用在細胞環境(特定的酸鹼度、溫度等)下自己組裝自己,這種自我組裝的過程就是我們所說的蛋白質摺疊。
  • 新的深度學習方法從胺基酸序列預測蛋白質結構
    由於蛋白質的形狀決定了它的功能及其在疾病中的功能障礙程度,因此闡明蛋白質結構的努力是所有分子生物學的核心 - 特別是治療科學以及拯救生命和改變生命的藥物的發展。近年來,計算方法在基於其胺基酸序列的知識預測蛋白質如何摺疊方面取得了重大進展。如果完全實現,這些方法有可能改變生物醫學研究的幾乎所有方面。然而,目前的方法在可以確定的蛋白質的規模和範圍方面受到限制。
  • 【譯】蛋白質摺疊問題50年的歷程
    未來的發展方向包括更好的力場, 處理蛋白質與水相互作用的更好模型, 以及更快的構象採樣方法. 即便是使用現今最高性能的計算機, 構象採樣也受到很大的限制.早期, 我們曾希望發現簡單的序列模式, 如疏水, 極性, 帶電和芳香胺基酸, 並以此來預測蛋白質的結構及其穩定性. 這個希望並沒有成真.
  • RNA-蛋白質結合位點預測|蛋白質|RBP|RNA|位點|預測|線性|類型|...
    今天,小編就給大家介紹一種基於深度學習的RNA-蛋白質結合位點預測的網站:RBPsuite,這是一個易於使用的網絡伺服器,用於預測線性和環形RNA上的RBP結合位點。RBPsuite首先將輸入的RNA序列分割為101個核苷酸的片段,並對片段與RBP之間的相互作用進行評分。
  • AI數小時內解決困擾生物學50年的高精度蛋白質摺疊預測問題
    摸清蛋白質的結構可能需要數年甚至數十年的艱苦實驗,而目前的計算機模擬蛋白質摺疊的準確度還不夠。但據《泰晤士報》報導,DeepMind的系統,即AlphaFold,只需要幾個小時就能準確預測出蛋白質的結構。蛋白質是生命所必需的大分子。
  • 【AlphaFold精準預測蛋白結構】|蛋白質|胺基酸|生物學|複合物...
    第一代AlphaFold依託蛋白質資料庫PDB作為訓練數據集,構建神經網絡,採用深度學習預測胺基酸殘基間的方向和距離,混合傳統算法Rosetta對蛋白質結構進行同源建模、結構優化;與此不同的是,第二代AlphaFold則將摺疊蛋白質視為「空間圖」,基於神經網絡系統進行「端到端」的訓練,使用了進化相關的胺基酸序列,多序列比對以及對胺基酸對的評估來優化結構預測。
  • 摺疊革命,深度學習通過胺基酸序列預測蛋白質結構
    如果都能使用這些計算方法,那生物醫學研究都可以被轉換成計算公式。然而,現在一些應用則受到了蛋白質規模和範圍的局限而無法決策。近期,來自哈佛醫學院的科學家應用了深度學習的方法,基於胺基酸序列來有效預測蛋白質的3D結構。
  • 蛋白質的化學反應及與食品成分的相互作用
    1 蛋白質與水的相互作用:蛋白質的水溶性蛋白質與水之間的作用力主要是蛋白質中的肽鍵(偶極-偶極相互作用或氫鍵),或胺基酸的側鏈(解離的、極性甚至非極性基團)同水分子之間發生了相互作用。影響蛋白質水溶性的應素很多:(1)pH>pI 時,蛋白質帶負電荷,pH=pI 時,蛋白質不帶電荷,pH 時,蛋白質帶正電荷。溶液的pH 低於或高於蛋白質的pI 都有利於蛋白質水溶性的增加,一方面是加強了蛋白質與水分子的相互作用,另一方面蛋白質鏈之間的相互排斥作用。等電沉澱。
  • 顏寧等點評:AI精準預測蛋白質結構,結構生物學何去何從?
    最近四年來,有共同進化預測contact map(胺基酸接觸圖譜),並引入深度學習之後,原來的ITASSER/Rosetta/RaptorX等算法都有了很大進步,比原來提升了計算精度一倍以上,只不過AlphaFold2進步更多,說他們接近解決了這個問題沒錯。谷歌公司擁有強大的資源,他們用TPU,我們用GPU,而很多實驗室還沒有GPU。
  • 除了下圍棋 AI還能預測"難纏"的蛋白質結構
    這實際上很符合直覺,我們可以想像,如果同樣的胺基酸序列可以摺疊成不同結構的蛋白質,發揮不同的功能,我們的身體內部會陷入怎樣的混亂狀態。自然界經過漫長的生命進化過程,蛋白質分子在眨眼之間就能夠自發地完成整個摺疊過程。但科學家們發現,如果想要通過計算胺基酸分子間的相互作用來預測它們如何摺疊,那麼要窮盡所有可能的蛋白質構型,需要的時間將比整個宇宙年齡還要長。