蛋白質-蛋白質相互作用和識別在生物學過程中有著非常重要的作用。儘管結構生物學已經取得了較大的進展,但直接採用
實驗方法確定蛋白質-蛋白質複合物結構仍然非常困難。分子對接技術是預測蛋白質-蛋白質複合物結構的有效方法。蛋白質-小分子之間的相互作用一般蛋白質受體有結合口袋,相互作用區域比較明確,而蛋白質-蛋白質相互作用則有可能發生在兩個蛋白質表面上任何區域。因此,蛋白質-蛋白質相互作用的預測,需要對蛋白質表面進行全局且充分的搜索,然而全局搜索計算非常耗時。快速傅立葉變換方法(fast Fourier transform, FFT)是蛋白質-蛋白質對接中應用最廣泛的搜索方法,因為該方法可以對蛋白質表面的互補情況進行充分且高效的全局搜索。為了推進蛋白質-蛋白質複合物結構預測的發展,歐洲
生物信息學中心從2001年開始舉辦CAPRI預測競賽(Critical Assessment of PRedicted Interactions),採用尚未公開發表的蛋白質-蛋白質複合物結構對不同課題組的預測方法進行測試。
儘管CAPRI預測競賽已經取得了較大進展,但基於FFT全局搜索的蛋白質-蛋白質分子對接方法仍然存在一些明顯的局限性。首先,任何原子對打分函數,如原子對接觸勢能,必須定義成相關函數的形式才可以採用FFT方法計算。因此,更精確的距離相關(distance-dependent)原子對打分函數,則難以表示成相關函數形式,從而也限制了精確打分函數在FFT方法中的應用。其次,指定結合位點的分子對接對於提高蛋白質-蛋白質分子對接的準確性非常重要,但位點約束條件也不容易寫成相關函數形式。因此,很少有基於FFT方法的蛋白質-蛋白質分子對接程序能夠在全局搜索中加入殘基位點約束條件。第三,FFT全局搜索中使用的打分函數,一般基於晶體結構進行訓練,這些打分函數對於蛋白質結構的微小變化非常敏感。因此,很多FFT對接方法在結合態(Bound)表現較好,而對於更接近真實情況的自由態(UnBound)對接,則因為蛋白質結構柔性變化而無法預測得到正確複合物構象。因此,有必要改進傳統的FFT全局搜索策略,發展能夠同時實現全局搜索、精確打分和位點約束的蛋白質-蛋白質對接方法。
圖1. CoDockPP程序流程圖
基於FFT的蛋白質-蛋白質對接方法會產生~1010個複合物構象,但傳統的方法僅保留了103-104個構象進行後續精確評分。因此,大量正確的複合物構象在初始階段就已經被排除掉了。常珊課題組建議了一種新的基於FFT的蛋白質-蛋白質對接方法CoDockPP(流程如圖1),伺服器的網址是http://codockpp.schanglab.org.cn。該方法充分運用了FFT方法全局搜索的優點,選擇了幾何匹配較好的對接複合物構象。搜索初期保留了任何有表面接觸的複合物構象,大約108個構象到下一步。這樣可以確保正確的複合物構象進入後續的精確評分。同時,複合物構象被轉化到笛卡爾坐標空間。為了加速計算,應用位點約束信息和快速查表的原子對打分函數,在保證一定精度的前提下逐漸減低候選複合物構象數量(~105)。最後,候選複合物構象進一步通過精確的距離相關原子對打分函數進行排序。CoDockPP程序在benchmark 5.0上進行測試,與ZDOCK程序進行全局分子對接的比較,與RosettaDock程序進行指定位點分子對接的比較。測試比較發現,CoDockPP程序均能顯著改進了成功率和準確預測的數量。特別是在構象變化比較大的困難(difficult)體系上,CoDockPP程序仍然能夠在Top10中準確預測出近天然複合物構象(圖2)。論文發表在2019年第8期的Journal of Chemical Information and Modeling雜誌上。
圖2. CoDockPP程序在構象變化比較大的困難(difficult)體系上(PDB依次為1EER, 2IDO, 3F1P和3L89)表現較好。黃色和藍色表示複合物晶體結構中的受體蛋白質和配體蛋白質。粉紅色表示CoDockPP預測的Top10中最佳的配體蛋白質結構。
為了推動蛋白質多聚體複合物結構的預測,從2014年開始,CAPRI組委會與著名的蛋白質結構預測CASP(Critical Assessment of protein Structure Prediction)組委會共同組織了聯合競賽。在最新的CASP-CAPRI聯合競賽中,常珊課題組的CoDock團隊獲得CASP+CAPRI整體排名第8,CAPRI參賽組排名第4的好成績。特別是在困難(Hard)類型預測中CoDock表現突出,排名第1(圖3,排名截圖自CASP評估官網http://predictioncenter.org/casp13/zscores_multimer.cgi)。
2019年4月,CAPRI組委會在英國劍橋大學舉辦了第七屆CAPRI評估會,此次評估會上谷歌公司的DeepMind團隊介紹了AlphaFold程序在蛋白質單體結構預測中表現。江蘇理工學院常珊課題組也受邀參加了此次評估會,是特邀口頭報告中唯一的中國團隊,課題組主要介紹CoDock團隊在CAPRI預測競賽中的表現,並獲得了CAPRI組委會的肯定。
圖3. CASP-CAPRI聯合競賽中,困難(Hard)類型預測CoDock團隊排名第1
發表論文和連結:
[1] Kong R, Wang F, Zhang J, Xu X J, Chang S. CoDockPP: a multistage
approach for global and site-specific protein-protein docking. Journal of Chemical Information and Modeling. 2019, 59(8): 3556-3564.
https://pubs.acs.org/doi/10.1021/acs.jcim.9b00445