Chem. Sci|加速動力學結合馬爾可夫模型指導蛋白設計

2020-12-04 中大唯信

引言

大規模的構象變化對於關聯蛋白質的結構和功能都至關重要,雖然分子模擬能在原子層面觀察構象的轉變,但許多構象是短暫形成的,分布具有隨機性,確定相關結構和它們相互轉換的機制仍然是巨大的挑戰。

本文中,研究人員以一種參與免疫反應並與HIV感染相關的蛋白CypA為例,介紹了結合加速MD(aMD)模擬和Markov模型(MSM)探索構象空間的方法。通過構建MSM模型確定了五個主要的優勢構象狀態以及狀態相互轉換的通路,並且通過理性設計,尋找到2個全新的突變位點,其中D66A會改變蛋白構象,而突變H70A可以穩定構象。aMD/MSM方法對於設計用於蛋白質工程和藥物開發中蛋白質自由能分布的研究具有廣闊的前景。

靜態晶體結構的局限性

捕獲蛋白質的結構以了解其許多功能,一直是結構生物學的目標。實驗上,將蛋白質捕獲到相關的構象狀態並以原子解析度表徵這些狀態可提供巨大的見識。這種靜態「快照」本質上是不完整的,尤其是在蛋白質在動態運動過程中存在許多特殊的現象,理解功能可能需要表徵短暫形成的構象狀態,這些構象空間無法通過實驗表徵。溶液-NMR技術已被證明具有檢測和結構表徵這些功能相關態的獨特能力,這些狀存在的時間尺度為毫秒的數量級上。這些構象狀態在蛋白質摺疊,分子識別和催化等各種過程中發揮重要作用,但在表徵方面仍然具有挑戰性。在蛋白質改造和藥物開發中,我們仍然期待能夠表徵獲取這些構象狀態,探索和操縱蛋白質所進入的整套構象狀態,以及它們相互轉化的機制。

圖1:綜合多尺度的結構生物學

圖片來源:Frontiers in Molecular Biosciences

分子動力學構象採樣

分子動力學(MD)模擬在過去40年中經歷了巨大的發展,可以稱之為」計算顯微鏡「。隨著分子力場的發展,高性能計算機的發展,MD模擬已經成為了研究和描述生物大分子結構變化以及動力學行為的重要工具。如果對局部結構的探究,MD模擬時長往往在幾百納秒的尺度就足夠。但是對於全空間或者某些感興趣構象的採集,則需要更長的模擬時間,一般是為毫秒的時間尺度。而且由於過渡態的隨機性,時間尺度和本身較高的能壘,使得對過渡態的採樣難上加難。

目前流行的是兩種類增強採樣方法,要麼通過增加模擬覆蓋有效時間,能夠詳盡地採樣,比如元動力學(metadynamics),傘形採樣(umbrella sampling); 要麼顯著改變力場的勢能函數(scaled MD或者加速MD(aMD)。前一類方法要求預先提供感興趣運動的自由度,其前提是已經知道相關運動。後一類方法可能會高估勢能面(Free energy Surface)的高能區域,因此會探索構象空間的非物理區域。比如加速MD方法(aMD)就是在體系能量下降時改變盆地的相對高度,從而使FEL(Free energy landscape)局部變得平緩。

圖2:大規模構象變化和不同規模的採樣方法

圖片來源:Frontiers in Molecular Biosciences

馬爾可夫模型

為了改進這些方法,最近5年,基於馬爾可夫模型(MSM)的採樣方法逐漸流行,可以在毫秒級的時間尺度上採樣蛋白質動態。MSM本身是一種統計方法,串聯過渡來描述不同的狀態。MSM可以從一組較短的模擬中推斷出長期的動態變化,為採樣難題提供了又一個捷徑

如何在分子模擬中構造馬爾科夫模型(MSM)

建MSM模型,一般要選擇n個狀態,使得它們涵蓋了整個動力學行為,並且滯後時間τ足夠長以成為馬爾可夫模型,但又短得足以解決系統動力學問題。如果能夠成功做到這一點,則MSM僅從其過渡矩陣提供有關系統的有價值的信息, 如下圖所示,a圖表示的是八段不同的短時間的模擬軌跡,每一段模擬中可以選取不同幀的由一個模擬時間步分開。B圖表示將軌跡分解為若干離散狀態,其中已識別出四個狀態(綠色,藍色,紫色和粉紅色)。C圖表示的是觀察到的轉換計數矩陣,d圖是可逆轉換概率矩陣, e圖是總體概率分布的餅圖,這是概率矩陣的第一個特徵向量。佔比比較高的狀態在熱力學上也更趨於穩定。

圖3:馬爾可夫模型構建

圖片來源:J. Am. Chem. Soc.

方法與軟體

分子動力學模擬:AMBER16和GROMACS5.0

模擬軌跡分析與處理:MDTRAJ

MSM構建:PyEMMA 2.3.0

化學位移計算:ShiftX2和MultiEx

晶體結構優化:CCP4

結果

圖片來源:Chemical Science

在這項工作中,研究人員設計出合適的過渡態採樣流程(圖4b)。這是通過利用aMD高效探索構象空間的能力來實現的,同時依靠MSM程序來描述體系的更準確的熱力學和動力學行為。研究人員將aMD / MSM方法應用到人親Loop蛋白A(CypA)的勢能面搜索中。CypA酶是人類脯氨醯異構酶,將其摻入新的病毒裝配中對於HIV-1感染和HCV複製是必不可少的,這使它成為主要的藥物靶標。之前的研究揭示了變構調控的複雜網絡,這個酶具有兩個功能Loop,殘基65-77組成的70S loop(圖4a)和100-110殘基組成的100sLoop, NMR實驗發現它可在毫秒級的時間尺度上經歷動力學變化。研究人員探究了其中100s和70s迴路在open 狀態和closed狀態之間的交換。

圖4:計算WT-CypA的動態運動過程

圖片來源:Chemical Science

為了能夠更好的研究勢能面,研究人員實施了一種基於氫鍵模式的設計策略,以穩定特定稀疏的具有毫秒時長的構象(圖5)。該過程使得研究人員發現了新的突變體D66A。WT的70sLoop主要處於閉合狀態,這與迄今為止已經解析的大多數CypA結構一致,而D66A預計將主要佔據70sLoop的開放狀態。類似地,作為陰性對照,aMD / MSM預測突變H70A與WT非常相似。為了構建MSM模型,研究人員100個MSM微觀狀態匯總5個宏觀狀態模型中。這五個狀態的構象態勢揭示了100s和70s循Loop都可以採用「開放」和閉合」的構象。雖然兩個Loop的相互轉化在很大程度上是獨立的,但100sLoop的相互轉化比70sLoop的相互轉化快一個數量級(圖5d),這表明蛋白更慢的動力學行為和70s loop 的打開與閉合相關。為了驗證這些發現,研究人員找了一個突變位點,該突變可以穩定70S的開放構象(青色/藍色/紫色)。基於開放和閉合的構象這兩種形式評估了每個殘基與70s loop形成的氫鍵數量(圖5B)。值得注意的是,發現D66在閉合構象中採用了大量的氫鍵,而在開放構象中的氫鍵數量則少得多(圖5C),這使該殘基脫穎而出,成為「可設計的」位點。隨後NMR的結果也驗證了H鍵數量差異的情況。

圖5:突變的設計

圖片來源:Chemical Science

參考文獻:

1.Husic, B. E.; Pande, V. S. Markov State Models: From an Art to a Science. J. Am. Chem. Soc. 2018, 140, 2386-2396.

2.Orellana, Laura. 2019. 「Large-Scale Conformational Changes and Protein Function: Breaking the in Silico Barrier.」 Frontiers in Molecular Biosciences 6: 117.

3. Juarez-Jime nez, J.; Gupta, A. A.; Karunanithy, G.; Mey, A. S. J. S.; Georgiou, C.; Ioannidis, H.; De Simone, A.; Barlow, P. N.; Hulme, A. N.; Walkinshaw, M. D.; Baldwin, A. J.; Michel, J. Dynamic Design:Manipulation of Millisecond Timescale Motions on the energy Landscape of Cyclophilin A. Chem. Sci. 2020, 11, 26702680.

相關文章

ACS Catalysis | 基於分子動力學模擬的脫氫還原酶的理性設計ACS Catalysis | 馬爾科夫模型在糖基轉移酶模擬中的應用JMC | 結合自由能計算應用於靶向EGFR新型抑制劑設計Nature Chemistry | 開源的計算機輔助蛋白酶催化劑設計工具Nature Chemistry | 理論結合實驗揭示Varkud衛星核酶的催化機理Angew Chem | 計算模擬設計大環PROTAC分子

相關焦點

  • Chem. Sci | 加速動力學結合馬爾可夫模型指導蛋白設計
    本文中,研究人員以一種參與免疫反應並與HIV感染相關的蛋白CypA為例,介紹了結合加速MD(aMD)模擬和Markov模型(MSM)探索構象空間的方法。通過構建MSM模型確定了五個主要的優勢構象狀態以及狀態相互轉換的通路,並且通過理性設計,尋找到2個全新的突變位點,其中D66A會改變蛋白構象,而突變H70A可以穩定構象。
  • ...針對高度保守的結合位點設計高選擇性配體?N-肉豆蔻醯基轉移酶...
    當靶標和脫靶之間的結合位點趨於保守時,設計選擇性配體就變得困難重重,已被報導的選擇性抑制劑的潛在分子機制通常仍不清楚。N-肉豆蔻醯基轉移酶(NMT)催化一種共價修飾反應,將14碳飽和脂肪酸從肉豆蔻醯輔酶A上轉移到一系列真核和病毒蛋白的N-末端甘氨酸上。肉豆蔻醯基化在真核生物中是一個共翻譯修飾過程,並在諸如信號級聯轉導,膜泡運輸和蛋白定位等細胞進程中發揮重要作用。
  • 馬爾可夫模型學習
    1.1馬爾可夫過程       馬爾可夫過程(Markov process)是一類隨機過程。它的原始模型馬爾可夫鏈,由俄國數學家A.A.馬爾可夫於1907年提出。該過程具有如下特性:在已知目前狀態(現在)的條件下,它未來的演變(將來)不依賴於它以往的演變 (過去 )。例如森林中動物頭數的變化構成——馬爾可夫過程。
  • 時間序列模型(三)——馬爾可夫模型
    這本書中的第四章,就介紹了馬爾可夫模型。一、馬爾可夫模型太長不看極簡版       通俗的來說,在已知現在的情況下,將來的隨機變化規律與過去發生的事件無關,這種性質,稱之為馬爾可夫性,即無記憶性。       我們稱具有馬爾可夫性的(時間)變量序列為馬爾可夫模型或者馬爾可夫過程。馬爾可夫過程是一種隨機過程——根據一定的概率產生隨機結果或狀態序列的過程。
  • J Med Chem 一周文獻速遞 20200615-20200619
    該抑制劑特異性結合到proMMP2上的D570-A583表位上,幹擾了proMMP2和金屬蛋白酶組織抑制劑TIMP2之間的蛋白-蛋白相互作用,從而阻止了TIMP2輔助的proMMP2激活過程。我們通過表位靶向文庫篩選過程開發了這一環肽抑制劑,並驗證了其與proMMP2的結合。利用人類黑素瘤細胞系,我們證明了環肽調節細胞MMP2活性和抑制細胞遷移的能力。
  • Chem.文獻速遞:20200424-20200501
    在這篇綜述中,作者討論了設計涉及HDAC的雙靶標藥物的理論基礎,並深入了解了這些雙靶標藥物的構效關係。文獻連結:https://pubs.acs.org/doi/10.1021/acs.jmedchem.0c004914.
  • 上大《Chem Eng J》基於新型恆流吸氫動力學模型的貯氫罐數值模擬
    首先,我們需要對貯氫罐的吸氫過程進行建模,提出耦合了傳熱傳質與合金吸氫動力學的數值模型。在該數值模型中,我們針對傳統動力學模型 (如Chou模型,JMAK模型等) 難以快速分析獲得不同壓力範圍內的動力學機理及方程的問題,提出了恆流吸氫動力學模型。
  • 上大《Chem Eng J》基於新型恆流吸氫動力學模型的貯氫罐數值模擬
    首先,我們需要對貯氫罐的吸氫過程進行建模,提出耦合了傳熱傳質與合金吸氫動力學的數值模型。在該數值模型中,我們針對傳統動力學模型(如Chou模型,JMAK模型等)難以快速分析獲得不同壓力範圍內的動力學機理及方程的問題,提出了恆流吸氫動力學模型。
  • ...動力學結合點突變實驗揭示GPCR家族A3腺苷受體與激動劑的結合特徵
    關鍵的胺基酸進行突變實驗驗證,並與MM-GBSA計算結果ΔGeff進行對比,揭示影響激動劑活性的重要殘基,用於後續A3R激動劑的設計指導背景腺苷受體(ARs)是G蛋白偶聯受體(GPCRs)的家族成員,迄今為止,已經鑑定出A1, A2A, A2B, A3四個亞型。
  • 中國科大發現一類膜蛋白分子機器動力學新態
    膜蛋白分子機器是一類重要的分子機器,以往一般採用螢光技術對其活體動力學進行研究。由於螢光漂白效應,對單機器的動力學很難做長時間觀測,有可能會忽略其動力學過程的某些重要信息,這些技術難點讓相關研究面臨很大的挑戰。
  • Attana Cell 200蛋白互作分析儀,生物大分子結合動力學研究工具
    相比傳統分子互作檢測技術,Attana開創了直接在細胞層面進行實時原位分子結合動力學的檢測方法,更準確地反映了體內環境的分子間互作,能夠高質量、精確地研究其特異性、動力學和親和力。>Attana蛋白互作分析儀應用實例用QCM技術檢測蛋白藥物與腫瘤組織切片的結合動力學長久以來,將癌症組織用甲醛固定石蠟包埋(FFPE)後做組織切片,進行免疫組化(IHC)分析,是癌症相關抗原的標準檢測方法。
  • Angew Chem|計算模擬設計大環PROTAC分子
    但是目前linker都是鏈狀分子,通過大環化作用限制分子的生物活性構象是合理設計功能性化學探針有吸引力的策略。作者首次提出大環PROTAC策略,基於VHL:MZ1: BRD4複合物晶體結構和分子動力學(MD)模擬輔助下,設計合成了一系列大環PROTAC,並通過晶體解析驗證了設計的合理性和MD模擬結果的可靠性。
  • Rich information, Deeper Insights - Biacore 結合動力學在癌症...
    結合基因工程與分子生物學技術,發現、了解並確認那些參與細胞周期調控、基因轉錄、細胞分裂與凋亡現象的信號轉導途徑,精確定位那些參與損害壞細胞正常程序性死亡以及導致凋亡逃逸的蛋白分子的關鍵調控基序(motif)和結構域(domain),將有助於發現針對乳腺癌[1,4]、前列腺癌[2,3]、卵巢癌[5.6,7]、結腸癌[8,9]、胰腺癌[10,11,12]等癌症發生相關的生物標誌物,有助於腫瘤研究人員結合臨床樣本分析設計出有效的診斷試劑和腫瘤拮抗劑
  • Chem.:單細胞信號通路蛋白分析為抗癌藥物的促凋亡特性提供新見解
    雖然單細胞DNA分析技術為許多生理和病理過程提供了前所未有的見解,但是相比之下,在單細胞中進行蛋白分析的技術卻落後了。因為蛋白質沒有DNA類似PCR擴增那樣的分析技術,所以單細胞信號蛋白的分析仍然是一個難點。傳統的信號蛋白分析如ELISA和WB等需要大量的細胞,並且無法在活細胞中進行分析。
  • 技術 | 為什麼要研究汽車空氣動力學標準模型?
    顯然,汽車設計需要考慮的目標越多,目標之間的關聯度越大越難求解。但是藉助汽車空氣動力學模型對汽車空氣動力學的認知,可以弄清(6)基本含義,為確定最終的優化指標提供服務。1)理論指導。通過對汽車空氣動力學模型的研究,定性了解車身繞流流體的物理性質、規律,了解車身形狀改變可能對流動特徵的影響,從而了解對氣動力的影響。
  • 2020上半年,中國學者在Chem Rev的表現竟然這麼強
    這些出色的工作表明,基於糖的AIE生物共軛物的前景廣闊,考慮到天然設計和精心設計的糖類在生物過程中起著不同的作用,並且帶有AIE標籤的物質可能在每種情況下都可作為指示劑。但是,有許多尚未觸及的基於糖的生物物種,例如細胞表面和細胞血漿中的粘多糖和糖蛋白。
  • JCIM|從分子動力學軌跡中提取特徵預測P-糖蛋白底物
    引言外排轉運蛋白P-糖蛋白(P-gp)負責從細胞中轉運包括藥物分子在內的多種分子。因此,P-gp介導的外排轉運限制了藥物的生物利用度。為了在藥物發現過程的早期識別潛在的P-gp底物,已經基於結構和物理化學描述符開發了計算機模型。本文中,作者研究了分子動力學指紋(MDFP)作為正交描述符用於訓練機器學習(ML)模型來將小分子分類為P-gp的底物和非底物。
  • 什麼是馬爾可夫決策過程
    關於馬爾可夫決策過程的馬爾可夫是什麼?馬爾可夫是安德烈·馬爾科夫(Andrey Markov),他是著名的俄羅斯數學家,以其在隨機過程中的工作而聞名。「馬爾可夫」通常意味著在當前狀態下,未來和過去是獨立的。
  • 江雷院士、董智超《Sci.Adv》綜述:超潤溼性界面的定向液體動力學
    在這個關鍵時期,有必要總結和整理關於超潤溼界面的定向液體動力學的過去研究,這將有效地指導和激發未來更多的突破性成果。最後,作者對尚待解決的問題和仍然存在的挑戰提出了個人看法,對下一代超潤溼性的仿生人造材料有重要指導意義。相關工作以「Directional liquid dynamics of interfaces with superwettability」發表在《Science Advances》。
  • 馬爾可夫模型:2020年扶貧攻堅以後,我們應該怎麼辦?
    3用運動式策略來改變現狀,遠不如建立體系提升進步和致富的概率更加強大,後者更有價值」在談扶貧攻堅以前,我們介紹一個模型—馬爾可夫模型。這個模型描述了以固定的轉移概率在不同狀態之間轉換的動態系統。如果再假設這個過程能夠在任何兩個狀態之間轉移,並且這個過程不會產生循環 那麼馬爾可夫模型就可以得到唯一的統計均衡。什麼意思呢?以上課的狀態為例子,我們分為兩個狀態:第一,無聊;第二,充實!假設當你精神為充實是,你有90%的概率繼續保持這個狀態,10%的概率機會可能變成無聊;當你覺得無聊的時候,你有70%的概率繼續保持這個狀態,30%的概率機會可能變成充實。