原創 TACC 世界頂尖科學家論壇
為什麼研究蛋白質對抗擊新冠疫情很重要?
我們知道,病毒主要由核酸和蛋白質外殼組成,新冠病毒COVID-19也不例外。如果有個「照妖鏡」,能夠全方位展現病毒的結構,找到它們防禦系統中的薄弱環節,進而阻礙、擊破其作用過程,問題就能夠迎刃而解。
就在上周,DeepMind公司以其精確的人工智慧預測,撼動了整個蛋白質結構界。與此同時,石溪大學(紐約州立大學石溪分校)開發的新計算工具,有助於表徵蛋白質結構,並確定針對新型冠狀病毒的新療法。
該研究團隊首先利用一種名為MELD的算法,來確定冠狀病毒未知蛋白的3D形狀。目前為止,病毒的29種蛋白質中,只有3種被徹底解釋;而德克薩斯州高級計算中心(TACC)的Frontera超級計算機,使得迪爾及其團隊對另外19種蛋白質結構的預測成為可能。而其中的每一個,都可以作為新藥開發的切入口。
COVID-19感染人體細胞的CMP建模
圖| Lucy Fallon, Laufer Center
走進有趣的大分子:蛋白質
過去五十年裡,我們已經了解了很多關於蛋白質的秘密——它們是如何工作的、它們與什麼相互作用、它們的作用機制是什麼。第一個三維蛋白質結構始於上世紀70年代,而今天,我們已經擁有了包含成千上萬種蛋白質的生物大分子3D結構的全球資料庫。
聽起來很厲害?遠遠不夠。
因為3D結構通常不足以真正了解蛋白質的功能,石溪大學勞弗物理和定量生物學中心主任、美國國家科學院院士肯·迪爾(Ken Dill)用了一個巧妙的比喻:「這就好像有人在問汽車的工作原理,然後一名機械師打開了汽車的引擎蓋說,『喏,這個發動機,就是它的工作原理』。」
Ken Dill 圖|quantamagazine
幾十年來,計算機模擬通過設置這些三維分子的機器運動,已經建立並增加了對蛋白質行為的理解。分析他們的能量狀況、相互作用和動力特徵,使我們更加了解這些大分子的「生命源動力」。
「我們期望腳踏實地解決這樣一個問題:它究竟是怎麼工作的?而不只是,它看起來如何?」迪爾說,「這就是為什麼,我們想要首先了解蛋白質的結構。而它最大的應用之一就是藥物的研發。」迪爾和他的同事卡洛斯·西默林(Carlos Simmerling)和埃米利亞諾·布裡尼(Emiliano Brini),於2020年11月在《Nature》雜誌上發表文章,分享了他們對該領域發展的看法——
Carlos Simmerling(右)和Emiliano Brini(左)
「計算分子物理學是一個越來越強大的工具,用以講述蛋白質分子發生作用的故事。」 他們寫到,「力場、增強取樣方法和加速器方面的系統性改進,使得計算分子物理學能夠解決重要生物作用過程的時間尺度問題…以這種速度來看,在接下來的25年裡,我們將實現在十幾分鐘裡,講述在一個細菌細胞中蛋白質分子的生命周期故事。」
超速模擬技術究竟是什麼?
然而,在第一個蛋白質動態模型出現幾十年後,計算生物物理學家仍然面臨著重大挑戰——為了有用,模擬需要精確;為了精確,模擬需要一個原子一個原子、一飛秒一飛秒地進行(1飛秒=10-12秒)。為了匹配重要的時間尺度,模擬必須超過數微秒或毫秒,也就是數百萬個時間步驟。
迪爾補充到:「相對而言,儘管計算分子物理學發展迅速,但這還不足以帶我們進入所需要看到的時間、大小和運動範圍。」
研究人員用這種方法來理解蛋白質的主要方法之一,叫做分子動力學。自2015年以來,在美國國立衛生研究院和國家科學基金會的支持下,迪爾和他的團隊一直致力於加快分子動力學的模擬速度。他們的方法稱為MELD,通過提供關於被研究系統的模糊但重要的信息來加速這一過程。
MELD和CPI的運作形式 圖|ResearchGate
迪爾將該方法比作尋寶。他們沒有要求某個人去漫無目的地尋找寶藏,而是提供了一張帶有線索的地圖:「它要麼在芝加哥附近,要麼在愛達荷州附近。」對於蛋白質來說,我們可以把「尋寶」理解成,告訴模擬系統一個胺基酸鏈的一部分靠近鏈的另一部分。這種搜索領域的縮小,可以顯著加快模擬速度(有時要快1000倍以上) ,使得新穎的研究成為可能,並提供新的見解。
COVID-19的蛋白質結構預測
說回頑固的新冠病毒COVID-19,我們在開頭所說的「照妖鏡」,其實就是3D模型,藥物的研發是生物物理模型最重要的應用之一。病毒或細菌的3D模型有助於識別其防禦系統中的薄弱環節,而分子動力學模擬可以確定哪些小分子可以與這些攻擊者結合,就無需在實驗室中測試所有的結合可能性,提高其工作質量。
「幾乎每個人都放棄了其它研究,選擇攻克新冠病毒。」迪爾回憶到。
過程並沒有想像中順利。研究團隊採取的第一步,是利用MELD方法來確定冠狀病毒未知蛋白的3D形狀。目前為止,病毒的29種蛋白質中,只有3種被徹底解決了。「大多數蛋白質結構尚不清楚,這對於藥物研發來說不是一個好的開始。」迪爾轉而問到,」我們能預測未知的結構嗎?這是我們用Frontera的主要目的。」
德克薩斯州高級計算中心(TACC)的Frontera超級計算機,是世界各大學範圍內運行速度最快的。這使得迪爾及其團隊對另外19種蛋白質結構的預測成為可能。而其中的每一個,都可以作為新藥開發的切入口。他們已經公開了其結構預測結果,並正在與團隊合作以實驗方式測試其預測準確性。
圖|Emiliano Brini, Laufer Center
石溪大學勞弗中心小組預測的小分子藥物(綠色)與其靶蛋白(灰色)的結合姿勢。預測的結構與在實驗觀察中的結構高度相似。
雖然這場「疫苗競賽」就快宣布勝利者了,但第一輪疫苗、藥物和治療都只是康復的起點。與愛滋病病毒一樣,第一批研發的藥物可能不會對所有人都有效,或者在未來會被更有效、副作用更少的藥物超越。迪爾和他的勞弗中心團隊正在進行長期的研究,希望找到比已經研發的藥物更有希望的靶點和機制。
此外,石溪大學勞弗中心的研究團隊還致力於,通過Frontera掃描數百萬種可商購的小分子以對抗COVID-19的功效,來縮短發現新藥的時間;研究一種有趣的細胞蛋白,被稱為PROTAC,該蛋白指導人類細胞的「垃圾收集蛋白」,來收集那些通常不會去除的特定靶蛋白。
每一個蛋白質都藏著一個特殊的故事,迪爾、布裡尼和同事們,正在構建和應用有助於闡明這些故事的工具。「在蛋白質科學中存在一些問題,我們認為真正的挑戰是如何正確理解其中的物理和數學問題。」迪爾總結到,「我們正在新型冠狀病毒肺炎裡驗證這一假設。」
編譯 | 阿曼
排版|木木
編輯|羽華
責編|小文
閱讀原文