本文作者:carollero
新冠疫情初期,科學家雜誌(The Scientist)發布一篇報導,呼籲公民玩一款免費的在線遊戲,幫助設計與新冠病毒突觸結合的新蛋白質。
Foldit 上最新遊戲的一個示例,要求用戶設計與冠狀病毒刺突蛋白結合的蛋白(圖源:The Scientist)
研究人員表示,全世界任何人都可以下載並在 Mac、Linux 或 Windows PC 上運行這款遊戲。而他們將判斷這些遊戲產物是否可以起到識別作用,從而阻止冠狀病毒的感染。
預測蛋白質結構,機器不如人?
讓大眾玩家設計新蛋白質,用於正經科研場景,這個行為怎麼聽都像是蛤蟆長毛,天方夜譚。
但要說這遊戲是空口胡縐,華盛頓大學鐵定要跳出來第一個不服:我們科學整活兒,怎麼你們還不理性看待呢?
一切都要從遊戲設計的初衷說起。
眾所周知,蛋白質的生物合成機制相對清楚,但確定給定蛋白質的一級結構如何變為功能性三維結構,即蛋白質摺疊過程的復盤,卻是一個相對未知的領域,需要昂貴的 X 射線晶體學才能確定每種蛋白質數千個原子的排列。
神秘的蛋白質摺疊過程(圖源:Youtube)
科學家們發現,蛋白質的天然結構總是比任何非天然構象具有更低的能量。
於是,華盛頓大學蛋白質研究專家貝克(David Baker)教授成立了一個名為 Rosetta 的研究項目。
這個項目利用特殊的計算機算法,從一段胺基酸序列出發,去做蛋白質設計、酶設計以及生物大分子和大分子複合物的結構預測,從而探索每種蛋白質的最低能量形狀。
然而,就在這個過程中,一些 Rosetta 用戶發現計算機算法對蛋白質進行的構形預測,總是存在或多或少的缺陷,不是「沒對上」,就是「瞎對上」。用戶旋即向貝克研究團隊提出意見:「我看計算機不太行,讓他來,不如讓我來。」
貝克本就痴迷於解決蛋白質構型問題,他很快聽取用戶建議。他假設,如果將搜索的隨機元素替換為人為決策,同時保留確定性的 Rosetta 算法作為工具,那麼人類的全局性空間推理能力不但可以改善構象空間的採樣,還可以增快速度。
快馬加鞭,貝克找到同一所大學的計算機科學教授佐蘭(Zoran Popovic)和庫珀(Seth Cooper),以期建立一種人機間交互程序。
妙就妙在,彼時庫珀教授的程式設計師之魂可能正熊熊燃燒。得知貝克的需求後,這位計算機大神的腦海中忽地閃過「魔獸世界」等眾多在線遊戲,他不禁思考:為啥整交互,乾脆整個遊戲出來直接給這些用戶玩,豈不妙哉?
好傢夥,不愧是計算機系教授,腦迴路屬實特別。於是,一個新遊戲 Foldit 橫空出世。
三維版俄羅斯方塊
庫珀的思路是這樣的:如果要通過多肽鏈的組合找到最適合的蛋白質結構模型,那就給玩家提供碎片。
科學家會在 Foldit 平臺上發布一些摺疊不正確的蛋白質構象,玩家可以通過不斷打亂、重塑這些多肽鏈,以尋找最恰當的結構。
圖源:Nature
以上圖為例,原始結構以藍色顯示,起始拼圖為紅色,而得分最高的結構預測為綠色。
在 a 的紅色起始拼圖有一個偏移,而得分最高的綠色結構預測正確地翻轉和滑動 β 鏈。在上述相同的結構裡,圖形 b 是 Foldit 播放器通過重塑循環骨架,正確地將裸露的異亮氨酸埋在右下角的循環中。而圖形 c 中,得分最高的 Foldit 預測則已經正確旋轉了在起始拼圖中放錯位置的整個螺旋。
乍一聽還是一臉懵,具體怎麼做到這些,顯然需要更多操作的細節。
為了使非相關專業的玩家輕鬆進行遊戲,Foldit 中許多技術術語被更常用的術語代替。同時,科學家在編程的時候已經刪除一部分已知的阻礙解決結構問題的蛋白質元素,並突出顯示需要被解構、重塑的部分。
為了增加可視化區分,Foldit 設置了一些特定的視覺提示,例如側鏈被疏水性著色,主鏈被能量著色,用不同的顏色分別描述疏水性(「暴露的疏水性」),原子間排斥(「碰撞」)和空腔(「空隙」)等。
圖源:Nature
以這個圖為例,可視化效果包括了原子間的碰撞(箭頭 1)、氫鍵(箭頭 2)、具有黃色斑點的疏水側鏈(已暴露,箭頭 3)、親水性側鏈(箭頭 4),以及由於高殘留能量,主鏈的一部分呈紅色(箭頭 5)。
和其他遊戲一樣,玩家還可以通過引入各種外掛工具來進行輔助操作。比如,玩家可以通過修改連接增加自動化工具的約束(箭頭 6),也可以通過凍結工具阻止自由度的改變(箭頭 7)。界面還會顯示玩家當前的狀態信息,包括得分(箭頭 8)、排行榜(箭頭 9)以及和其他玩家開黑的共同得分等。
與 Foldit 預測本身一樣有趣的是人工搜索過程的複雜性、變異性和創造力。
科學家認為與計算機相比,人類習慣使用多種多樣的探索方法。比如有些玩家更喜歡手動調整側鏈,而有些玩家會在遊戲開始時放棄大量的持續最小化,但是會隨著謎題的進行增加它的數量。
不同玩家根據謎題類型對整個謎題的使用不同的移動順序,往往會帶來意外之喜。
當然,上圖這種程度的遊戲水平只會帶來「意外失敗」。(圖源:某位菜雞玩家自己截的 gif)
另外,Foldit 遊戲還支持多人「開黑」。為了進行協作,玩家可以與小組成員共享結構,並通過遊戲的聊天功能相互提供策略和技巧方面的幫助。這很大程度上增強了玩家的積極性。
而具象化到團隊內部,通常存在分工。一些玩家擅長早期階段的開放,其他則專注於中後期遊戲的打磨。
總的來說就是,拼圖、組合、得分、排行、開黑、battle——別人有的他都要有。
撬動生化醫學的錨點
擁有這些個遊戲基本技之後,Foldit 開始持續輸出。
今年 8 月,Nature Structural & Molecular Biology發表文章稱,Foldit 可以使蛋白質摺疊中涉及的化學鍵可視化,幫助學生了解蛋白質的三維性質,有助於學生考慮蛋白質結構與功能的關係,效果遠超平面教科書。
因此,美國部分教育團隊已將這個遊戲引入大學教學課堂。
但其實,比起作為一份教材,Foldit 更是早在生化領域混得風生水起。
2011 年,Foldit 玩家就幫助破譯了一種涉及梅森-輝瑞猴病毒(M-PMV)逆轉錄病毒蛋白酶。
梅森-輝瑞猴病毒/M-PMV(圖源:Youtube)
先來看看前因:已知逆轉錄病毒蛋白酶(PRs)在病毒的成熟和增殖中具有關鍵作用,並且是強化抗逆轉錄病毒藥物研發工作的重點。
因為所有先前確定的逆轉錄病毒蛋白酶的晶體結構都具有生物活性同二聚體形式,因此有專家提出:預防 PR 二聚化或許可以成為破壞 PR 活動的一種機制,也是抗逆轉錄病毒藥物的藥物設計途徑。
但在這個機制提出後的十幾年裡,研究人員卻一直無法使用任一同二聚體通過分子置換(MR)來解析 PR 的結構,實驗只能被迫卡殼。
好在研究人員沒有放棄,他們深諳「柳暗花明又一村」的道理:轉頭,咱走個「捷徑」!
Foldit 就是那條「捷徑」。研究人員轉而把該單體拆解後的 114 個殘基提供在官方遊戲頁面,試圖獲得一些新思路。
令人沒想到的是,一組高級玩家通過打配合,竟然只花了 10 天就製作出該酶的 3D 模型,該模型足以精確地替代分子——這把遊戲打的,不可謂不牛叉。
另一把堪堪可與之相較的遊戲發生在 2012 年 1 月。Scientific American報導說,Foldit 遊戲玩家通過添加 13 個胺基酸對一種酶進行改造,使其活性增加了 18 倍以上。這個酶隨後應用於多種工業場景。
獲取成功連接後的祝賀界面(圖源:Foldit 官網)
到這裡,貝克的野心遠遠沒有停止。他們宣布計劃,要增加有機亞分組的化學構造集團,使得玩家甚至可以開始設計小分子。
研究人員認為,說不定未來的某天,Foldit 玩家製造的新分子還可能被研究應用於各大生物醫藥領域,為疾病診療提供新思路。(內容審核:gyouza)
致謝:本文經 清華大學化學系博士 孫亞飛 專業審核
題圖來源:圖蟲創意
參考資料:
[1].https://www.the-scientist.com/news-opinion/scientists-use-online-game-to-research-covid-19-treatment-67230
[2].https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6914346/
[3].https://en.wikipedia.org/wiki/Foldit
[4].https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6701466/
[5].https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3705907/
[6].https://www.nytimes.com/2010/08/05/science/05protein.html
[7].https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2956414/
[8].https://www.eurekalert.org/pub_releases/2010-08/hhmi-pgt080310.php