50年都未解開的蛋白質摺疊難題被AI破解了

2020-12-22 澎湃新聞

1972年,諾貝爾化學獎獲得者克裡斯蒂安·安芬森在獲獎感言中提出了一個假設來說明酶進行化學合成的可能性。他猜測蛋白質複雜的三維結構是由它的一維結構所決定的,也就是說,由DNA控制細胞內RNA所搭建的特定胺基酸序列,從理論上來講,應該決定了這類蛋白質擁有怎樣的結構。這就是著名的蛋白質摺疊結構預測。

沒想到,這個假設竟成為了生物學界近50年來一個重大難題。要解決這個難題最大的挑戰在於:在自然界,蛋白質摺疊的方式實在太多了,據估算,一個典型的蛋白質有10300次方種可能的構型,它們可以自個兒把自個兒扭成一幅六親不認的樣子,即便是物理規則來了也要流淚,因為有些形狀實在難以想像。

而就在剛結束不久的第十四屆CASP競賽上,由谷歌Deepmid推出的AlphaFold最新版本力壓群雄,在通過胺基酸序列預測蛋白質摺疊結構方面,其準確性已經接近於使用X射線晶體學、超低溫電子顯微鏡(cryo—EM)等標準實驗方法所解析出的3D結構。

消息一出,立刻被《nature》、《science》等多家科學雜誌所報導,《nature》雜誌更是直接將其評為:「(這將改變一切)」。

在Deepmind發布的官方推文下,谷歌CEO桑達爾·皮查伊、斯坦福計算機科學系教授李飛飛、馬斯克等科技大佬也紛紛「一鍵三連」。

那麼,這項轟動各界的研究到底是什麼呢?

蛋白質是生命的基礎,這些碳基分子負責處理細胞內部發生的大部分事情,比如面對病毒的入侵,細胞內的DNA就開始忙活起來,生產與之對抗的抗體來抵禦病毒。從某種角度而言,它們和現實生活中的打工人沒什麼區別,每天的工作就如同流水線一般重複進行著。

而它們的工作方式和作用都取決於其3D結構,「結構即功能」是分子生物學不變的真理。自1950年開始,科學家已經可以通過X射線照射結晶的蛋白質並將其產生的衍射光轉化為蛋白質的三維原子坐標,從而獲得準確的蛋白質結構。

但這種方式需要花費的大量時間和資金,於是科學家一直想知道蛋白質的組成部分(一串胺基酸長鏈)如何在極短時間內變形成曲折的三維結構。

在上世紀八九十年代,計算機開始應用於模擬蛋白質結構,得益於計算機強大的算力,科學家們提出了許多理論的預測方法,然而,很快就被現實打臉了,當他們將論文中的方法在實驗室應用時,發現自己鼓搗出的蛋白質與實際情況相去甚遠。

不過這並不代表計算機退出了舞臺,相反,來自馬裡蘭大學學院公園分校的計算生物學家約翰·穆爾特與其他人共同創立了CASP,致力於改進精確預測蛋白質結構的計算方法。

CASP用來衡量預測結果準確性的主要指標為GDT,其範圍為0~100。這項測試主要是判斷胺基酸殘基在閾值範圍內與正確位置的百分比。測試結果如果能達到90分以上就可以被認為是與實驗方法相媲美的。

在11月30日公布的最新一屆CASP評估結果中,AlphaFold系統總分為92.4GDT,這也意味著預測平均誤差約為1.6埃(一埃等於0.1納米),相當於一個原子的寬度。

即便是對於最難的隨機蛋白質結構預測,AlphaFold也達了87.0GDT的高分。

AlphaFold是怎麼做到的?

AlphaFold分兩步工作。第一步與比賽中大多數參賽選手使用的其他方法一樣,最開始都會將多條胺基酸序列進行篩選,像AlphaFold就被「餵養」了17000條序列。

然後它會將這些序列與資料庫中的相似序列進行比較,找出在鏈中彼此不相鄰但往往串聯出現的胺基酸對。這就表明在摺疊的蛋白質中這兩個胺基酸非常接近。

DeepMind也訓練了一個神經網絡來進行這樣的配對,並預測摺疊蛋白質中兩個配對胺基酸之間的距離。通過將預測結果與精確測量的蛋白質距離進行比較,AlphaFpld更精確地預測了蛋白質鏈中連續胺基酸之間的摺疊角度。

但通過這些步驟還無法單獨預測結構,因為所預測的距離和角度上可能會違背物理規律。

因此,第二步,AlphaFold為胺基酸序列創建了一種在物理上可能出現但幾乎只有在隨機中才能「曇花一現」的摺疊結構。並通過梯度下降的優化方法來進行迭代,通過這個過程,系統能在幾天時間內確定高精度的蛋白結構。

對現實的意義

從胺基酸序列預測蛋白質結構變化的能力將對生命科學及醫學領域帶來巨大好處,德國馬克斯·普朗克發展生物學研究所的進化生物學家安德烈·盧帕斯直言:「AlphaFold幫助他解決了困擾十幾年的難題,通常情況下,破解一個蛋白質的結構需要耗費數年時間,而現在,幾天之內就能得到一個非常接近的結構,這無疑會極大加速對細胞組成部分的工作,也將改變我的工作方式」。

最近微信推送規則更新,想要第一時間收到我們的推送,記得一定要點「小星星」哦~

特別聲明

參考資料:

https://www.nature.com/articles/d41586-020-03348-4

https://www.nature.com/articles/d41586-019-01357-6

圖片來源於:

Google、bing圖片、維基百科、nature

更新時間:每周一、三、五

我們旨在分享優質文章、原創作品,與您共同學習成長

本文如有侵權歡迎原作者及時與我們取得聯繫,署名或刪除

如對本文有所意見或發現錯誤歡迎指正

原標題:《50年都未解開的蛋白質摺疊難題被AI破解了》

閱讀原文

相關焦點

  • 50年難遇AI「諾獎級」裡程碑!DeepMind破解蛋白質摺疊難題
    【新智元導讀】近日,DeepMind在預測蛋白質結構方面邁出了一大步!公司表示,其已經解決了關鍵的「蛋白質摺疊問題」,這個問題在生物圈已被研究50年之久。馬斯克、李飛飛等大佬紛紛點讚!DeepMind這一歷史性進展有助於加快藥物發現速度,對理解人類生命形成機制至關重要。剛剛,一個困擾生物學家50年的難題,被AI解決了。
  • AI解決生物學50年大挑戰,破解蛋白質分子摺疊問題
    機器之心報導機器之心編輯部生物學界最大的謎團之一,蛋白質摺疊問題被 AI 破解了。11 月 30 日,一條重磅消息引發了科技界所有人的關注:谷歌旗下人工智慧技術公司 DeepMind 提出的深度學習算法「Alphafold」破解了出現五十年之久的蛋白質分子摺疊問題。最新一代算法 Alphafold 2,現在已經擁有了預測蛋白質 3D 摺疊形狀的能力,這一複雜的過程對於人們理解生命形成的機制至關重要。
  • 生物學50年難題被DeepMind解決了,蛋白質版「阿法狗」預測結構準確...
    11月30日,DeepMind宣布:AlphaFold 2,這個AI已經成功解決蛋白質摺疊的問題。這一次,AlphaFold的「準確性」均分,直接從原本的60+/100,提升至了92.4/100。而過去十幾年,其他方法只能在40分左右徘徊。
  • 重大事件上鏈—DeepMind破解蛋白質摺疊難題
    近日,在國際蛋白質結構預測競賽上,DeepMind推出的AlphaFold系統的總體中位數得分達到92.4GDT,擊敗了其餘的參會選手。AlphaFold是一種能夠基於蛋白質的基因序列,利用AI預測蛋白質3D結構的系統。
  • DeepMind的蛋白質摺疊AI解決了50年來的生物學重大挑戰
    蛋白質的工作方式和功能由其三維形狀決定-"結構即功能 "是分子生物學的公理。幾十年來,實驗室實驗一直是獲得良好蛋白質結構的主要途徑。從20世紀50年代開始,利用X射線束射向結晶的蛋白質,並將衍射光轉化為蛋白質的原子坐標的技術,首次確定了蛋白質的完整結構。X射線晶體學產生了絕大部分的蛋白質結構。
  • 人工智慧破解生物學50年大難題,一切早已被頂尖科學家預言
    在過去的50年,研究人員一直在努力預測蛋白質是如何實現它的三維結構,這其實並不是一個容易解決的問題。蛋白質的功能是由它的3D形狀決定。圖|DeepMind究其原因,在於有可能是正確答案的潛在分子排列堪比天文數字。
  • 破解生物界50年重大挑戰!DeepMind用AI精準預測蛋白質結構
    智東西(公眾號:zhidxcom)編譯 |子佩編輯 |Panken智東西12月2日消息,Alphabet旗下公司DeepMind本周一在官網中宣布,已經開發出可以快速準確預測蛋白質結構的機器學習軟體在兩年一次的蛋白質結構預測評估(Critical Assessment of protein Structure Prediction,下稱CASP)中,AlphaFold平均GDT得分達到92.4,與藥物實驗模擬結果相差無幾。DeepMind在博客中寫道:AlphaFold解決了困擾生物界50年的問題——蛋白質是如何摺疊的,這是一個巨大的科技突破。
  • 人工智慧破解生物學50年大難題!這一切早已被頂尖科學家預言
    在過去的50年,研究人員一直在努力預測蛋白質是如何實現它的三維結構,這其實並不是一個容易解決的問題。蛋白質的功能是由它的3D形狀決定。圖|DeepMind究其原因,在於有可能是正確答案的潛在分子排列堪比天文數字。
  • 50年難遇AI「諾獎級」裡程碑:DeepMind攻破生物學界重大難題
    近日,DeepMind在預測蛋白質結構方面邁出了一大步!公司表示,其已經解決了關鍵的「蛋白質摺疊問題」,這個問題在生物圈已被研究50年之久。馬斯克、李飛飛等大佬紛紛點讚!DeepMind這一歷史性進展有助於加快藥物發現速度,對理解人類生命形成機制至關重要。 剛剛,一個困擾生物學家50年的難題,被AI解決了。
  • 科學家50年沒解決的問題,或將被打敗柯潔的AI系統攻克
    如今,這家總部位於英國的公司,又開始進軍生物醫學領域,甚至攻克了科學家們認為人力還需要幾十年才能拿下的難題,那就是蛋白質摺疊的問題。大約在50年前,科學家們就開始思考蛋白質如何構建其複雜的三維結構的。我們知道,胺基酸是蛋白質的最基本單元,它們之間的結合會形成肽鏈,而肽鏈本身或者通過結合就能形成蛋白質。
  • 生命密碼竟被谷歌AI破解,然後呢?| AI內參
    DeepMind 研發的 AlphaFold 成功破解了生物學 50 年來的巨大難題「蛋白質摺疊」,這可能是 2020 年 AI 領域最振奮的消息,本期將圍繞這個案例梳理若干個行業發展態勢。本期還將關注:Salesforce 收購 Slack 的傳聞已經成真,無論是從金額還是潛在的行業影響,此次收購都有眾多看點;Zoom 財報;騰訊云云開發的一組數字;Facebook 與 Service Now 的兩筆收購;韓國 AI 晶片計劃等。
  • 摺疊革命,深度學習通過胺基酸序列預測蛋白質結構
    由胺基酸和蛋白質組成的長鏈,將它們自己摺疊成精準3D結構,可以管理分子間活動的複雜問題。因為,蛋白質外形決定了它的功能和疾病中產生的功能紊亂,並影響蛋白質在分子生物學的中心地位,特別是用於治療科學和治病保健等藥物的發展。近些年,蛋白質通過自身的胺基酸序列可以實現被預測,在計算方法上有了巨大進步。如果都能使用這些計算方法,那生物醫學研究都可以被轉換成計算公式。
  • AlphaGo顛覆生物圈,精準預測蛋白質結構
    2018年,上一代的 AlphaFold得分一下子突破了50。 而這次的新一代 AlphaFold,在蛋白結構預測大賽裡的中位得分超過了92.4。 首先,17萬的數據應該遠遠不夠,準確性存疑;再者,蛋白質結構摺疊問題太過高深,如果真能夠破解,DeepMind很快就能獲得諾貝爾獎。 因此,在驚嘆AlphaFold取得成果的同時,我們還需要冷靜等待生物學家的實驗驗證。 除了解決的問題值得我們關注,其實研究方法也更有思考價值。
  • AI再發力,解決困擾生物學家近50年的一個基本問題
    這是生物學領域的一個重大挑戰,已經困擾科學家們近50年時間。而就在最近,谷歌開發的人工智慧系統 AlphaFold 將蛋白質結構預測的準確度提高到了原子水平,可以說基本解決了這個「蛋白質摺疊問題」。 這比許多科學家的預期還要早幾十年,顯示出 AI 對解決重大科學問題的潛力。 01.
  • 騰訊AI Lab聯合研究登上Nature子刊 獨創方法提升蛋白質結構預測精度
    此次,騰訊AI Lab採用「從頭摺疊」的蛋白質結構預測方法幫助解析了SRD5A2晶體結構,並通過自研AI工具「 tFold」有效提升了蛋白質結構預測精度,在科研突破中發揮了核心作用。除了在SRD5A2結構中的應用,這套方法還可以拓展應用於蛋白質分子和病理學機制的相關研究中。
  • 湖南硬核博士:年僅33歲,破解40多年未解世界難題!
    世界上總有著各種各樣的困難擺在人們面前,有新出現的問題,也有擱置許久都無法解決的難題,不過,科學家們總是會用他們的聰明才智與辛勤付出去一一突破這些困境。成都理工大學校友蘭司就是其中一位,他在33歲的年紀,卻破解了逾40年世界未解難題!本期推送,讓我們一起認識一下這位優秀的成理校友!
  • 人工智慧攻克生物界50年重大難題!
    在最具挑戰性的蛋白質測試中,AlphaFold的中位數得分為87分,比排名第二的預測高出25分。它甚至擅長於解決楔入細胞膜中的蛋白質結構,這是許多人類疾病的核心,但眾所周知,用x射線晶體學很難解決。醫學研究理事會分子生物學實驗室的結構生物學家Venki Ramakrishnan稱該結果「在蛋白質摺疊問題上取得了驚人的進步。
  • 騰訊「雲深智藥」用AI持續助力藥物發現
    此次,騰訊 AI Lab 採用「從頭摺疊」的蛋白質結構預測方法幫助解析了SRD5A2晶體結構,並通過自研AI工具「tFold」有效提升了蛋白質結構預測精度,在科研突破中發揮了核心作用。除了在SRD5A2結構中的應用,這套方法還可以拓展應用於蛋白質分子和病理學機制的相關研究中。該項聯合研究成果於近日登上了國際頂級期刊 Nature 子刊《 NatureCommunications》。
  • 騰訊AI Lab聯合研究登上Nature子刊,首次...
    此次,騰訊 AI Lab 採用「從頭摺疊」的蛋白質結構預測方法幫助解析了SRD5A2晶體結構,並通過自研AI工具「 tFold」有效提升了蛋白質結構預測精度,在科研突破中發揮了核心作用。除了在SRD5A2結構中的應用,這套方法還可以拓展應用於蛋白質分子和病理學機制的相關研究中。
  • AI介入醫學讓救治變得更高效
    Lupas 之所以這麼說,因為他本人花了十年時間,用盡各種實驗方法也沒能弄清楚一種蛋白質摺疊後的形狀,但藉助 AlphaFold 2 後,他在半個小時內就看清了那團彩色的,像是被手掌捏出特定形狀的「珠子項鍊」。 知道「珠子項鍊」摺疊後的三維形狀至關重要,因為它決定了蛋白質如何工作。