生物學的一個基本大問題迎來重大突破

2020-12-02 原理


在我們身體的每個細胞裡,有數十億的微型分子機器正在努力工作,它們讓眼睛能夠感知到光線,讓神經元能發出信號,讓DNA中的「指令」能被讀取,讓我們成為獨一無二的自己。而負責進行這些精細而又複雜的任務的,就是蛋白質


蛋白質支撐著每一個生物的生物過程,可以說它們是地球生命的基石。它們能否正常發揮其功能對生物來說至關重要,世界上的許多疑難雜症都與蛋白質所的功能有關。


蛋白質的功能在很大程度上取決於它的三維結構。| 圖片來源:DeepMind


蛋白質的功能在很大程度上取決於其獨特的結構,它們是一些由胺基酸構成的複雜大分子。因此,能夠預測蛋白質會摺疊成什麼形狀,預測未知蛋白質的結構,不僅能夠幫助我們治療疾病、更快找到新的藥物,或許還能幫助我們解開生命是如何運作的奧秘。


然而一直以來,「蛋白質摺疊問題」一直是生物學中的一個重大挑戰,並且已經困擾生物學家50多年。直到現在,終於有佳訊傳來:由DeepMind開發的人工智慧系統AlphaFold,在根據胺基酸序列確定蛋白質的三維形狀方面取得了重大突破。



圖片來源:DeepMind


目前,地球上已知的蛋白質約有2億個,這個數字還在以每年3000萬個的速率增長。每一個蛋白質都有其獨特的三維形狀,決定著它會如何發揮作用。然而迄今為止,科學家已經確切掌握了其三維結構的蛋白質只有一小部分。


假如我們能「解」開一個蛋白質,呈現在眼前的會像是一串由一系列不同的化學物質組成的鏈條,這些化學物質就是胺基酸。胺基酸的這些序列是根據生物體DNA的遺傳指令組合的。20種不同類型的胺基酸之間的相互吸引和排斥,會使「鏈條」通過自發摺疊的方式將自己打包成有著複雜的捲曲、環形和褶皺的三維結構。


多年來,許多先進的實驗技術都已被使用來檢查和確定蛋白質的結構,這些技術包括核磁共振、X射線晶體學、冷凍電鏡等等。然而在進行這項研究時,這些技術實則依賴於試錯,是一類無論在時間還是金錢上都代價高昂的方法。因此,有科學家一直在尋找一種能通過胺基酸序列來確定蛋白質結構的方法



早在上世紀八九十年代,就有研究人員嘗試過用計算機來預測蛋白質結構,但是結果欠佳。1994年,一些科學家組建了一個社群論壇,名為CASP(預測蛋白質結構的關鍵評估),讓從事蛋白質摺疊研究的科學家可以分享最新的進展。


CASP每兩年會舉辦一次競賽,來測試科研人員對蛋白質結構進行預測的準確性:每個參賽的團隊會得到一組蛋白質的胺基酸序列,這是一些已知其明確結構但尚未公開的蛋白質,參賽團隊需要對這些蛋白質的結構作出最佳預測,再通過與實際結構進行比對來分出勝負。


CASP衡量預測準確度的主要度量標準是全局距離測試GDT,其範圍值在0到100之間。簡單來說,GDT可被當做是胺基酸殘基在正確位置的閾值距離內的百分比。GDT分數在90以上的預測結構可被認為大致與實驗確定的結果相一致。

在每次CASP競賽中,表現最好的團隊做出的預測的中值GDT分數。| 圖片來源:DeepMind


誕生於2016的AlphaFold參加了2018年的CASP13,當時它以接近60的GDT排名第一,令在場的許多科學家都為之驚嘆。AlphaFold先是通過深度學習的方法,學習大量已知蛋白質的序列和結構,然後利用這些信息對蛋白質應該是什麼樣子生成一個模型,在「習得」之後再預測蛋白質中的胺基酸對之間的距離。


最近版本的AlphaFold利用約170000個蛋白質結構數據進行了訓練。在最新發布的CASP14評估結果中,AlphaFold獲得的中值GDT分數是92.4,這意味著它的平均預測誤差大約為1.6埃(1.6×10⁻¹⁰米),相當於一個原子的寬度;即使是對那些最難以預測的蛋白質,AlphaFold也達到了87的中值。


一個摺疊的蛋白質可以被看作是一個「空間圖」,其中的殘基是節點,用線可以將鄰近的殘基連接起來。在AlphaFold的最新版本中,研究人員創建了一個基於注意力的神經網絡系統,這個系統會試圖解釋空間圖的結構,同時對它正在構建的隱式圖進行推理。它使用進化相關的序列、多序列比對(MSA),以及胺基酸殘基對的表示來細化這張圖。通過重複這個過程,這一系統能對蛋白質的潛在物理結構進行強有力的預測,並能夠在幾天之內高度準確地確定蛋白質的結構。| 圖片來源:DeepMind


可以說,現在的AlphaFold基本上可以根據蛋白質的胺基酸序列,對蛋白質的形狀和結構進行高度準確的預測


兩個AlphaFold根據實驗結果預測出的高度精確的蛋白質結構。| 圖片來源:DeepMind



這是一項重大的突破,它意味著要高水平的獲悉一個蛋白質的結構變得不再困難,只需收集到普通甚至較差質量的實驗數據即可。有生物學家認為,這樣的技術將帶來翻天覆地的變化,它能徹底地革新醫學、生物學研究、生物學工程。現在,隨著大量的可用基因組數據有望被可靠地翻譯成結構,一些如蛋白質的進化分析在內的領域將蓬勃發展,幫助分子生物學家提出更加高深的問題。


雖然還有許多問題仍有待解答,比如多個蛋白質是如何形成複合物的?它們又如何與DNA、RNA或其他小分子相互作用?要如何才能確定所有胺基酸側鏈的精確位置?但可以說,AlphaFold為蛋白質摺疊問題帶來了迄今為止最重大的進步之一。這樣的進展也讓研究人員更加充滿信心,相信在未來,人工智慧將能成為人類擴展科學知識前沿的最有效工具之一,期待未來將它們將能帶給我們更多的新發現。


參考來源:

https://deepmind.com/blog/article/alphafold-a-solution-to-a-50-year-old-grand-challenge-in-biology

https://www.sciencemag.org/news/2020/11/game-has-changed-ai-triumphs-solving-protein-structures

https://deepmind.com/research/case-studies/alphafold

相關焦點

  • 生物學的一個基本大問題迎來重大突破!
    然而一直以來,「蛋白質摺疊問題」一直是生物學中的一個重大挑戰,並且已經困擾生物學家50多年。直到現在,終於有佳訊傳來:由DeepMind開發的人工智慧系統AlphaFold,在根據胺基酸序列確定蛋白質的三維形狀方面取得了重大突破。
  • 中國重大科技突破迎來井噴期:「嫦娥」探月「九章」問世
    新加坡《聯合早報》網站12月7日發表文章稱,中國重大科技突破迎來井噴期。全文摘編如下:這幾天,中國科技領域捷報頻傳。12月4日,中國科學技術大學等單位宣布量子計算原型機「九章」問世。高分十四號衛星可高效獲取全球範圍高精度立體影像,測制大比例尺數字地形圖。只不過,在「九章」和嫦娥五號不同凡響的吸睛效果下,高分十四號衛星沒引起外界多少關注。「九章」取名於中國古代數學專著《九章算術》,它的出現標誌著中國在量子計算機領域取得可與美國比肩的重大突破。量子計算機的原理十分複雜,大多數人難窺其中奧妙。
  • 短短幾個月,中國航天再次迎來重大突破
    隨著中國的發展,世界各國對中國的關注也越來越大,隨時都想要看看這個國家到底是為什麼能夠在這麼短的時間內發展到如今這個地步。這不,我國這邊再次放出消息,中國航天迎來重大突破,連美國都感嘆:這怎麼可能?發展速度實在太快了。
  • 科技迎來兩項重大突破,中國走向世界最前列
    導讀:近日,一篇新加坡網站的文章引起了外界普遍關注,該文章的主要內容闡述了我國「重大科技突破迎來了井噴期兩項重大突破已讓中國走向世界最前列「九章」的問世,意味著中國在量子計算機方面同美國相比較已經取得了重大突破。按照相關團隊的說明,「九章」處理樣本的速度非常快,求解數學算法5000萬個「高斯玻色取樣」僅需要200秒的時間。如果將這項任務交給目前世界上最快的超級計算機的話需要處理時間多達6億年。
  • 近年來深度神經網絡模型不斷迎來重大突破
    近年來深度神經網絡模型不斷迎來重大突破,由深度學習為代表的機器學習相關研究取得了長足進步。但對機器學習研究普及者和研究機構來說,由於對機器學習原理、應用實踐以及技術應用多方面的缺乏概念理解,這些機器學習技術發展存在顯著的「彎路」。
  • 生物學50年的難題:被解決了
    原來是結構生物學,迎來了一個「革命性」的突破。11月30日,DeepMind宣布:AlphaFold 2,這個AI已經成功解決蛋白質摺疊的問題。這一次,AlphaFold的「準確性」均分,直接從原本的60+/100,提升至了92.4/100。而過去十幾年,其他方法只能在40分左右徘徊。
  • 我國在植物天然產物合成生物學研究方面取得重大突破
    我國在植物天然產物合成生物學研究方面取得重大突破 來源:生物催化劑設計與改造服務   發布者:ailsa   日期:2018-02-02   今日/總瀏覽:
  • 提出問題是取得科技突破的關鍵一步——解讀2020重大科學問題和工程技術難題
    光明日報記者 詹媛「提出重大科學問題工程技術難題並判別其優先順序,是科學發現和技術創新的出發點和動力源,是解決問題、難題,取得科技突破的關鍵一步。」在8月15日舉辦的中國科學技術協會年會閉幕式上,中國科協發布了2020「重大科學問題和工程技術難題」。
  • ...DeepMind AI解決生物學50年來重大挑戰,破解蛋白質分子摺疊問題
    本周Google旗下人工智慧企業DeepMind發布了最新 AlphaFold成果,這是全球AI界無比振奮的重大科研突破。蛋白質存在於我們世界中的所有有機物體及奧妙人體中,全新的AlphaFold 算法揭秘了生物學界50年來試圖破解蛋白質分子摺疊的難題,這項AI帶來的重大突破,將幫助科學家弄清某些困擾人們的疾病機制、加速找出新型流行病的具體原因(比如今年的全球新冠大流行),促進新藥設計、幫助農業增產、解析可有效降解廢棄物的嶄新成分、甚至探索為大氣減碳的全新解決方案。
  • 中芯國際迎來重大突破,晶片製程迎來新工藝,華為有救了!
    導讀:中國重要的晶片代工廠企業中芯國際終於迎來了重大突破,中芯國際晶片突破7nm工藝。這個是很牛的。影響也會非常大。這下華為終於有救了!據悉:IP和定製晶片企業芯動科技已完成全球首個基於中芯國際FinFET N+1先進工藝的晶片流片和測試,所有IP全自主國產,功能一次性通過。
  • 結構生物學的下一個突破
    原創 李賽、徐家璐 返樸因為單顆粒冷凍電鏡厚積薄發的技術突破,結構生物學在2013年底經歷了一場「解析度革命(resolution revolution)」,從此幾家歡喜幾家愁。
  • 最近,人工智慧解決了長達50年的生物學難題,一個巨大的突破
    50年來,研究人員一直在努力預測蛋白質是如何實現它們的三維結構的,但這並不是一個容易解決的問題。事實上,所有可能的分子結構的數量大得令人難以置信,研究人員推測,要對所有可能的分子結構進行採樣,需要比宇宙年齡更長的時間。
  • 最新消息,人工智慧解決了長達50年的生物學難題,一個巨大的突破
    50年來,研究人員一直在努力預測蛋白質是如何實現它們的三維結構的,但這並不是一個容易解決的問題。事實上,所有可能的分子結構的數量大得令人難以置信,研究人員推測,要對所有可能的分子結構進行採樣,需要比宇宙年齡更長的時間。
  • 量子計算機應該是一個重大突破,一個實驗成果一個理論突破
    量子計算和經典計算機一樣,研究已經很成熟了,相同點就是一個數據,兩種處理,但中間的邏輯鏈,理論完全不同。量子計算機應該是一個重大突破,一個實驗成果一個理論突破,所以超弦理論的完善是它不可缺少的,它並不意味著物理學達到真正的成熟。基本模型都是經典力學。實驗證據已經成為事實,就和牛頓力學一樣。問題是跟不上其他理論發展。沒辦法建立算符空間和微觀形式的轉化關係,或者讓微觀解釋宏觀運動。
  • 萬象屏:LED顯示屏迎來重大突破!打造透明屏全新概念
    萬象屏:LED顯示屏迎來重大突破!打造透明屏全新概念  廣州國際LED展作為2017年開年大展,國外客商雲集,在行業內頗負盛名,廈門福相傳媒有限公司(簡稱萬象屏)攜業內創新級產品彩色動態智屏S系列產品參展,突破了當下LED透明屏現有的格局,打開了一個全新的創新方向
  • AI解決生物學50年大挑戰,破解蛋白質分子摺疊問題
    「這些算法今天已經足夠成熟強大,足以被應用於真正具有挑戰性的科學問題上了。」蛋白質對於生命至關重要,它們是由胺基酸鏈組成的大型複雜分子,其作用取決於自身獨特的 3D 結構。弄清蛋白質摺疊成何種形狀被稱為「蛋白質摺疊問題」。在過去 50 年裡,蛋白質摺疊一直是生物學領域的重大挑戰。
  • AI解決生物學50年大挑戰,破解蛋白質分子摺疊問題
    DeepMind 重大科研突破的消息一出即被《Nature》、《Science》等科學雜誌爭相報導,新成果也立刻獲得了桑達爾 · 皮查伊、伊隆 · 馬斯克等人的祝賀。弄清蛋白質摺疊成何種形狀被稱為「蛋白質摺疊問題」。在過去 50 年裡,蛋白質摺疊一直是生物學領域的重大挑戰。DeepMind 的 AlphaFold 讓人類在這一問題上取得了重要突破。
  • 重大突破!中國「人造太陽」裝置建成,成功完成首次放電
    中國科技即將迎來新的重大突破,不僅中國自主研發的天宮空間站即將建成,而且今年「中國製造」又迎來新的重大突破!中國「人造太陽」裝置建後才能,成功完成首次放電!
  • 【最新】中科院今早在滬宣布:我國實現合成生物學裡程碑式突破!
    中國科學院分子植物科學卓越創新中心/植物生理生態研究所今早宣布,其合成生物學重點實驗室覃重軍研究團隊與合作者在國際上首次人工創建了單條染色體的真核細胞,該成果於8月2日在國際知名學術期刊《自然》在線發表。該成果完全由中國科學家獨立完成,是合成生物學具有裡程碑意義的重大突破。
  • 兩大技術迎來新突破:還建成了首座「晶片大學」
    【11月18日訊】導語,自從臺積電在2020半導體大會上,再次宣布了「1nm晶片研發新計劃」後,也讓很多網友們紛紛開始關注,我國晶片製造技術何時可以取得突破呢?終於在近日,我國重磅級科研機構—中科院也是取得了兩大技術突破,為國產晶片產業鏈帶來了好消息。