科學網—蛋白質結構解析:生物學的「聖杯」

2020-11-29 科學網

 

■趙廣立

美國密西根大學計算醫學與生物信息學中心教授安布裡什·羅伊(Ambrish Roy)曾於2010年在Nature Protocol發文,稱「我有一個要研究的蛋白,但我不知道它的結構和功能」是幾乎所有分子和細胞生物學家每天面臨的最大難題之一。無怪乎羅伊發此喟嘆,當年的統計數字顯示,只有0.6%的已知蛋白序列被解析出了相應的結構。

不過,自從美國科學家克裡斯蒂安·安芬森(Christian B. Anfinsen)提出「蛋白質的高級空間結構由蛋白質的胺基酸序列決定」後(他也因此獲得1972年諾貝爾化學獎),人們開始尋找一種能夠預測蛋白質結構的算法,可以精確地從蛋白質的胺基酸序列,利用計算機預測出其複雜的空間結構,甚至其由結構決定的功能。

值得一提的是,儘管隨著胺基酸測序技術的發展,越來越多的蛋白質序列得以被高通量的讀取,但是從解析一維序列到能夠解析實際三維結構,仍然還有很大的距離。

「這不但是生物信息學,也是整個生物學中的一個重要的『聖杯』。」巴黎笛卡爾大學前沿生物學博士郭昊天如此說道。畢竟,要研究蛋白質的功能或是設計靶向藥物,蛋白質結構都是非常重要的一環。

國際蛋白質結構預測挑戰競賽(CASP)應運而生。自首屆CASP於1994年在美國加州舉辦以來,20多年間科學家們開發出許多用於蛋白質結構預測的計算模型,這些計算模型主要分成三大「流派」:演化流、比對流和從零開始的ab initio流——ab initio就是拉丁語裡「從最初開始」的意思。

演化流的核心概念是尋找演化歷史上同源或者近似同源的胺基酸序列,從它們的結構出發預測新的目標蛋白;比對流則不一定要求演化上同源,直接將目標序列中的片段和曾解析出來的三維結構進行匹配和比對,由此來預測新的蛋白;而最難也最關鍵的ab initio流,則是完全從零開始預測那些完全找不到相似性的蛋白序列。

隨著CASP挑戰的持續進行,這些流派之間的界限逐漸變得模糊,越來越多的科研團隊開始把這三種流派整合到一個模型之中,融合成一個更加準確的預測模型。而在對模型的優化過程之中,CNN、RNN(循環神經網絡)、DNN(深度神經網絡)、強化學習等技術也在不斷地被調用於各個計算環節。

一個有趣的工作是,華盛頓大學David Baker團隊於1999年開發了一款基於ab initio流派的Rossetta模型,利用此模型該團隊先後成功預測了長度100個胺基酸左右的若干蛋白和一段長度93個胺基酸的人工合成序列。2005年,Baker團隊突發奇想,開發出屏保程序Rosetta@home,使用PC端在閒置時幫助Rossetta伺服器進行結構解析的模擬運算。借用這種分布式計算的形式,Rossetta模型調用眾多閒置個人計算資源,取得了極好的效果。

《中國科學報》 (2018-12-13 第5版 技術經濟周刊)

相關焦點

  • 大難題告破,蛋白質3D結構可用AI解析—新聞—科學網
    圖中藍色為計算機預測的蛋白質結構,綠色為實驗驗證結果,二者相似度非常高。(圖片來源:DeepMind) 生物學界最大的挑戰之一——蛋白質三維結構解析如今有望被破解。藉由深度學習程序AlphaFold,谷歌旗下人工智慧公司DeepMind能夠精確預測其三維形狀。 如果把生物體比作工地,那麼蛋白質就是工地上的磚頭。
  • 蛋白質結構解析六十年
    隨著這個理論被證偽,真正的遺傳物質DNA的結構被給予了很大關注。然而,蛋白質作為生命體的重要大分子,其重要性也從未被忽視,而且在1950年代開始,科學家一直在探尋DNA序列和蛋白質序列的相關性。與此同時,蛋白質測序和結構解析蛋白質結構的努力開始慢慢獲得回報。更多的生化研究揭示了蛋白質的功能重要性,因此蛋白質的三維結構的解析對於深入理解蛋白質功能和生理現象起著決定性作用。
  • 顏寧等點評:AI精準預測蛋白質結構,結構生物學何去何從?
    人工智慧的「進擊」對生物學、對其他學科會有什麼影響?網絡上有人提出:AI都能解蛋白質結構了,結構生物學家是不是該失業了?《返樸》總編、結構生物學家顏寧特邀幾位同仁對這一新聞各抒己見, 回答大家的疑問。的預測模型之後,才跟原有晶體學數據綜合成功解析了結構。
  • 顏寧等點評:AI精準預測蛋白質結構,結構生物學何去何從?
    傳統上,蛋白質結構預測可以分成基於模板和從頭預 測,但是AlphaFold2隻用同一種方法--機器學習,對幾乎所有的蛋白質都預測出了 正確的拓撲學的結構,其中有大約2/3的蛋白質精度達到了結構生物學實驗的測量 精度。說他們接近解決了這個問題,這個說法沒錯,至少是在單結構域的蛋白結構 來講是這樣的。谷歌這次為什麼能夠取得如此大的成功?這個首先是與它們擁有強大的人力和計算 資源有關。
  • AI精準預測蛋白質結構,結構生物學何去何從? | 返樸
    不少結構的預測精確度跟實驗晶體結構相當,可以替代晶體結構;一些含有多個結構域的複雜超長的單鏈結構也達到了可以跟實驗結構比較的程度;幫助解析了競賽中涉及到的、實驗多年沒拿到的X射線晶體和cryo-EM冷凍電鏡結構,比如T1058的膜蛋白是用了Alphafold2的預測模型之後,才跟原有晶體學數據綜合成功解析了結構。
  • 冷凍電鏡技術「接管」結構生物學—新聞—科學網
  • 結構生物學探索——結構解析的分子置換
    結構生物學博大精深,我懂得很少,還在不斷學習,僅僅分享我的一點心得,供各位參考。case4: 去年我收了一套數據,1.18埃的native晶體衍射數據,蛋白質的序列同源性在25%左右,我當時有些遲疑不定,是做分子置換試試看,還是同時做硒代的晶體兩手準備,畢竟上海光源近期就要停光休息。
  • 蛋白質結構解析六十年_資訊中心_儀器信息網
    然而,蛋白質作為生命體的重要大分子,其重要性也從未被忽視,而且在1950年代開始,科學家一直在探尋DNA序列和蛋白質序列的相關性。與此同時,蛋白質測序和結構解析蛋白質結構的努力開始慢慢獲得回報。更多的生化研究揭示了蛋白質的功能重要性,因此蛋白質的三維結構的解析對於深入理解蛋白質功能和生理現象起著決定性作用。
  • 蛋白質3D結構可用AI解析
    圖中藍色為計算機預測的蛋白質結構,綠色為實驗驗證結果,二者相似度非常高。(圖片來源:DeepMind)生物學界最大的挑戰之一——蛋白質三維結構解析如今有望被破解。人體內有成千上萬種不同的蛋白質,每種蛋白質包括數十上百個胺基酸,這些胺基酸的順序決定著蛋白質的形狀和功能。「結構即功能」是分子生物學的定理,若能根據根據蛋白質的胺基酸序列推出其結構,有助於人們加速了解細胞的組成和運作規律,一些新藥物的研發也能更快推進。
  • 應用BioPython解析和可視化蛋白質的結構
    蛋白質是生物大分子,是構成生命體結構和實現生物學功能必需的化合物。蛋白質是由胺基酸首尾相接共價連接而成。
  • 解決生物學的重大挑戰!生物界AlphaGo精準預測蛋白質結構
    今日,DeepMind宣布,其新一代AlphaFold人工智慧系統,在國際蛋白質結構預測競賽(CASP)上擊敗了其餘的參會選手,能夠精確地基於胺基酸序列,預測蛋白質的3D結構。其準確性可以與使用冷凍電子顯微鏡(CryoEM)、核磁共振或 X 射線晶體學等實驗技術解析的3D結構相媲美。這一突破被多家媒體稱為「變革生物科學和生物醫學」的突破。
  • 蛋白質3D結構可用AI解析 生物學界最大的挑戰有望破解
    圖片來源:DeepMind本報訊生物學界最大的挑戰之一——蛋白質三維結構解析如今有望被破解。藉由深度學習程序AlphaFold,谷歌旗下人工智慧公司DeepMind能夠精確預測蛋白質三維形狀。「結構即功能」是分子生物學的定理,若能根據蛋白質的胺基酸序列推出其結構,有助於人們加速了解細胞的組成和運作規律,一些新藥物的研發也能更快推進。長久以來,人們需要藉助實驗確定完整的蛋白質結構,比如X射線晶體學和冷凍電鏡,這些方法往往要花費數月甚至數年時間,目前人類已發現的2億蛋白質中,只有不到20萬的蛋白質結構被解析。
  • 科學家解析新冠病毒RNA聚合酶三維精細結構—新聞—科學網
    遺傳物質的轉錄將最終經過翻譯形成新生病毒的結構組成蛋白質,而其複製將形成新生病毒的RNA基因組。 病毒RNA依賴的RNA聚合酶(RdRp),也被稱為第12號非結構蛋白(nsp12),能夠與其他多個非結構蛋白質組裝形成一臺高效的RNA合成「機器」,完成這兩大過程。
  • 「阿爾法摺疊」精準預測蛋白質三維結構|胺基酸|x射線|生物學|蛋白...
    人工智慧(AI)再度發威,攻克了生物學領域一項重大難題:預測蛋白質如何從線性胺基酸鏈捲曲成3D形狀以執行任務。據美國《科學》雜誌網站11月30日報導,「蛋白質結構預測關鍵評估」(CASP)競賽傳來喜訊:英國「深度學習」(DeepMind)稱其AI實現了上述成就,他們的方法將極大加快新藥研發進程。
  • 解決生物學50年來的重大挑戰!生物界「AlphaGo」精準預測蛋白質結構
    今日,DeepMind宣布,其新一代AlphaFold人工智慧系統,在國際蛋白質結構預測競賽(CASP)上擊敗了其餘的參會選手,能夠精確地基於胺基酸序列,預測蛋白質的3D結構。其準確性可以與使用冷凍電子顯微鏡(CryoEM)、核磁共振或 X 射線晶體學等實驗技術解析的3D結構相媲美。這一突破被多家媒體稱為「變革生物科學和生物醫學」的突破。
  • 科學家首次解析腦神經突觸高精度三維結構—新聞—科學網
    為了解析大腦複雜的結構組織,中心 「兵分兩路」,一路主攻全腦尺度上對大腦進行亞微米分辨的三維成像,重構完整的腦圖譜;一路主攻微觀上對腦神經突觸在分子乃至原子水平的超微結構解析。「這樣我們就能做到『既見森林,又見樹木,還見樹葉』。」 中心執行主任孫堅原說。
  • 蛋白質的結構與功能專業試題模擬
    蛋白質生物學價值的高低主要取決於A 所含胺基酸的數量B 表觀消化率C 含量D 真消化率>E 所含必需胺基酸的含量和比值【答案】正確答案: E 【知識點】合理營養-人體必需的營養素及能量【解析】蛋白質的胺基酸評分(蛋白質化學評分),用於反映蛋白質構成和利用率的關係,即所含必需胺基酸的含量和比值主要決定了蛋白質生物學價值的高低,E正確。
  • 結構生物學的下一個突破
    使用冷凍電鏡解析的正二十面體型病毒的結構比較[1]。斷層成像:與其他結構生物學手段互補隨著直接探測電子相機(DDD camera)的出現和新算法的開發,冷凍電鏡在2013年迎來一場解析度革命(resolution revolusion),並逐漸成為結構生物學的主要研究方法。
  • 顛覆生物學!AlphaFold成功預測蛋白質結構
    比賽中會定期給出目標蛋白質或蛋白質結構域——總共100個左右,讓團隊有幾周的時間來提交他們預測的結構。隨後,一支由獨立科學家組成的團隊利用各類指標對預測結果進行評估,這些指標主要判斷團隊預測的蛋白質與實驗解析的結構有多相似。評審專家並不知道預測是誰做的。 AlphaFold的預測用被稱為「427組」,多個預測達到了驚人的準確性,讓它們脫穎而出,Lupas說。
  • 【AlphaFold精準預測蛋白結構】|蛋白質|胺基酸|生物學|複合物...
    2020-12-05 12:23:34 來源: BioArt 舉報   蛋白質三維結構預測是生物學最嚴峻的挑戰之一