蛋白質結構預測:生命科學的又一場競爭

2021-01-10 央視網

蛋白質結構預測:生命科學的又一場競爭 
央視國際 www.cctv.com  2006年12月07日 23:55 來源:

    科學時報2006年12月7日訊  中國學者張陽最近在第七屆蛋白質結構預測技術評估大賽中獲得第一名的好成績。消息傳來,他做博士後時的導師歐陽鍾燦院士給予高度評價。據歐陽鍾燦介紹,由生物大分子的基因序列預測其結構,是當前生物學研究面臨的最重要挑戰之一,如果能夠實現,將在生物技術與藥物設計領域產生巨大影響。

    2006年11月26~30日,第七屆CASP總結大會在美國加州阿薩爾默會議中心舉行,在大會公布的測評排列名單上,美國堪薩斯大學的助理教授張陽位居第一。

    對此,中國科學院院士歐陽鍾燦評價說:「CASP被譽為蛋白質結構預測領域的奧林匹克競賽,張陽獲得第一名,表明他已經走在這個領域的最前沿,這個成就令人興奮。」

    蛋白質結構預測技術評估(CASP)大賽是一個世界性的蛋白質結構預測技術評比活動。1994年,第一屆CASP在美國馬裡蘭大學生物技術研究所的約翰·莫爾特(John Moult)倡議、組織下舉行,此後每兩年舉行一次。

    張陽在華中師範大學師從劉連壽教授並獲得物理學博士學位,1999~2000年在中國科學院理論物理所跟隨歐陽鍾燦院士做博士後,2001年初到美國。張陽說:「比賽獲勝說明我們的預測方法的確行之有效,我很高興看到這一點。在當今蛋白質結構預測這個競爭激烈的領域,贏得CASP比賽勝利是得到同行尊重和承認的最重要和幾乎唯一的途徑。」

    近日,張陽到北京參加會議併到中科院理論物理所訪問,在此期間,他接受了《科學時報》的專訪。

    結構密碼蘊藏在排序中

    這是一個複雜但很有意思的生命過程——基因承載了生命的遺傳信息,生命的功能則是藉由蛋白質執行的;蛋白質是由20種胺基酸組成的肽鏈,而DNA中的基因控制了蛋白質中胺基酸種類的排序。蛋白質只有在摺疊的狀態下才能表現出生命的功能,但摺疊是如何自發形成的呢?

    胺基酸序列與蛋白質空間結構的關係研究源於美國生物化學家安芬森(C.Anfinsen)。1961年,他研究了核糖核酸酶的去摺疊和重摺疊過程,發現在相同的環境中去摺疊的蛋白質都會恢復到原來的空間結構,認為蛋白質鏈會以自由能最低的方式形成三維結構,由此推測蛋白質的摺疊密碼隱藏在胺基酸排序中,即所謂的安芬森原則:蛋白質一級排序決定三維結構。因為「對控制蛋白質鏈摺疊原理的研究」,安芬森獲得1972年諾貝爾化學獎。

    然而,蛋白質的空間結構極其複雜,該如何確定呢?現在有兩種方法:一種是實驗測量,包括用X射線衍射和核磁共振成像;一種是理論預測,利用計算機根據理論和已知的胺基酸序列等信息來預測,方法包括同源結構模擬、摺疊辨識模擬和基於第一性原理的從頭計算。

    1913年,勞爾和布拉格父子第一次發現X射線通過晶體可以產生衍射現象從而確定原子在晶體中的位置並因此獲得諾貝爾獎。1957年,劍橋大學的肯德魯用勞爾-布拉格的方法確定出第一個蛋白質(肌紅蛋白)的三維結構從而獲得1962年的諾貝爾化學獎。此後18年間,人類共測出38個蛋白質結構;至1980年,這個數目增長到184個。

    顯然,用實驗方法測量蛋白質及生物大分子的結構相當繁瑣。張陽說:「蛋白質結構的實驗測定十分費時費力。多年前測定一個蛋白質的結構就有可能獲得諾貝爾獎。如今隨著技術的進步,實驗測蛋白質結構的時間和花費已經大大地減少了,但測定一個蛋白質結構的平均費用也在100萬美元左右。」

    自然界有大量種類的蛋白質,實驗只能測出其中非常小的一部分,目前「蛋白質資料庫」中只有3萬多個蛋白質的結構。有沒有其他方法可以更快、更經濟地測量出大量蛋白質呢?

    物含妙理總堪尋

    既然蛋白質結構的密碼隱藏在序列中,那麼解開這個密碼就可以通過序列來解開蛋白質的結構。張陽說:「我們的目的就是用計算機從胺基酸的序列來直接預測蛋白質的結構。將序列輸進計算機裡,設計一套程序,讓計算機去計算和確定蛋白質中每個原子的三維坐標。如果這種理論方法經實驗數據的驗證可行,那麼就可能通過計算機自動預測出蛋白質的結構,這幾乎是免費的。」

    然而,用序列預測結構談何容易。驅動胺基酸摺疊形成特定三維空間的作用諸多,包括胺基酸側鏈分子間作用力、水分子表面張力、胺基酸側鏈分子間的電偶極距和電磁力以及它與水分子的相互作用等。根據數學計算,由100個胺基酸構成的小蛋白質的空間構象可能會有1050種空間結構。

    物含妙理總堪尋。張陽說,一種胺基酸序列只可能有一種蛋白質結構,這就是計算機預測蛋白質結構的意義所在。根據安芬森的熱動力學原理,蛋白質在細胞中應該處在它與環境的自由能最低態。這意味著可以根據物理、化學、生物學等知識來設計蛋白質的能量函數,因此尋找這種最低自由能所代表的結構。

    科學家們使出十八般武藝來預測序列與結構間的密碼,尋找出三種有代表性的預測方法:同源結構模擬(Homology Modeling)、摺疊辨識模擬(Fold Recognition)和基於「第一原則」的從頭計算方法(Ab Initio)。

    張陽說,同源模擬又稱為比較性模擬。如果目標蛋白質與已測出結構的蛋白質的序列有30%以上的相似,那麼這兩種蛋白質可被視為同源,它們也應該有類似的空間結構。因此,若知道同源蛋白質家族中的某些蛋白質的結構,就可利用它們作為模板來模擬目標蛋白質的結構,這種方法速度較快,精度也比較高。但是這種方法有局限性,畢竟已知結構的蛋白質數量很少,而且很多蛋白質沒有同源系列。

    摺疊辨識模擬又稱串線指認方法,意思是指把目標蛋白序列與蛋白質資料庫中所有的蛋白質結構進行逐一對比。自然界中有些蛋白質的胺基酸序列不大相同,但其結構極為相似。張陽說:「這對我們建立新計算機模型非常有用。在無法進行序列比對的情況下,我們就想辦法用目標序列直接與已有的其他蛋白質結構進行比較。具體做法是,設計一個打分系統,讓計算機來識別這個序列放在被比較的其他蛋白質上是否『舒服』,再根據得分高低判斷序列是否會摺疊成這種結構,評分系統是這種方法的關鍵。」

    「從頭計算」方法源於安芬森的「最低自由能構型假說」。張陽說,前兩種方法是用已知結構的蛋白質為模板來構建新的結構,而「從頭計算」不需要模板,它是以物理為基礎來研究蛋白質的摺疊方法,怎樣設計適當的能量函數,怎樣找到相應的最低自由能是這種方法的關鍵。

相關焦點

  • 新的深度學習方法從胺基酸序列預測蛋白質結構
    生命所必需的幾乎所有基本生物過程都是由蛋白質完成的。它們創造並保持細胞和組織的形狀;構成催化維持生命的化學反應的酶;充當分子工廠,運輸工具和電機;用作蜂窩通信的信號和接收器;以及更多。由於蛋白質的形狀決定了它的功能及其在疾病中的功能障礙程度,因此闡明蛋白質結構的努力是所有分子生物學的核心 - 特別是治療科學以及拯救生命和改變生命的藥物的發展。近年來,計算方法在基於其胺基酸序列的知識預測蛋白質如何摺疊方面取得了重大進展。如果完全實現,這些方法有可能改變生物醫學研究的幾乎所有方面。然而,目前的方法在可以確定的蛋白質的規模和範圍方面受到限制。
  • 科技日曆|15年前「DNA之父」逝世 雙螺旋結構揭開了生命科學的新篇章
    科技日曆|15年前「DNA之父」逝世 雙螺旋結構揭開了生命科學的新篇章  Evelyn Zhang • 2019-07-28
  • 中國科協生命科學學會聯合體公布2020年度中國生命科學十大進展
    中國科協生命科學學會聯合體以「公平、公正、公開」為原則開展2020年度「中國生命科學十大進展」的評選,延續了將項目成果進行知識創新類和技術創新類分類推薦和評選的方式,組織成員學會推薦,由生命科學、生物技術和臨床醫學等領域同行資深專家評選,並經中國科協生命科學學會聯合體主席團審核,最終確定8個知識創新類和2個技術創新類項目成果為2020年度「中國生命科學十大進展」
  • 蛋白質的二級結構、超二級結構與模體(motif)
    蛋白質的二級結構是指肽鏈主鏈的空間走向(摺疊和盤繞方式),是有規則重複的構象。最常見的二級結構單元就是α-螺旋和β-摺疊,它們的各種組合決定了蛋白質的主體結構。β-轉角是一種小巧的二級結構單元,它使肽鏈形成大約180°的迴轉。
  • 隕石中首次發現蛋白質,會顛覆關於生命起源的認知嗎?
    可以看到它的結構似乎很單調。是的,因為除了頭和尾,中間的全部都是甘氨酸,就是一根由雙鏈甘氨酸組成的簡單蛋白質。 可能有的童鞋會質疑,血鋰蛋白是在地球上被發現的,有沒有可能是在落到地球上後粘上了地球生物的DNA呢?
  • 2020年度中國生命科學十大進展揭曉
    ◎ 科技日報記者 張佳星 1月13日,中國科協生命科學學會聯合體公布2020年度中國生命科學十大進展。 十大進展由生命科學、生物技術和臨床醫學等領域的資深專家評選,並經中國科協生命科學學會聯合體主席團審核產生。
  • 解碼生命:從多視角看生命
    再版後的該書內容豐富、編排有序、觀點獨到、立意深刻,是一本不可多得的剖析生命科學主流前沿的讀物,推薦相關研究人員、青年學者、臨床醫務工作者,以及所有熱愛生命、對生命奧秘感興趣的社會各界人士閱讀!915引言 91544.1 蛋白質是生命活動的執行者 91544.1.1 多種蛋白質分工合作,實現複雜生命功能 91544.1.2 基因編碼蛋白質,決定生物的功能和性狀 91644.2 化學結構決定生物功能 91744.2.1 結構決定功能:理解功能要從結構出發 91744.2.2 蛋白質的結構層次:
  • 專業術語背後有一個故事生命科學的十大進步不難理解
    1月10日,中國科學技術協會評選出2019年「中國生命科學十大進步」,並評選出在頂級期刊上發表的具有廣泛影響力的科學發現。和往常一樣,我讀的專業詞彙充滿專業名稱,如「破解硅藻光合膜蛋白的超分子結構」和「單鹼基基因編輯造成的大量缺失效應及其優化解決方案」。許多人說「很難理解」。然而,在專家解釋之後,中小學生也可以饒有興趣地聽。
  • 2020年度「中國生命科學十大進展」評選結果揭曉
    光明網訊(記者 戰釗)1月13日,中國科協生命科學學會聯合體公布2020年度「中國生命科學十大進展」評選結果,經成員學會推薦、同行資深專家評選,並經中國科協生命科學學會聯合體主席團審核,最終確定8個知識創新類和2個技術創新類項目成果入選。
  • 「生化版」阿爾法狗來了,生命密碼的馬奇諾防線崩了
    圖片:DeepMind網站視頻截圖 2005年,《科學》雜誌在創刊125周年之際,將預測蛋白質結構列為125個最具挑戰性的科學問題之一。 多年來,科學家只能通過核磁共振、X射線和冷凍電鏡技術來確定蛋白質結構。他們需要反覆試驗,經過持續數年的艱辛工作才能得到結果。
  • 匯創新 | 敢闖蛋白質研究「禁區」,大科學攜手大產業共舞「雙螺旋...
    創新獨門秘笈,開啟蛋白質研究「無禁區」時代給與人體生命活動息息相關的2.2萬種蛋白質貼上「二維碼」標籤,像跟蹤快遞包裹一樣觀察它們在體內的活動。就在數年前,這在生命科學領域還是個不可思議的想法。研究蛋白質,必須要有「穩住」它的相應抗體,抗體製備不僅昂貴繁瑣、質量不穩定,而且約有一半蛋白質製備不出相應抗體。
  • 結構生物學探索——結構解析的分子置換
    磨刀不誤砍柴工,前期閱讀教材和文獻獲得的積累,沒有白費,在這個比較艱難的結構解析中派上了用場。case5: 去年我收了一套數據,不到100個胺基酸的蛋白質,1.18埃的數據,多種軟體嘗試分子置換未果,因為序列同源性太低,使用Blast against PDB直接沒有任何hit(No significant similarity found),沒有可用的同源結構模型。
  • 2種蛋白質通過穩固結構修正DNA分裂錯配
    2種蛋白質通過穩固結構修正DNA分裂錯配  黃琨 • 2020-07-17 16:11:55 來源:前瞻網 E1277G0
  • 破解生命密碼,阿爾法狗的親兄弟Alpha Fold 2又開掛了
    近日,在蛋白質摺疊界的奧運會——CASP14(Critical Assessment of Structure Prediction)基因摺疊競賽中,谷歌母公司Alphabet旗下公司Deep Mind,憑藉最新人工智慧項目Alpha Fold 2,以驚人的近90分,成功根據基因序列預測出蛋白質的
  • 生命遊戲為何迷人?從複雜性科學看電子遊戲的未來
    存在不存在一種方法在不增加設計者工作量的前提下提高遊戲的可交互性、靈活性和不可預測性呢?答案是肯定的,這就是本文需要講的遊戲中的湧現。複雜性科學就是研究各種自然或者人工系統中廣泛存在的湧現現象的,包括飛鳥如何聚集成群、生命如何起源、億萬個神經元連接到一起如何產生智慧、東歐各國為何在短時間內發生巨變、「看不見的手」如何指導經濟系統的發展等等幾乎無所不包。著名物理學家霍金曾經指出,複雜性科學是一種 21 世紀的科學。可以看到,一種整體的、綜合的、湧現的世界觀開始在西方科學界形成。
  • 2020高考生物提分訓練,細胞的分子組成、基本結構和生命歷程
    3.下列關於蛋白質和核酸的敘述,錯誤的是(  )A.蛋白質的變性是由蛋白質分子的空間結構的改變而導致的B.RNA與DNA都由四種核苷酸組成,都可以儲存遺傳信息C.細胞內蛋白質發生水解時,通常需要另一種蛋白質的參與D.DNA和蛋白質參與構成細胞核內的染色質和細胞質中的核糖體答案 D解析 蛋白質變性的實質是其分子的空間結構發生改變
  • 進展|蛋白質動態結構分子開關:植物捕光天線實現高效捕光和光保護...
    那麼光合系統是如何調控蛋白質分子空間結構以快速響應環境光照條件的變化,實現低光照條件下高效能量傳遞及接近90%的電荷分離量子效率、並在強光照條件下快速切斷傳能通道進入光保護狀態的?這個問題困擾了科學家近半個世紀,對該問題的回答並闡明其微觀機理對於分子育種以提高農作物產量具有重大的指導意義。
  • 這些生命科學進展千萬別錯過!
    此時此刻,我們比以往任何時候都更需要了解生命科學。 近日,由中國科協生命科學學會聯合體評選出的2019年度「中國生命科學十大進展」發布,這些研究進展也許在不遠的將來都將真實的作用在我們每一個人身上。快跟小編一起漲姿勢吧!
  • 科學網—DNA雙螺旋結構的發現
    說到20世紀最偉大的3個科學發現,非相對論、量子力學和DNA雙螺旋結構莫屬。
  • 為何物理學無法告訴我們生命是什麼
    在X射線晶體學、核磁共振技術、以及超高解析度的顯微技術的幫助下,DNA、蛋白質等比細胞還小的結構紛紛呈現在我們面前,我們對生命的了解開始深入到分子層面。不僅如此,破獲了遺傳編碼之後,我們還可以按照自己的想法合成新的大分子,從而讓活細胞為我們所用。隨著我們對生命最細小、最簡單的構件了解得愈加精確,人們難免會認為,只有等攻克了相關的物理問題之後,才有可能解決生物學中最棘手的謎團。