只用了一代人的時間,研究人員就發現了DNA是編碼RNA的遺傳物質,RNA轉而編碼蛋白質,而這些蛋白質進行了生命的主要酶促反應。他們確定了蛋白質序列最終決定了它們的三維結構,這決定著它們的功能。剩下要做的就是找到一種簡單的方法來測序基因組,預測它們編碼的蛋白質結構,並建立精確的生命全模型。
半個世紀後,一些問題依然存在。其中一項最困難的挑戰在於從胺基酸序列到三維蛋白質結構。雖然前者在表面上決定了後者,但科學界仍舊難以預測出肽鏈摺疊過程的準確規則。儘管如此,計算生物學家仍在不斷鑽研這一問題,設計出一系列不斷發展的工具,這些工具可以較為準確地預測某些種類的蛋白質結構。與此同時,X射線結晶學的經典技術已經為更多非專業人士所接收,電子顯微鏡領域的一系列革命性進展也揭示了人們之前難以理解的結構。
X射線晶體學不是試圖從基本原理的角度預測分子的形狀,它們是從相反的方向解決問題,通過對蛋白質進行純化和結晶,然後測量它如何衍射X射線束。該技術十分繁瑣,往往需要成千上萬次實驗才能確定能產生可用的蛋白質晶體的條件。然而今天,生物學家可以利用機器人來完成其中的大部分工作。
「機器人可以建立的結晶液滴要小得多,那麼篩選大量條件所需的樣本量也更少。」位於馬裡蘭州巴爾的摩約翰·霍普金斯醫學院的生物物理化學教授Cynthia Wolberger說。如今,製造商所提供的機器人系統能夠特別為測試結晶條件做出優化,如TTP LabTech公司的蚊子和Formulatrix公司的Rock成像儀。同時,快速的克隆和蛋白質表達平臺讓研究人員能夠製作出一個蛋白質的多種變體,並從中找到結晶效果最好的變體。
晶體學家也提高了研究膜蛋白的能力,眾所周知膜蛋白是很難結晶的。通過將脂類、水和蛋白質按特定比例混合,研究人員可以形成適合X射線衍射的立方液晶。該方法只需要微量的蛋白。「這是一個巨大的進步。」位於愛爾蘭都柏林的三一學院生物化學和免疫學教授Martin Caffrey說。Caffrey補充說,G蛋白偶聯受體和其他重要膜蛋白的研究「在這種立方相的方法出現後,真的經歷了爆發式增長」。
一旦獲得蛋白質結晶,研究人員將它送至少數幾個得到政府資助的同步加速器設施中,使用X射線轟擊並採集數據。這個步驟在最近幾年也開始變得更加便捷。「我們很少去(同步加速器的)現場了;我們將晶體郵寄過去。」Wolberger補充道,「那裡全都設置了出色的軟體和機器人,你在任何地方都可以進行操作。」
同步加速器數據採集系統的提升也使其可以進行分析,這在幾年前還是不可能的。被稱為「光柵掃描」的過程讓研究人員可以研究晶體及其較小的部分,從而發現樣品中最好的衍射區(可能這個樣品以其他方式是無法使用的)。自動化的高速數據採集同時也可以掃描更多的晶體。例如,Wolberger和她的同事們最近分析了超過1000個結晶來為一個結構收集足夠的信息,這是手動曝光所無法實現的。
X射線束本身也有所改進,新系統可以產生更高水平的X射線通量,能夠進行更快、解析度更高的分析。與此同時,一種被稱為「自由電子雷射」的新技術引起了許多結構生物學家的注意。「它們能夠產生約10~40飛秒長的X射線脈衝,這是非常短的脈衝,但每個裡面都有大量的X射線。」Caffrey解釋說。
由此產生了一種全新的結晶形式,Caffrey稱為「打了就跑(hit and run)」。研究人員使用雷射強大的X射線脈衝去攻擊一個微小的晶體,並在晶體爆炸前收集生成的數據。同步加速器可以檢測微米級的晶體,而新技術可以使晶體分析縮小至納米級。
不僅是全職的晶體學家在不斷推動這一技術的突破,其它領域的研究人員也開始更多地接觸這一技術。對於研究相對簡單的可溶分子的實驗室來說尤其如此,這其中就涵蓋了大部分人類基因組的蛋白質產物。「我所教授的課程是解釋如何結晶蛋白,(如果)你參加了其中的某堂課,應該回去以後就可以開展結晶試驗。」Caffrey說。
包括Hampton Research公司、MiTeGen公司和Molecular Dimensions公司在內的幾家廠商也在銷售現成的蛋白質結晶試劑盒,可以進一步幫助初學者入門。成功進入該領域的人可以在下一階段獲得更多的幫助。「在同步加速器工作的人非常願意承擔各種項目,並與來自非晶體實驗室的人一起工作,共同解析某個結構並成為共同作者。」Caffrey說。
在X射線晶體學穩步發展的同時,其他主要的蛋白質結構測定技術也處在變革之中,如冷凍電子顯微鏡(cryo-EM)技術。在冷凍電鏡中,研究人員將感興趣的標本凍結成一塊薄薄的冰,隨後將它置於電子顯微鏡中,接著拍照,然後通過分析圖像來確定目標的結構。儘管對於相對較大結構(如病毒)的研究,這一直是一項不錯的策略,但有些技術問題限制了它的應用。
但在幾年前,情況有所改變,這部分歸功於與顯微鏡本身無關的一些進展。「迄今為止最引人注目的(發展)是新的探測器技術。」加利福尼亞大學伯克利分校生物化學和分子生物學教授Eva Nogales說。電子顯微鏡工作者在傳統上依賴於用膠片去捕捉數據,但這種方法有很多限制。膠捲只有50幀,這在一次採樣過程中設置了最大曝光的數量,而且處理、掃描和分析模擬圖像可能會引發誤差。
工程師們最終設計出了敏感的、抗輻射加固的數字傳感器,即使是在高能電子顯微鏡下也能取代膠片。新的傳感器可以直接檢測電子,在提供超高解析度的同時無需煩憂使用膠片時的各種不便。「對比非常鮮明,我們的這些圖像有了更強的信號,並且由此帶來了一個額外的好處:它們的讀取非常、非常快。」Nogales說。
這項進展有助於解決另一個長期存在的問題。電子束導致凍結的樣品塊變形,從而造成傳統相機圖像的運動模糊。為了解決這一問題,此前冷凍電鏡的研究人員會大量進行圖像掃描,以找到少數的幾張蛋白質沒在移動的清晰圖片。有了新的傳感器,「讀取速度快到你可以在曝光過程中拍下動畫,隨後重新調整樣品以校正光束誘導的運動,這具有巨大的影響。」加利福尼亞大學生物化學和生物物理學教授David Agard說。
最新一代傳感器可以探測單個電子,它的研發資助來自於2008經濟危機後美國政府的經濟刺激計劃。這讓冷凍電鏡可以產生高解析度的蛋白質結構,分子量只有幾百個千道爾頓,這在此前是X射線晶體學家的專屬領域。電子顯微鏡家對他們能否進一步向晶體學推進持謹慎樂觀的態度。「我們到底能不能獲得有時X射線晶體學可以實現的解析度,比方說兩(埃)及以下,這我不知道。」Nogales說,「現在對於非常好的樣本來說,(冷凍電鏡)的紀錄可以做到約2.2埃。」
的確,即使是專門做冷凍電鏡的實驗室仍然需要晶體學。「如果你可以得到晶體,在大多數情況下你可以通過晶體學快速獲得結構,所以沒有理由不這麼做;我的實驗室就這麼做,這是理所當然的事。」Agard說。然而,他補充說,「未來將會有一整個領域的東西沒有得到良好的結晶,這將會被冷凍電鏡所取代。」
運行冷凍電鏡系統並分析數據的軟體也得到了顯著提升,這讓從顯微鏡校準到數據挖掘都變得更快、更容易。儘管大部分軟體都是開源的,但硬體肯定不是。現代冷凍電鏡顯微鏡來自一個公司——FEI公司,而其中的傳感器則是由Direct Electron公司和Gatan公司提供的。無論選擇哪個廠商和工具,購買一套完整的冷凍電鏡系統都要花費數百萬美元,每年的維護和運行成本也要幾十萬。「只有最富有的實驗室,或者是提供資助的機構才能夠做到這一點,但這對於國家能力來說並不是一件好事。」Agard說。德國、英國和中國都為冷凍電鏡設施設立了國家級的經費資助,但美國國立衛生研究院仍在考慮應如何推行下去。
但無論X射線晶體學和冷凍電鏡的發展如何迅猛,二者均無法滿足研究人員對結構模型研究日益增長的需求。「你無法超越實驗測定的結構,但挑戰在於已測序的基因組數量龐大,而且揭示所有蛋白質的三維結構實際上是不可能的任務。」英國帝國理工學院整合系統生物學和生物信息學中心主任Michael Sternberg說。
為了應對這一挑戰,Sternberg和他的同事Lawrence Kelley都將主要精力放在分子生物學家幾十年來的夢想上:直接從序列信息預測蛋白質結構。該團隊的最新工具Phyre2使用基於模板的建模,該方法將序列與此前解析過的蛋白質結構的全球資料庫進行比對。其他幾個研究小組也已經開發了類似的工具,世界各地的研究人員都可以進行在線訪問。
這些工具所獲得的結果十分引人矚目,至少是對在資料庫中有很好代表性的蛋白質家族來說。「有些蛋白質樣品我們已經能夠做得相當好了,而我們現在有了更多的數據,因此可以應用或開發更先進的技術,對序列和結構的關係進行建模。」芝加哥大學計算研究所高級研究員Jinbo Xu說。Xu目前是負責RaptorX的課題組長,RaptorX是預測蛋白質二、三級結構的在線門戶網站。
除了基於模板的建模外,一些研究人員如今正在探索一種被稱為「相關性預測(contact prediction)」的技術。該方法通過搜索大量的序列數據,識別在進化上保守的胺基酸的相互作用,然後利用這些相關性預測全新序列的摺疊模式。Sternberg說,「對只有極少數可用晶體結構的膜結合蛋白而言,這已經被證明是非常有用的。」但他補充說,「你仍然需要大量的對齊序列」才能確保相關性預測能起作用。
除了改進底層算法,計算生物學家也在努力讓他們的系統界面更加友好。Sternberg說,「我們基本上參照了谷歌那種簡潔的頁面,不讓用戶淹沒在大量的選項中,而且只提供用戶想要的。」這種方法似乎奏效了。據Sternberg估計,在去年44000個訪問Phyre2的獨立用戶中,只有幾百名用戶聯繫過他或Kelley尋求技術支持。
Xu和他的同事也採納了用戶友好的模式,並獲得了類似的結果。「使用這些工具的群體更為廣泛,我的伺服器用戶也具有非常多元化的背景。」他說。沒有經過結構生物學培訓的研究人員可能並不了解底層算法的局限性,所以大多數主要門戶網站的設計都會幫助用戶解讀結果。RaptorX會為每個蛋白質模型提供質量評估,評估該結構的正確率。同樣的,Phyre2也會為用戶提供整體信心評分,並為小至胺基酸水平的亞結構提供獨立評分。
因為所有主要的結構預測工具都是在線免費的,科學家們也可以兩頭下注,將他們的目標序列發給所有網站並觀察模型之間的差異。另一家網站CAMEO也會對不同的蛋白質結構服務進行測試和評估。CAMEO每周都會發送一段測試序列到所有參與的伺服器,然後根據系統的速度、伺服器可靠性及其他特性來計算基準。
根據研究人員的具體需求,不同的工具也會呈現出明顯的優缺點。RaptorX更注重為特別有挑戰性的蛋白質提供基於模板的建模,而其他門戶網站則更適合於對特徵相對明顯特徵的蛋白質家族進行大量的快速分析。Phyre2提供一套額外的服務;「Phyre警報」,例如,當新的數據允許系統計算出蛋白質的改進模型時,該警報會給研究人員發送郵件通知。
無論選擇什麼方法,尋求蛋白質結構的研究人員都可以期待更多的好消息。Agard通過對這三項技術的新進展的調查,也表示贊同結構生物學家的整體感受:「這是該領域發展的美好時光,有太多讓人激動萬分的事情。」
Alan Dove是麻薩諸塞州的科學作者和編輯。
DOI:10.1126/science.opms.p1600107
致謝:本文中文翻譯內容來自《科學新聞》,譯者姜天海,高大海。(譯者之一高大海系中國科學院海洋研究所助理研究員)
點擊「在看」,助力傳播