如何選擇蛋白晶體結構

2021-01-09 殷賦科技

在使用殷賦雲計算平臺的時候,有不少用戶對於如何選擇蛋白晶體結構存在疑問。本篇就這個話題做一些經驗分享。任何標準都有一個適用範圍。我們在這裡只討論用於分子對接的蛋白晶體結構的選擇原則和方法。

1. 確定蛋白種屬

在實驗當中,研究人員通常使用動物模型(如小鼠)來研究人源蛋白。這樣做有許多原因,比如:

1) 無法獲得(提純分離)人源蛋白;

2) 需要在體內考察蛋白的功能,但無法直接進行人體臨床試驗;

3) 使用動物蛋白更方便、更便宜;

4) 其他限制因素。

而計算模擬則便利很多。如果我們真正的研究對象是人體,則一般情況下應當使用人源蛋白。但是,如果需要根據對接計算的結果去指導實驗或解釋實驗現象,或者開展後續實驗(如定點突變)對計算結果進行驗證,那麼,原則上應當讓計算用的蛋白種屬與實驗一致,否則胺基酸序列可能對應不上。

比如,在UniprotKB資料庫(https://www.uniprot.org/)輸入基因名1DH1,得到以下結果。然後,根據我們確定的種屬查詢相應的蛋白。

(UniprotKB資料庫蛋白查詢結果)

假設我們要研究人的蛋白,那麼,可以在RCSB Protein Data Bank資料庫中搜索它的Entry name(1DHC_HUMAN)。另一方面,PDB資料庫也會給出每個晶體結構的種屬信息。

(PDB詳情頁的蛋白種屬信息)

2. 了解更多關於蛋白功能/結構的信息

做任何研究都應當對研究對象有充分了解。UniprotKB資料庫為我們整合了蛋白的相關知識,我們可以通過它獲得重要的信息。比如,了解蛋白的功能是什麼,序列有多長,結合位點在哪裡,有哪些蛋白結構。

(UniprotKB蛋白詳情頁,了解蛋白功能與結構信息)

(蛋白的結合區域信息)

3. 選擇口袋完整的晶體結構

對於某些蛋白,RCSB PDB資料庫可能存在許多晶體結構。這種情況下,應當選擇包含完整口袋的晶體結構。比如,當我們尋找1DH1基因的蛋白(Isocitrate dehydrogenase [NADP] cytoplasmic,Uniprot AC: IDHC_HUMAN)時,找到許多晶體結構。以4UMX和4UMY為例,如果查看三維結構,我們會發現4UMY有較多殘基缺失。最關鍵的是,一大段組成口袋的殘基缺失了,導致口袋的形狀改變(對比4UMX可知)。相反,4UMX則較為完整。因此,我們不應選擇4UMY,而應選擇4UMX作為候選結構。

(口袋完整與殘基缺失的蛋白對比)

4. 選擇含有共晶配體的結構

很多時候,蛋白晶體結構中不只是蛋白,還可能有核酸、多肽、輔酶、小分子化合物(抑制劑、拮抗劑、激動劑、底物)、助溶劑、表面活性劑、金屬離子和水分子以及其他分子;除了目標蛋白,可能還有其他蛋白。在PDB資料庫的蛋白詳情頁內有詳細記錄,我們需要了解各組分是什麼物質,各自的作用是什麼,哪個是共晶配體。

(蛋白晶體結構中各組分的信息)

一些很小的分子,數量很多的分子,結合在很淺的蛋白表面的分子,通常不會是配體分子(但也有例外)。還有一些名稱非常常見的,比如:GOL、ACT、PEG、SO4等等,這些只是蛋白結晶所需要的或者在溶液中存在的分子,不是真正意義上的配體分子。

仍然以4UMX為例,通過查詢它的詳細記錄(https://www.rcsb.org/structure/4UMX),我們了解到NAP是輔酶,VVS是小分子配體,GOL是助溶劑分子而已。那麼,我們應當以VVS的結合位置為對接口袋,而不應以NAP為對接位點。考慮到NAP與VVS有直接的相互作用,我們應當在對接時保留NAP,把它作為受體的一部分參與對接。

常見的輔酶還有:ADP、ATP、NAD+、NADH、NADP+、NADPH、HEME。

5. 選擇共晶配體相似的晶體結構

當有多個蛋白晶體結構可選,並且很多是包含共晶配體的,我們可以選擇共晶配體與要對接的化合物在結構上比較相似的那個。因為蛋白與配體在結合過程中,會發生「誘導契合」效應。有的蛋白的口袋柔性較大,這種效應更加明顯,蛋白跟不同配體結合時,口袋會有所改變。更為極端的是,有可能存在「開」和「合」等不同狀態。而對接過程中,蛋白結構是剛性不變的。因此,選擇口袋形狀合適的晶體結構會有利於對接。

6. 選擇解析度高的晶體結構

蛋白晶體結構的質量指標之一是resolution,它表示晶體結構模型中的原子位置的不確定程度。在有許多晶體結構可選的情況下,我們選擇解析度高的,即resolution數值小的。一般來說,resolution < 2 就足夠好了。但這不是最重要的選擇標準,很多人一上來就根據這條規則過濾掉大部分蛋白,這是不夠嚴謹、合理的。因為這樣有可能導致被過濾掉的低解析度蛋白中包含共晶配體,而剩下的高解析度蛋白中卻沒有配體的情況。此時選擇高解析度蛋白就無法確定口袋的位置(雖然可以通過低解析度蛋白來了解口袋位置,但仍然不便於定位口袋)和獲得適合的口袋形狀。

(蛋白結構解析度resolution)

值得注意的是,晶體結構由於解析度問題,通常不含氫原子,只有個別超高解析度的文件,才能看到氫原子的確切位置。相反,核磁結構通常含有氫原子,且有較多構象(它是溶液中的狀態),但不含配體分子。在蛋白解析度的選擇問題上,我們應有合理的依據,而非教條主義、人云亦云。

總結

事實上,如何選擇蛋白晶體結構,是個帕累託最優問題。我們需要綜合判斷,選擇最適合於當前研究的晶體結構。上述內容雖然是針對分子對接計算來講的,但同樣適用於其他計算模擬的情況。

如果上述內容有紕漏之處,歡迎大家批評指出。如果有補充或建議,歡迎在下方評論進行交流。

相關焦點

  • 研究解析肌動蛋白7a晶體結構
    7a與Sans蛋白複合物晶體結構 上海光源用戶香港科技大學(科大)生命科學部講座教授張明傑及他的研究團隊在2011年2月11日《科學》(Science 2011, 331, 757)雜誌上發表了題為 「Structure of MyTH4-FERM Domains in Myosin VIIa Tail Bound to Cargo」的論文,該論文研究了肌動蛋白
  • The Scientist:膜蛋白晶體結構最新研究進展
    然而迄今為止,在已知的蛋白結構總量當中,膜蛋白只佔據一小部分。基於結構的設計是開發藥物的一種強有力的武器,且藥物要能有效治療,作用位點就必須精準,且副作用最小化。X射線晶體學,仍然是解決不同大小的蛋白的原子結構的唯一通用方法。然而,由於非常難於製備高純度的膜蛋白和得到它們的晶體,該方法也無從施展。
  • 研究解析UHRF1蛋白晶體結構
    近日來自復旦大學、美國紀念斯隆-凱特琳癌症中心、清華大學、新興企業星座製藥(Constellation Pharmaceuticals)公司、哈佛大學醫學院的研究人員在新研究中解析了一個甲基化關鍵蛋白UHRF1的晶體結構及功能機制。這一研究成果在線發表在著名國際期刊《細胞》(Cell)雜誌旗下的子刊《分子細胞》(Molecular cell)雜誌上。
  • 解析肉鹼膜轉運蛋白晶體結構
    膜轉運蛋白CaiT與底物複合物的結構示意圖(1-12表示12段跨膜螺旋)。
  • 研究解析硝酸鹽轉運蛋白晶體結構
    來自清華大學生科院、生物膜與膜生物工程國家重點實驗室的研究人員報導了硝酸鹽/亞硝酸鹽轉運蛋白NarU的晶體結構(解析度為3.1Å),並分析了其結構和生化特徵
  • 研究解析酵母Shu蛋白晶體結構
    酵母的Shu蛋白複合物,是由Shu1、Shu2、Psy3和Csm2幾種蛋白組成,它通過偶聯複製後修復與同源重組,維持了基因組的穩定性。
  • Science :肌動蛋白7a與Sans蛋白質複合物2.8埃分辨晶體結構
    上海光源用戶香港科技大學(科大)生命科學部講座教授張明傑及他的研究團隊2月11日在Science雜誌上發表了題為 Structure of MyTH4-FERM Domains in Myosin VIIa Tail Bound to Cargo的論文,該論文研究了肌動蛋白7a的突變如何導致先天性失聰失明。
  • 上海光源用戶在《自然》發表兩項蛋白晶體結構研究成果
    它與人的GLUT1-4蛋白有著高達50%的序列相似性,進化上高度保守。利用上海光源生物大分子晶體學線站,顏寧研究組獲得了XylE與其兩個抑制劑的複合體結構,加上使用日本SPring-8光源獲得的XylE與底物D-木糖的複合物結構,共得到了三個複合物結構。XylE蛋白的三維晶體結構呈現出典型的MFS家族摺疊方式——由12個跨膜螺旋組成N端和C端兩個以假兩次軸對稱的結構域。
  • ...團隊解析新冠病毒受體結合區RBD與受體蛋白ACE2複合物的晶體結構
    清華大學團隊解析新冠病毒受體結合區RBD與受體蛋白ACE2複合物的晶體結構 2020年2月18日,清華大學生命學院王新泉課題組和醫學院張林琦課題組緊密合作,利用X射線衍射技術,解析了新型冠狀病毒(2019-nCoV)表面刺突糖蛋白受體結合區(receptor-binding domain, RBD)與人受體ACE2蛋白複合物的晶體結構
  • 新冠非結構蛋白9(Nsp9)的晶體結構
    新冠非結構蛋白9(Nsp9)的晶體結構 2020-07-14 18:15 來源:澎湃新聞·澎湃號·湃客
  • ACSDBC:科學家闡明伊波拉病毒複製關鍵蛋白的晶體結構
    近日,刊登在國際雜誌Acta Crystallographica Section D Biological Crystallography上的一篇研究論文中,來自維吉尼亞大學的研究人員揭示了伊波拉病毒負責複製的關鍵蛋白質的晶體結構,即薩伊伊波拉病毒核蛋白的C末端結構域。
  • Nature:鉀離子運輸蛋白TrkH晶體結構
    在細菌、酵母和植物中,鉀離子吸收是由一個超級家族的運輸蛋白「SKT蛋白」實現的。這些蛋白被認為是從簡單的鉀通道形成的,但是鉀離子選擇性和運輸的機制卻不清楚。現在,一種細菌SKT蛋白(來自「副溶血性弧菌」的TrkH鉀運輸蛋白)的晶體結構已被確定。它的選擇性過濾器與鉀離子通道中的擇性過濾器相似,但較短。
  • 生物物理所解析出植物光保護蛋白PsbS的晶體結構
    中國科學院生物物理研究所常文瑞院士課題組於四年前開展了PsbS的晶體結構研究。這些研究結果為理解PsbS是如何被激活和抑制以及其參與qE的可能機制奠定了重要基礎。早在2000年,已有報導表明PsbS在qE功能中發揮關鍵作用,但是對於PsbS是否結合色素一直存有爭議,其參與光保護作用的機制也並不清楚,因而解析其三維結構成為本領域期待已久的研究課題。  中國科學院生物物理研究所常文瑞院士課題組於四年前開展了PsbS的晶體結構研究。
  • Nature:解析出細胞色素氧化酶caa3晶體結構
    都柏林聖三一學院研究人員確定了這種蛋白的晶體結構,就可以在分子水平上解釋一種特別複雜的蛋白機器(protein machine)在能量產生和儲存過程中如何工作。ATP是細胞的能量貨幣,能被用來維持細胞生存、生長和複製。
  • 胰高血糖素受體結構揭示G蛋白選擇調控機制
    )分別與激活型G蛋白(Gs)和抑制型G蛋白(Gi)結合的複合物三維結構,這是首次測定一種GPCR與不同類型G蛋白結合的複合物結構,闡明了受體與不同G蛋白的精細結合模式,並揭示了GPCR對G蛋白的選擇性機制,為深入認識GPCR的細胞信號轉導機理提供了重要依據。
  • ...疾病相關的重要蛋白Aprataxin同源物Hnt3與DNA複合物的晶體結構...
    Hnt3與雙鏈DNA和AMP複合物的晶體結構近日,國際著名期刊Nature Structural & Molecular Biology發表了中國科學院生物物理所王大成院士研究組和江濤研究組合作完成的研究成果
  • 在世界上首次揭示人源葡萄糖轉運蛋白GLUT1的晶體結構
    清華大學顏寧研究組取得生命科學基礎研究重大突破 在世界上首次揭示人源葡萄糖轉運蛋白GLUT1的晶體結構  清華新聞網6月6日電(記者 顧淑霞)清華大學醫學院顏寧教授研究組在世界上首次解析了人源葡萄糖轉運蛋白GLUT1
  • 研究首次報導機械敏感性離子通道晶體結構
    他主要從事結構生物學領域的研究工作,曾於2003年在世界上第一個解析了SARS病毒主要蛋白酶的晶體結構,並且發現一種經過修飾的底物類似物可以有效地抑制這一蛋白酶的活性,為設計抗SARS的藥物打下了堅實的基礎。 生物膜離子通道(ion channels of biomembrane)是各種無機離子跨膜被動運輸的通路。
  • 專家教你如何選擇人工晶體治療白內障
    摘要:人工晶體植入是治療白內障最有效的方法,患者可以根據自身的病情和經濟條件,與醫生商量選擇一種適合自己的人工晶體,下面讓我們一起來了解一下人工晶體的類型有哪些
  • Science:胰高血糖素受體結構揭示G蛋白選擇調控機制
    (Glucagon receptor,GCGR)分別與激活型G蛋白(Gs)和抑制型G蛋白(Gi)結合的複合物三維結構,這是首次測定一種GPCR與不同類型G蛋白結合的複合物結構,闡明了受體與不同G蛋白的精細結合模式,並揭示了GPCR對G蛋白的選擇性機制,為深入認識GPCR的細胞信號轉導機理提供了重要依據。