蛋白質結構研究入門,你都知道嗎(上)?

2021-01-20 小張聊科研

前段時間聽說顏寧女神來到生化所做演講,引發了圍觀熱潮,舉辦方不得已臨時更換了演講場所。小師弟我因為擠不進去,未能一睹女神風採,不過有同學朋友圈發了現場照片,大家可以感受一下。

聽說上一次引發同樣現象的,還是施一公教授來此演講——果然是名師出高徒啊!施一公教授和顏寧教授都是國際頂級的結構生物學研究者,小師弟想藉此機會,和大家聊一聊結構生物學相關的知識。

顏寧教授


結構生物學主要是通過解析生物大分子的具體三維結構,從最底層詳細闡明各種分子的作用機制,如酶的催化機制、信號通路中互作分子的互作機制以及疾病發生過程中蛋白質摺疊變化(想起狂牛症和阿爾茲海默症沒有?)等。

獲得各種生物大分子的結構,尤其是蛋白質分子的結構在很多領域都具有重要作用。比如根據靶標蛋白的結構進行理性藥物設計以及理性篩選

用於獲得生物大分子結構的實驗手段主要有3大類:(1)X射線(現在基本上都是同步輻射光源用於解析結構),(2)核磁共振(NMR)以及(3)冷凍電鏡(cryo-EM)。三種方法都及其依賴於大型設施/儀器的應用。

上海光源(Shanghai Synchrotron Radiation Facility,SSRF)


雖然已經解析出來的蛋白質結構日益增多(可以到蛋白質結構資料庫PDB中查詢其結構是否被解析),但是很多小夥伴們的研究目標的結構還沒有被解析(實際上是大部分蛋白結構都沒有被解析)。


蛋白質結構資料庫PDB:http://www.rcsb.org/


那麼,在實驗之外,有其他方法獲得生物大分子的結構嗎?當然有啊,那就是結構預測啊。

PS:結構預測獲得的結構不一定準確,不過近年來隨著資料庫的擴大以及算法的改進,結構預測的準確性越來越高。


關於核酸RNA二級結構的預測,之前我們公眾號介紹過RNAstructure的使用:《如何繪製高大上的RNA 二級結構圖?》(關於RNA三級結構的預測,我們稍後會有推文。)我們先來介紹一下蛋白質結構的預測。


一、背景介紹

蛋白質的結構從低維度到高維度劃分為四級:

一級結構——胺基酸序列;

二級結構——主鏈原子形成的局部空間構象,如α螺旋,β摺疊;

三級結構——二級結構在三維空間排列形成三維結構;

四級結構——不同亞基組成的蛋白質複合物大分子。

在二級結構和三節結構之間,還存在超二級結構(有些書籍稱作motif,模體/基序)以及結構域。


二、工具使用


從一級序列我們能夠獲得哪些信息呢?小師弟在此給大家安利一個網站,https://web.expasy.org/protparam/。

它的主界面非常簡單,我們可以輸入蛋白質的AC號或者蛋白質序列,然後點擊compute parameters, 然後就可以獲得這個蛋白質的諸多信息了。

PS:ExPASy 是一個神器的網站,大家可以通過網址https://www.expasy.org/resources來訪問其提供的各種生物信息學工具,有很多妙用哦!之前我們在研究Protein,這些技術不得不看中有提到其中的PROSITE的用法。


在跳轉出來的結果頁,我們可以獲得如下一些信息:

蛋白質分子的胺基酸數量及其相對分子質量,

理論等電點,

胺基酸組成及其帶電胺基酸數量,

原子組成和分子式,

消光係數/吸收度,

半衰期,

不穩定係數,

脂肪性係數以及該蛋白質的總平均親水性。

 


三、結果解讀和研究意義


分子質量在SDS-PAGE電泳以及western blot中非常有用。但是,在SDS-PAGE或者western blot實驗中,分子條帶大小並一定和此處給的完全相符,排除了未充分煮樣等實驗操作失誤外,還可能是因為這些蛋白帶電荷過於特殊,有別於正常蛋白。對於蛋白分子質量,我們還可以使用胺基酸殘基數目*110來快速估算。


等電點就是電解質在此pH下,其所帶的正電荷和負電荷一樣多,導致其淨電荷為0。理論等電點在等電聚焦以及使用離子交換層析分離純化蛋白時非常有用。使用離子交換層析分離純化兩個蛋白,一般需要兩個蛋白等電點相差至少0.5。對於常見的蛋白純化親和標籤,一般都已經通過基因工程改造,將其等電點改造成明顯偏離普通蛋白的等電點。如His-sumo標籤的等電點為5.4,GST標籤的等電點為5.6,MBP標籤的等電點為4.9。而大多數蛋白的等電點為偏酸性,略低於7,因此可以方便的使用離子交換層析方法分離親和標籤和不含標籤的目的蛋白。


胺基酸組成方面,我們可以方便的看到20種胺基酸佔比(有幾個胺基酸在大多數蛋白中的佔比相對恆定,此是諸多蛋白質濃度測定的統計學基礎)。有細心的小夥伴可能發現,在20種胺基酸下面,還有3個胺基酸符號,那是什麼東東?說實話,第一次打開這個結果頁,我也被這三個符號唬住了。本著科研狗+理工男的嚴謹精神(對,我大生物就是理科,那些常常懟生物像文科的,別逼逼,我不接受反駁,小師弟要傲嬌一回),我立馬查詢一番,原來,B就是Asx,Aspartic acidor Asparagine(天冬氨酸或者天冬醯胺);Z就是Glx,Glutamine or Glutamic acid(穀氨醯胺或者穀氨酸);X就是Xaa,Any amino acid(任意胺基酸)。也就是說,這3個符號是用來表示暫時還有歧義的胺基酸殘基的,並不是什麼稀有胺基酸。


下面還有荷電胺基酸統計。分別統計了帶負電胺基酸(天冬氨酸和穀氨酸)的數量,以及帶正電胺基酸(賴氨酸和精氨酸)的數量。有小夥伴可能會好奇,鹼性胺基酸不是賴氨酸、精氨酸、組氨酸3個嗎?這裡面為什麼沒有組氨酸呢?因為組氨酸是一種弱鹼性胺基酸,在生理狀態下基本上不帶電的。不信,我給你看個表格。


我們可以看到,組氨酸的等電點為7.59,而人體血液的pH在7.35-7.45,其他多種體液也都是偏弱鹼性(當然,胃液這種變態不算的,它的pH變態的為0.9-1.5),所以說組氨酸在生理狀態下基本上不帶電,所以就不參與統計嘍!

酸鹼體質理論


消光係數和吸收度:根據朗伯比爾定律A=lg(1/T)=Kbc (A為吸光度,T為透射比,是出射光強度(I)比入射光強度(I0),c為吸光物質的濃度,單位為mol/L,b為吸收層厚度,單位為釐米),吸光度和溶液中的溶質濃度以及光程長度成正比,這個比例係數K就是我們的消光係數。那麼消光係數有什麼用呢?我們可以通過分光光度計測量出吸光度值Abs(測量入射光和出射光的比值,並取對數),然後除以(光程*消光係數),就可以知道蛋白質的濃度了。

簡單的來說,我們取1 ul蛋白溶液,使用nanodrop測量出吸光度值A,然後直接除以這裡給的吸收度,就可以得到蛋白質濃度了(nanodrop默認的設置是1 Abs=1mg/ml)。


整個過程不超過2分鐘,比起Bradford,Lowry之流測蛋白濃度,不知道要快多少倍。


實際上,這個消光係數和吸收度我們自己都可以計算出來的,計算方法也很簡單:

消光係數=Numb(Trp)*5500 + Numb(Tyr)*1490+Numb(Cystine)*125

吸收度=消光係數/分子質量

Numb表示個數


從上述公式,我們也可以知道,一個蛋白質分子的消光係數主要取決於色氨酸(要不怎麼叫做「色」氨酸呢?)、酪氨酸以及胱氨酸的含量。如果一個序列中含有多個半胱氨酸,考慮到兩個半胱氨酸可以被氧化生成一個胱氨酸,因此,有多個半胱氨酸的序列,ExPASy都給了兩個消光係數,一個是所有半胱氨酸都用於生成胱氨酸,一個是所有半胱氨酸都是還原形式,沒有生成任何胱氨酸。小夥伴們可以用計算器根據前面胺基酸組成的圖,按照這裡的公式計算一下消光係數和吸收度,看是否一致哦!


我為什麼詳細介紹消光係數的計算呢?因為很多小夥伴在蛋白實驗中會做突變分析,現在我們知道了,如果沒有消除或者新增色氨酸、酪氨酸以及半胱氨酸,一個蛋白的消光係數是不會發生變化的(吸收度會變化一點點,因為分子質量會有一點點變化,不過基本上不用考慮),那麼我們就不用重新計算消光係數了。


 半衰期:半衰期用來衡量目的蛋白在體內的穩定性。蛋白質在細胞中處於動態平衡,在其合成之後,它的壽命基本上就已經決定了。也就是說,細胞這個傢伙為了保證自己的運轉正常,給大多數蛋白都設定了一個使用期限,防止超期限執行任務的蛋白因為老化而出錯,而衰老的蛋白會被回收利用或者消除(小師弟感受到了強烈的宿命論!!!)。


而決定這個使用期限(用半衰期表示)的,就是蛋白質自身N端的前幾個胺基酸序列。因此,這個ExPASy程序會把我們輸入序列的前幾個胺基酸當做N端序列計算這個蛋白質的半衰期,並且給出了在哺乳動物網織紅細胞、酵母和大腸桿菌這3種模式細胞中的半衰期。


文章中經常通過蛋白半衰期來研究泛素化-蛋白酶體途徑介導的蛋白降解


不穩定係數:不穩定係數用來衡量目的蛋白在體外的穩定性。不穩定係數基於之前研究者的發現,也即某些二肽在穩定蛋白和不穩定蛋白中的出現概論相差很大,因此,可以通過這些二肽的出現頻率來預測蛋白質在體外的穩定性。不穩定係數越小,表明此蛋白越穩定。在判別標準上,將不穩定係數小於40的蛋白判定為能夠穩定存在。結合小師弟多年純化蛋白的經驗(苦逼經歷),這項預測還是相對比較準確的。對於被預測為不穩定的蛋白,尤其是那些數值遠遠大於40的目的蛋白,小夥伴如果對其進行操作,一定要加快實驗進度哦,因為這些蛋白在4℃放個兩三天,就可能降解了哦!


脂肪係數:脂肪係數也可以用來衡量目的蛋白的穩定性。我們知道,蛋白質摺疊的一個主要驅動力就是疏水相互作用。而脂肪係數用丙氨酸、纈氨酸、亮氨酸、異亮氨酸這4個疏水胺基酸的出現頻次*相關權重並加和,得到了一個脂肪係數。脂肪係數越高,蛋白相對越穩定。


總平均親水性:用于衡量目的蛋白的總體平均親水性。通過將親水胺基酸賦正值,將疏水胺基酸賦負值,加和後除以胺基酸數目,得到總體的平均親疏水性。數值越大,親水性越強。實際上,對於多結構域蛋白此數值意義不是很大,因為蛋白分子中既有疏水結構域,也有親水結構域,兩者數值會相互抵消。GRAVY主要是結合局部親疏水性打分,獲得如下圖所示親疏水性打分圖,可以用來預測跨膜區(跨膜區相對於總體序列高度疏水,峰圖中間橫線就是代表總平均親水性)。


好了,內容就到這裡。第一次寫推文,可能有點過於詳細和囉嗦,大家多提點意見,以後小師弟我多多改進。


相關文章:


長按二維碼識別關注「小張聊科研」

關注後獲取《科研修煉手冊》1、2、3、4、5、6、7,8


相關焦點

  • 沒有蛋白質就沒有生命,但你知道蛋白質是如何「編織」的嗎?
    而所有這些形態各異的地球生命,在本質上卻都有著許多驚人的共同之處——比如,生命都是由遺傳物質指導下合成的蛋白質構成的。蛋白質(Proteins)這個名詞第一次出現是在100多年前的希臘,意思就是「非常重要」(of prime importance)。我們知道,蛋白質是細胞的基本組成成分之一,它是一種微觀分子。如果說細胞就是一棟房子,蛋白質是建房子的磚,但不是唯一的磚。
  • 蛋白質結構分析系列(一)
    我對該領域的狹隘的基本認識        通常情況下,我們認為的蛋白質結構分析可能都是三級結構分析、蛋白和蛋白互作或蛋白與其他生物分子互作的分析,這種分析通常在結構生物學領域常見。事實上,做生物信息學的學生也會經常涉及蛋白質結構分析。
  • 是不是所有的蛋白質都具有一級、二級、三級和四級結構?
    學過生化的人都知道,為了方便起見,蛋白質的結構可以人為的劃分為四個不同的層次,即一級結構、二級結構、三級結構和四級結構(圖1)。
  • 蛋白質為什麼擺造型:結構決定功能(全文)
    我們經常聽說「蛋白質結構」「蛋白質變性」之類的話。通常所說的「蛋白質結構」是指蛋白質擺出的空間造型,「變性」就是它們本來造型的改變。那麼,蛋白質如何擺出造型?又為什麼要擺造型?這對人類有什麼意義嗎?
  • 研究蛋白質你的資料庫用對了嗎?常用蛋白質資料庫分享
    結構域結構、轉錄後修飾、修飾位點、變異度、二級結構、三級結構等,同時提供其他資料庫,包括序列資料庫、三維結構資料庫、2-D凝聚電泳資料庫、蛋白質家族資料庫的相應連結。CDD(Conserved Domain Database)網址:http://www.ncbi.nlm.nih.gov/Structure/cdd/cdd.shtml簡介:蛋白質的功能與其結構密切相關,一個蛋白質的保守結構域在一定程度上體現了該蛋白質的功能。
  • 美國科學家用人工智慧來研究蛋白質結構,既快又高效
    雖說我們現在的醫學水平比以前已經進步很多了,以前很多治不好的病現在都可以治好,但是如果你因此覺得我們現在的醫學水平已經足夠高了的話,那你可就大錯特錯了。事實上,醫學要想達到更高的水平,就需要研究蛋白質,這樣才能加深我們對人類身體的了解,從而更好地治病。
  • 高考生物中的蛋白質是什麼結構你知道嗎?這篇文章為你解釋!
    二、胺基酸及其種類1) 胺基酸是組成蛋白質的基本單位;2) 在生物體中組成蛋白質的胺基酸約有20種;3) 每種胺基酸至少都含有一個氨基和一個羧基,並且都有一個氨基和羧基連接在同一個碳原子上.4) 然後每個碳原子上面還連接了一個R基;5) 胺基酸的區別就是因為R基不同,結構簡式:三、蛋白質的結構及其多樣性1) 蛋白質是以胺基酸為基本單位構成的生物大分子;2) 蛋白質是由多個胺基酸脫水縮合形成肽鏈
  • 用突變基因,解碼蛋白質結構
    新方法雖然不能像標準方法那樣提供完整的原子結構圖譜,但它提供的蛋白質大體形狀卻帶來了與蛋白質功能相關極具價值的線索。此外,這可能會對確定膜結合蛋白或大型複合體的一部分結構產生非常大的影響,而這兩種結構都很難用標準方法研究。」現如今,最常用確定蛋白質結構的方法是將數百萬份蛋白質複製成有序的晶體,然後用X射線衍射,並追蹤它們的活動以揭示每個原子的特性和位置。
  • 蛋白質的三級結構與結構域
    哺乳動物肌肉中的肌紅蛋白整個分子由一條肽鏈盤繞成一個中空的球狀結構,全鏈共有8段α螺旋,各段之間以無規捲曲相連。在螺旋肽段之間有一個疏水性的空穴,是用來放置血紅素基團的。三級結構是蛋白質發揮生物活性所必須的,所以蛋白質變性時生物功能會受到破壞。
  • 向李昌鈺學破案,這是Deepmind預測蛋白質結構的秘密研究方法嗎?
    不,我們要向李昌鈺博士學習破案手段,絕不放過任何蛛絲馬跡,靠豐富的想像力,進行推理,看能否找到Deepmind預測蛋白質結構的秘密研究方法。這種新算法在一次知名大賽中斬頭露角,這裡有必要介紹一下這個大賽,大賽也是為了促進提高預測準確性的最新方法的研究和測量進展而設立的。結構預測評估競賽(CASP)是蛋白質摺疊領域的奧運會,一年兩次的吸引了來自世界各地的研究團體,已成為評估技術的黃金標準。人工智慧程序AlphaFold在這次比賽中贏得了第一。
  • 圖文並茂講解不同的蛋白質結構
    A. α-螺旋,是蛋白質的一種二級結構,其肽鏈主鏈繞中心軸盤繞成螺旋狀,為右手螺旋結構,A 錯。B. 無規捲曲,是沒有確定規律性的肽鏈結構,也屬於蛋白質的二級結構,B 錯。C. 結構域,是指分子量較大的蛋白質常可摺疊形成多個結構較為緊密且穩定的區域,並可行使其特定的功能。
  • AlphaGo顛覆生物圈,精準預測蛋白質結構
    除了實驗,隨著計算機的發展,該項技術在上世紀末便已用於預測蛋白質的結構,但效果並不理想。然後,一組獨立的科學家使用度量標準來評估預測的蛋白質與實驗確定的結構的相似程度,以此評估各個研究小組的預測結果。研究小組的名稱為匿名。 在今年的比賽中,AlphaFold的稱號是「427組」。其預測的許多條目具有驚人的準確性,將近三分之二的預測與實驗所得的結構相當。
  • 這些富含蛋白質的水果,你都知道嗎?
    什麼是蛋白質?胺基酸是結合在一起形成蛋白質的有機小分子。人體的每個細胞都含有不同種類的蛋白質。實際上,您的身體至少產生100,000種不同的蛋白質。 蛋白質是頭髮,肌肉和血細胞的基礎。當您消耗的蛋白質超過身體所需的量時,多餘的蛋白質就會轉化為脂肪。您的身體還可以消耗蛋白質作為最後的能量儲備。
  • 顏寧等點評:AI精準預測蛋白質結構,結構生物學何去何從?
    網絡上有人提出:AI都能解蛋白質結構了,結構生物學家是不是該失業了?《返樸》總編、結構生物學家顏寧特邀幾位同仁對這一新聞各抒己見, 回答大家的疑問。傳統上,蛋白質結構預測可以分成基於模板和從頭預 測,但是AlphaFold2隻用同一種方法--機器學習,對幾乎所有的蛋白質都預測出了 正確的拓撲學的結構,其中有大約2/3的蛋白質精度達到了結構生物學實驗的測量 精度。說他們接近解決了這個問題,這個說法沒錯,至少是在單結構域的蛋白結構 來講是這樣的。谷歌這次為什麼能夠取得如此大的成功?這個首先是與它們擁有強大的人力和計算 資源有關。
  • 蛋白質的結構與功能
    第 21 種胺基酸為硒代半胱氨酸(selenocysteine, 縮寫為 Sec 或 SeCys),其結構中以 Se 代替了半胱氨酸中的 S。但實際上,硒代半胱氨酸是絲氨酸的衍生物。2002 年,在某些古細菌中還發現了第 22 種胺基酸,為吡咯賴氨酸(pyrrolysine)。吡咯賴氨酸由賴氨酸修飾形成。這兩種胺基酸都有自己對應的密碼子。
  • 這 11 個可以預測蛋白質結構的網站,通通都安利給你!
    由線性胺基酸組成的蛋白質需要摺疊成特定的空間結構才具有相應的生理活性和生物學功能。解析蛋白質的空間結構對於認識蛋白質的功能、功能的執行、生物大分子間的相互作用,以及醫學和藥學的發展(如藥物靶點的設計等)具有重要意義。為了更快速地了解蛋白質功能,不能只等待蛋白質的測定結果,尤其是對未知蛋白質開展研究之前,通過對蛋白質結構進行預測具有明顯的優勢。
  • 將分子結構轉換成聲音,可深入了解蛋白質結構,並創造出新變化!
    在聽了這些旋律後,現在能夠分辨出特定的胺基酸序列,這些胺基酸序列與具有特定結構功能的蛋白質相對應,這是一個貝塔表,或者是一個阿爾法螺旋。研究蛋白質的語言整個概念是為了更好地理解蛋白質及其大量的變異,蛋白質構成了皮膚、骨骼和肌肉的結構材料,同時也是酶、信號化學物質、分子開關和許多其他功能材料,構成了所有生物的機械。
  • 科學網—蛋白質結構解析:生物學的「聖杯」
    ,但我不知道它的結構和功能」是幾乎所有分子和細胞生物學家每天面臨的最大難題之一。Anfinsen)提出「蛋白質的高級空間結構由蛋白質的胺基酸序列決定」後(他也因此獲得1972年諾貝爾化學獎),人們開始尋找一種能夠預測蛋白質結構的算法,可以精確地從蛋白質的胺基酸序列,利用計算機預測出其複雜的空間結構,甚至其由結構決定的功能。
  • 顏寧等點評:AI精準預測蛋白質結構,結構生物學何去何從?
    網絡上有人提出:AI都能解蛋白質結構了,結構生物學家是不是該失業了?《返樸》總編、結構生物學家顏寧特邀幾位同仁對這一新聞各抒己見, 回答大家的疑問。除了我們蛋白質結構預測小同行對AlphaFold2的成功很欣喜之外,社會上還有多個不同方向的學術界、產業界和新聞界對它寄予了厚望。
  • 蛋白質結構解析六十年
    本文簡要回顧了蛋白質結構解析的重大歷史事件,並總結了蛋白質結構解析的常用方法和結構分析方向。通過了解蛋白質結構,能夠讓我們更好地理解生物體的蛋白的理化特性,以及其相關聯的化學反應途徑及其機制,對於我們認識生物世界和研發治療方法和藥物都起著關鍵作用。在即將召開的2015高解析度成像與生物醫學應用研討會上,各位專家學者將會進一步討論相關議題。