前段時間聽說顏寧女神來到生化所做演講,引發了圍觀熱潮,舉辦方不得已臨時更換了演講場所。小師弟我因為擠不進去,未能一睹女神風採,不過有同學朋友圈發了現場照片,大家可以感受一下。
聽說上一次引發同樣現象的,還是施一公教授來此演講——果然是名師出高徒啊!施一公教授和顏寧教授都是國際頂級的結構生物學研究者,小師弟想藉此機會,和大家聊一聊結構生物學相關的知識。
顏寧教授
結構生物學主要是通過解析生物大分子的具體三維結構,從最底層詳細闡明各種分子的作用機制,如酶的催化機制、信號通路中互作分子的互作機制以及疾病發生過程中蛋白質摺疊變化(想起狂牛症和阿爾茲海默症沒有?)等。
獲得各種生物大分子的結構,尤其是蛋白質分子的結構在很多領域都具有重要作用。比如根據靶標蛋白的結構進行理性藥物設計以及理性篩選。
用於獲得生物大分子結構的實驗手段主要有3大類:(1)X射線(現在基本上都是同步輻射光源用於解析結構),(2)核磁共振(NMR)以及(3)冷凍電鏡(cryo-EM)。三種方法都及其依賴於大型設施/儀器的應用。
上海光源(Shanghai Synchrotron Radiation Facility,SSRF)
雖然已經解析出來的蛋白質結構日益增多(可以到蛋白質結構資料庫PDB中查詢其結構是否被解析),但是很多小夥伴們的研究目標的結構還沒有被解析(實際上是大部分蛋白結構都沒有被解析)。
蛋白質結構資料庫PDB:http://www.rcsb.org/
那麼,在實驗之外,有其他方法獲得生物大分子的結構嗎?當然有啊,那就是結構預測啊。
PS:結構預測獲得的結構不一定準確,不過近年來隨著資料庫的擴大以及算法的改進,結構預測的準確性越來越高。
關於核酸RNA二級結構的預測,之前我們公眾號介紹過RNAstructure的使用:《如何繪製高大上的RNA 二級結構圖?》(關於RNA三級結構的預測,我們稍後會有推文。)我們先來介紹一下蛋白質結構的預測。
一、背景介紹
蛋白質的結構從低維度到高維度劃分為四級:
一級結構——胺基酸序列;
二級結構——主鏈原子形成的局部空間構象,如α螺旋,β摺疊;
三級結構——二級結構在三維空間排列形成三維結構;
四級結構——不同亞基組成的蛋白質複合物大分子。
在二級結構和三節結構之間,還存在超二級結構(有些書籍稱作motif,模體/基序)以及結構域。
二、工具使用
從一級序列我們能夠獲得哪些信息呢?小師弟在此給大家安利一個網站,https://web.expasy.org/protparam/。
它的主界面非常簡單,我們可以輸入蛋白質的AC號或者蛋白質序列,然後點擊compute parameters, 然後就可以獲得這個蛋白質的諸多信息了。
PS:ExPASy 是一個神器的網站,大家可以通過網址https://www.expasy.org/resources來訪問其提供的各種生物信息學工具,有很多妙用哦!之前我們在研究Protein,這些技術不得不看中有提到其中的PROSITE的用法。
在跳轉出來的結果頁,我們可以獲得如下一些信息:
蛋白質分子的胺基酸數量及其相對分子質量,
理論等電點,
胺基酸組成及其帶電胺基酸數量,
原子組成和分子式,
消光係數/吸收度,
半衰期,
不穩定係數,
脂肪性係數以及該蛋白質的總平均親水性。
三、結果解讀和研究意義
分子質量在SDS-PAGE電泳以及western blot中非常有用。但是,在SDS-PAGE或者western blot實驗中,分子條帶大小並一定和此處給的完全相符,排除了未充分煮樣等實驗操作失誤外,還可能是因為這些蛋白帶電荷過於特殊,有別於正常蛋白。對於蛋白分子質量,我們還可以使用胺基酸殘基數目*110來快速估算。
等電點就是電解質在此pH下,其所帶的正電荷和負電荷一樣多,導致其淨電荷為0。理論等電點在等電聚焦以及使用離子交換層析分離純化蛋白時非常有用。使用離子交換層析分離純化兩個蛋白,一般需要兩個蛋白等電點相差至少0.5。對於常見的蛋白純化親和標籤,一般都已經通過基因工程改造,將其等電點改造成明顯偏離普通蛋白的等電點。如His-sumo標籤的等電點為5.4,GST標籤的等電點為5.6,MBP標籤的等電點為4.9。而大多數蛋白的等電點為偏酸性,略低於7,因此可以方便的使用離子交換層析方法分離親和標籤和不含標籤的目的蛋白。
在胺基酸組成方面,我們可以方便的看到20種胺基酸佔比(有幾個胺基酸在大多數蛋白中的佔比相對恆定,此是諸多蛋白質濃度測定的統計學基礎)。有細心的小夥伴可能發現,在20種胺基酸下面,還有3個胺基酸符號,那是什麼東東?說實話,第一次打開這個結果頁,我也被這三個符號唬住了。本著科研狗+理工男的嚴謹精神(對,我大生物就是理科,那些常常懟生物像文科的,別逼逼,我不接受反駁,小師弟要傲嬌一回),我立馬查詢一番,原來,B就是Asx,Aspartic acidor Asparagine(天冬氨酸或者天冬醯胺);Z就是Glx,Glutamine or Glutamic acid(穀氨醯胺或者穀氨酸);X就是Xaa,Any amino acid(任意胺基酸)。也就是說,這3個符號是用來表示暫時還有歧義的胺基酸殘基的,並不是什麼稀有胺基酸。
下面還有荷電胺基酸統計。分別統計了帶負電胺基酸(天冬氨酸和穀氨酸)的數量,以及帶正電胺基酸(賴氨酸和精氨酸)的數量。有小夥伴可能會好奇,鹼性胺基酸不是賴氨酸、精氨酸、組氨酸3個嗎?這裡面為什麼沒有組氨酸呢?因為組氨酸是一種弱鹼性胺基酸,在生理狀態下基本上不帶電的。不信,我給你看個表格。
我們可以看到,組氨酸的等電點為7.59,而人體血液的pH在7.35-7.45,其他多種體液也都是偏弱鹼性(當然,胃液這種變態不算的,它的pH變態的為0.9-1.5),所以說組氨酸在生理狀態下基本上不帶電,所以就不參與統計嘍!
酸鹼體質理論
消光係數和吸收度:根據朗伯比爾定律A=lg(1/T)=Kbc (A為吸光度,T為透射比,是出射光強度(I)比入射光強度(I0),c為吸光物質的濃度,單位為mol/L,b為吸收層厚度,單位為釐米),吸光度和溶液中的溶質濃度以及光程長度成正比,這個比例係數K就是我們的消光係數。那麼消光係數有什麼用呢?我們可以通過分光光度計測量出吸光度值Abs(測量入射光和出射光的比值,並取對數),然後除以(光程*消光係數),就可以知道蛋白質的濃度了。
簡單的來說,我們取1 ul蛋白溶液,使用nanodrop測量出吸光度值A,然後直接除以這裡給的吸收度,就可以得到蛋白質濃度了(nanodrop默認的設置是1 Abs=1mg/ml)。
整個過程不超過2分鐘,比起Bradford,Lowry之流測蛋白濃度,不知道要快多少倍。
實際上,這個消光係數和吸收度我們自己都可以計算出來的,計算方法也很簡單:
消光係數=Numb(Trp)*5500 + Numb(Tyr)*1490+Numb(Cystine)*125
吸收度=消光係數/分子質量
Numb表示個數
從上述公式,我們也可以知道,一個蛋白質分子的消光係數主要取決於色氨酸(要不怎麼叫做「色」氨酸呢?)、酪氨酸以及胱氨酸的含量。如果一個序列中含有多個半胱氨酸,考慮到兩個半胱氨酸可以被氧化生成一個胱氨酸,因此,有多個半胱氨酸的序列,ExPASy都給了兩個消光係數,一個是所有半胱氨酸都用於生成胱氨酸,一個是所有半胱氨酸都是還原形式,沒有生成任何胱氨酸。小夥伴們可以用計算器根據前面胺基酸組成的圖,按照這裡的公式計算一下消光係數和吸收度,看是否一致哦!
我為什麼詳細介紹消光係數的計算呢?因為很多小夥伴在蛋白實驗中會做突變分析,現在我們知道了,如果沒有消除或者新增色氨酸、酪氨酸以及半胱氨酸,一個蛋白的消光係數是不會發生變化的(吸收度會變化一點點,因為分子質量會有一點點變化,不過基本上不用考慮),那麼我們就不用重新計算消光係數了。
半衰期:半衰期用來衡量目的蛋白在體內的穩定性。蛋白質在細胞中處於動態平衡,在其合成之後,它的壽命基本上就已經決定了。也就是說,細胞這個傢伙為了保證自己的運轉正常,給大多數蛋白都設定了一個使用期限,防止超期限執行任務的蛋白因為老化而出錯,而衰老的蛋白會被回收利用或者消除(小師弟感受到了強烈的宿命論!!!)。
而決定這個使用期限(用半衰期表示)的,就是蛋白質自身N端的前幾個胺基酸序列。因此,這個ExPASy程序會把我們輸入序列的前幾個胺基酸當做N端序列計算這個蛋白質的半衰期,並且給出了在哺乳動物網織紅細胞、酵母和大腸桿菌這3種模式細胞中的半衰期。
文章中經常通過蛋白半衰期來研究泛素化-蛋白酶體途徑介導的蛋白降解
不穩定係數:不穩定係數用來衡量目的蛋白在體外的穩定性。不穩定係數基於之前研究者的發現,也即某些二肽在穩定蛋白和不穩定蛋白中的出現概論相差很大,因此,可以通過這些二肽的出現頻率來預測蛋白質在體外的穩定性。不穩定係數越小,表明此蛋白越穩定。在判別標準上,將不穩定係數小於40的蛋白判定為能夠穩定存在。結合小師弟多年純化蛋白的經驗(苦逼經歷),這項預測還是相對比較準確的。對於被預測為不穩定的蛋白,尤其是那些數值遠遠大於40的目的蛋白,小夥伴如果對其進行操作,一定要加快實驗進度哦,因為這些蛋白在4℃放個兩三天,就可能降解了哦!
脂肪係數:脂肪係數也可以用來衡量目的蛋白的穩定性。我們知道,蛋白質摺疊的一個主要驅動力就是疏水相互作用。而脂肪係數用丙氨酸、纈氨酸、亮氨酸、異亮氨酸這4個疏水胺基酸的出現頻次*相關權重並加和,得到了一個脂肪係數。脂肪係數越高,蛋白相對越穩定。
總平均親水性:用于衡量目的蛋白的總體平均親水性。通過將親水胺基酸賦正值,將疏水胺基酸賦負值,加和後除以胺基酸數目,得到總體的平均親疏水性。數值越大,親水性越強。實際上,對於多結構域蛋白此數值意義不是很大,因為蛋白分子中既有疏水結構域,也有親水結構域,兩者數值會相互抵消。GRAVY主要是結合局部親疏水性打分,獲得如下圖所示親疏水性打分圖,可以用來預測跨膜區(跨膜區相對於總體序列高度疏水,峰圖中間橫線就是代表總平均親水性)。
好了,內容就到這裡。第一次寫推文,可能有點過於詳細和囉嗦,大家多提點意見,以後小師弟我多多改進。
相關文章:
長按二維碼識別關注「小張聊科研」
關注後獲取《科研修煉手冊》1、2、3、4、5、6、7,8