本次為大家介紹的是德國慕尼黑工業大學Bernhard Kuster課題組於2020年4月在Nature Methods上發表的文章。本篇文章使用基於質譜的蛋白質組學方法系統地描繪了從古細菌到人類共13個物種中48000個蛋白的熱穩定性圖譜,其中涵蓋的變性溫度從30℃到90℃。文章研究發現,蛋白質的序列,組成及大小會影響原核生物的熱穩定性而真核蛋白的無序結構程度與其熱穩定性之間呈非線性關係。此外,數據顯示蛋白質複合物的進化保守性可以通過其相似的蛋白熱穩定性體現出來,並證明了基因組改變可影響熱變性。呼吸鏈中的多個蛋白質在許多物種中都非常穩定,人類線粒體在46℃時接近正常呼吸。同時本文也提到細胞類型特異性會影響蛋白穩定性和藥物效果。本篇文章描繪的圖譜廣泛定義了適合生物學和藥物發現中熱分析的蛋白質組,此圖譜數據可在以下網站供大家進行線上查看: http://www.proteomicsdb.org.和
http://meltomeatlas.proteomics.wzw.tum.de:5003/首先,作者利用質譜蛋白組學結合TMT-10 Plex定量技術高通量對13個物種繪製蛋白質組熱穩定性圖譜,其中6個是生活在4℃-70℃的原核生物(5種細菌,一種古細菌),七個真核生物(酵母、蠕蟲、魚類、果蠅、植物、小鼠、人類)。圖譜包含了大約48000個非冗餘蛋白的熔解曲線以及人種屬的14種細胞系、原代細胞、組織以及5種體液裡13000個蛋白的TPP數據。獲取蛋白熱穩定特性的具體方法如下,加熱細胞或裂解液後離心去除沉澱,將可溶性蛋白用胰蛋白酶酶解,多個特定加熱溫度組肽段分別用TMT試劑1:1標記後混合,利用離線液相系統分離肽段並收集各個時間洗脫出的組分,每個組分都用LC- MS/MS採集分析,最後對蛋白及肽段進行鑑定定量。值得注意的是,TPP得到的並不是單純的溫度依賴性蛋白結構展開,而是在細胞或裂解液中蛋白結構展開和蛋白沉澱的綜合結果。
如圖2a所示,不同物種間蛋白熔化溫度(Tm,蛋白至少50 %沉澱所需溫度)數值分布寬度相差甚遠,如斑馬魚(D. rerio)中各蛋白熔化溫度跨度僅有9℃而大腸桿菌(E. coli)中則有20℃。所有的真核生物在其最佳生長溫度(OGT,2a圖中用空心圓圈標出)和蛋白開始沉澱溫度(Tm分布左側)之間都存在明顯差距。與之相對比,幾乎所有的細菌OGT都接近Tm分布的左側,這些物種在稍微高於OGT的溫度生存困難甚至無法生存。僅南極油螺菌(O. antarctica)是一個特例,在自然棲息地中其生存溫度為2-4℃,但它也可以在1-25℃環境中生存,它的Tm分布峰值接近40℃,類似於秀麗隱杆線蟲C. elegans(OGT為20℃)。值得注意的是,這個數據表明地球上大多數蛋白質在至少30℃的溫度下是穩定的。大多數酶可以在比最佳溫度低得多的溫度下工作,甚至習慣冷環境的酶其最佳溫度也通常大於20℃,這可以證明這一點。
為了方便之後的分析,作者根據低Tm,中等Tm,高Tm,不熔(無Tm)區分蛋白從而定義了四種類型的熱穩定性。圖2b展示了熱穩定/熱不穩定特性的蛋白在不同物種或細胞類型之間的區別。黑腹果蠅(Drosophila melanogaster)中不熔的蛋白特別少,而嗜酸古菌(Picrophilus torridus)顯示出相當大比例的熱不穩定蛋白。由於嗜熱棲熱菌(Thermus thermophilus)的最佳生長達到70℃,因此其大部分蛋白質比大多數其他物種更加熱穩定,在秀麗隱杆線蟲(C. elegans)也觀察到了同一現象,目前尚不清楚其原因。人的體液則以不熔蛋白為主,作者將其歸因於其較高的溶解度,也可能是由於廣泛的糖基化。在此,作者指出TPP的局限性在於它無法測量蛋白質是否熱變性後仍可溶。
隨後,作者考察了影響蛋白質組熱穩定性的因素。一些酶如水生棲熱菌(Thermus aquaticus)中的DNA聚合酶有著非常高的熱穩定性,僅此一項就表明胺基酸序列和結構是熱穩定性的重要決定因素,同時也說明細胞內複雜的分子環境也有一定貢獻。為了補充以往的研究調查,在圖3a中以大腸桿菌(E. coli)(OGT 37℃)和嗜熱鏈球菌(T. thermophilus)(OTG 70℃)兩者為例,作者比較了細胞和裂解液中蛋白熱穩定性。兩個物種的蛋白Tm值中間值差異大於30℃,許多蛋白在細胞和裂解液中展現出差異,後者可能是由於裂解過程中膜的丟失,蛋白質複合物破壞,滲透調節劑的存在,蛋白質、輔因子或溶質的稀釋等原因。隨後,作者從這兩個物種單獨製備了裂解液,並在加熱前將它們等量混合。結果如圖3b,兩個物種間的Tm中間值與單獨的裂解液實驗獲得的值幾乎相同,證明了某個物種中的蛋白質的存在並不會影響另一物種的蛋白熔解行為。與圖3a相比,圖3b顯示的裂解液與細胞數據對比相關性更強,作者又設計了第三個實驗,在大腸桿菌中表達嗜熱鏈球菌的部分蛋白質,圖3c中觀察到兩個物種的蛋白Tm值也基本不受影響。以上說明了蛋白質序列/結構是蛋白熱穩定性的一個主要決定性因素,但細胞環境也具有重大影響。實際上,通過比較人細胞和裂解液的TPP實驗表明,許多蛋白在兩個體系中出現不同程度的差異,具體取決於蛋白在細胞中的定位。比如,圖3d中人體液中鑑定的細胞內蛋白質TPP數據表明蛋白質濃度也起著作用,對於展示的25個例子,很明顯有些蛋白相比於在細胞中,在體液裡加熱時可溶性更好,是因為這些蛋白的濃度非常低因此難以聚集,儘管體液中總蛋白濃度很高,但它們也不能與其他蛋白聚合在一起,因為後者通常不會在熱處理時沉澱。另一種可能性是在人母乳中存在抑制聚集的乳化劑如卵磷脂。作者發現了很多蛋白複合體中共聚集蛋白的例子,通過比較斑馬魚和人類中的Arp2/3複合物的TPP行為,如圖3e顯示蛋白質複合體即使絕對Tm值基本上不相同但蛋白複合體在組裝緊密度方面是保守的。作者對人,小鼠,斑馬魚,EcoCyc資料庫,大腸桿菌,酵母,黑腹果蠅更系統地分析,發現即使相差甚遠的物種間蛋白質複合物亞基的共編碼也具有保守性。
圖4結果與以往報導相符,即蛋白的長度和它們的熱穩定性間存在統計學意義上高度負相關關係。作者及其團隊發現幾乎所有數據都一致展現出這種關聯性,但這種關聯通常比較弱且效果小,因此,對於一個物種中的蛋白,Tm和蛋白長度的關係幾乎沒有預測價值。相反,如圖4b顯示,將平均蛋白長度和整個細菌物種的Tm平均值相關聯則有更清晰的關聯關係(Pearson r = −0.59,P = 0.22)和更大的效果(slope of −1.04)。儘管沒有統計學上的優勢,但是這很有趣,因為生成更大的蛋白質是細菌產生具有高級結構蛋白質的幾種方法之一,但是跨物種的數據表明,在較高溫度下生存生命必須以限制蛋白質大小為代價。與此相一致的是增加的緊密度和暴露於溶劑的環狀結構截短是使蛋白質極度熱穩定的因素之一。我們沒有發現與真核物種有這種關聯,它們都生活在適宜的環境溫度下。對於大腸桿菌,Leuenberger組已經提出蛋白豐度與熱穩定性間的關係,我們在大多數的數據中也都觀察到了相同的總體趨勢,且在不熔蛋白中更為明顯,圖4c展示的是小鼠骨髓源細胞的數據,但同樣,相關性較弱(pearson r=0.16)且效應很小(平均Tm斜率0.74),因此蛋白質豐度也並不能認為是熱穩定性的良好預測指標。接著,作者考慮了胺基酸的組成,並發現嗜熱鏈球菌蛋白的半胱氨酸比其他物種少很多,對於大多數其他胺基酸並未發現明顯的關聯,但按照某些特性分組時發現,嗜熱鏈球菌的蛋白質中極性胺基酸比例要比大腸桿菌中少很多(圖4d),相反,嗜熱鏈球菌蛋白有著更高的疏水性胺基酸比例(圖4e),這與以往的觀察結果一致,增強核心中疏水性相互作用可以使得結構更穩定。儘管細菌和真核生物之間在螺旋,環狀,鏈結構頻率有著明顯差異,即使OGT相差大於50℃,它們的相對比例也幾乎相同(圖4f)。值得注意的是,在真核生物的蛋白質中環狀和無序區域比原核生物更為普遍(圖4g)。因此,作者提出了人類蛋白質中無序程度是否可以作為熱穩定性的預測指標。以往研究中裂解液的數據表明,具有較大比例的無序區域蛋白質通常是熱不穩定的,並表現出與具有結構的蛋白相似的熔解行為,全細胞上人類蛋白質組TPP數據證實了這點。與此趨勢相反,不熔蛋白在無序區域富集程度最高(圖4h),展現出雙峰分布,GO(Gene ontology)分析結果表明,具有無序結構的不熔蛋白大多富集在具有跨膜結合域的蛋白質,具有細胞外結構域的蛋白質,糖基化蛋白,信號肽分泌蛋白以及具有二硫鍵的蛋白。以上這些都是這些蛋白在高溫下無法沉澱的原因,相反,熱穩定但高度無序蛋白集中富集在核蛋白和磷酸化蛋白。圖4i展示了包含tau的一組高度無序蛋白,幾乎完全無序但是是已知的具有耐熱性的蛋白。但相反的是,剪接體蛋白IK也是一種高度無序蛋白但其Tm值僅約47℃。因此,得出結論,無序程度和熱穩定性之間的關係遠比以往理解的更為複雜。
以上實驗表明,蛋白質熱穩定性很大程度上是取決於其一級序列編碼的固有特性,但是,這種特性在不同物種之間是進化保守性的嗎?蛋白質在進化過程中是否保持了其熱穩定性?為了驗證這個假設,作者隨後通過計算直系同源蛋白質不同物種間熱穩定性相關性。相關係數的層次聚類大致復原了分析物種之間已知的發育關係,其中細菌/古細菌和真核生物有兩個寬泛的聚類,真核生物亞簇主要遵循從酵母到哺乳動物,在小鼠和人類之間觀察到相關性最高(r=0.62),這是由於兩個物種間進化距離較小,這些發現表明,蛋白質的熱穩定性至少是部分保守的,但是隨著序列以及環境壓力的不同而不斷變化。
接著,作者描繪了人類不同類型細胞的熱穩定圖譜,其中包括3種原代細胞,結腸癌球狀細胞以及十種常用細胞系(K562,A549,HEK293,Jurkat,U937,HepG2,HEK293T,HL6,HaCaT,HAOEC)。作者在至少三種不同類型細胞中檢測了7278個可估算Tm的蛋白,並觀察到有一簇蛋白展現了細胞類型特異性熔解特性,進一步發現一些細胞類型特異性去穩定蛋白的基因型有所改變(圖5a)。此外,與原先結果一致,作者觀察到在K562細胞中BCR和ABL1蛋白有著較低的熱穩定性,兩者融合產生功能,該融合蛋白在患有慢性粒細胞白血病的原代細胞中也具有高度不穩定性。作者同樣發現,與其他細胞相比,以上兩種細胞中亨廷頓舞蹈病(HTT)蛋白非常不穩定且豐度降低。HTT最近被發現在K562細胞中具有破壞性的框內插入,一種可能的推測是這種插入改變降低了穩定性和豐度。同樣的,研究發現泛素羧基末端水解酶15(USP15)在Jurkat細胞中出現特異性且高度去穩定化,同時觀察到此蛋白中多個單核苷酸突變和缺失。微管蛋白酪氨酸連接酶蛋白12(TTLL12)在K562細胞中輕度去穩定化,有報導在此細胞系中其存在單個核苷酸突變。儘管作者和他人都曾報導過熱穩定性通常和蛋白質降解率不相關,但這次的觀察結果也對推測特定蛋白序列的微小結構也會破壞穩定性提供了一些證據,並且此類事件的積累或更大的基因損傷都可能對蛋白熱穩定性產生不利影響。
而研究發現細胞類型特異性穩定蛋白通常參與高度活躍的細胞過程(圖5b)。比如,Jurkat和原代細胞中高度特異性穩定的穀氨醯胺酶,可以被ADP激活將穀氨醯胺轉化成穀氨酸,這可能反映了T細胞內增強的穀氨醯胺代謝是穀胱甘肽合成必需的。同時還觀察到糖酵解通路(而不是檸檬酸循環)中的蛋白相比於原代細胞在癌細胞中更加穩定,可能是結合糖酵解代謝物後更為穩定。線粒體熱休克蛋白HSPD1在結腸癌球狀細胞中更加穩定,有一種猜測是高負荷運載的HSP可能更加穩定,也與以往報導中伴侶蛋白活躍時更加熱穩定的結論一致。
研究還發現CDK激活激酶(CAK)複合物的所有成員(CDK7,CCNH,MNAT1)在K562細胞中有著更高的熱穩定性,而在Jurkat細胞中則較小的熱穩定性(圖5b)。該複合物活性是受磷酸化調節,並與T細胞急性淋巴細胞白血病的轉錄成癮有關。一個可能的猜想是複合物的高度熱穩定性是高活性的原因,因此反映出細胞對其驅動轉錄活性的高依賴性。根據這個猜測,作者還觀察到RNA聚合酶II(ROL2RA)的大亞基在各個細胞類型中呈現出與CAK複合相似的熔解特性(圖5b)。此前已有研究證明POLR2A活性與熱穩定性有關。由於該複合物的催化活性是由CDK7決定的,因此推測具有較高熱穩定性CAK複合物的細胞系應該對CDK7抑制劑更為敏感。事實上,如圖5c所示,CDK7的熔解曲線與報導的共價CDK7抑制劑THZ1抗增殖活性IC50值在多個細胞類型中呈現良好的相關性(R2=0.8),這表明藥物可能對其他白血病如慢性/急性髓細胞性白血病也有效果。儘管此處未進行研究,但也許TPP可以擴展到蛋白翻譯後修飾分析如磷酸化,乙醯化,糖基化等領域應用。
緊接著,作者分析線粒體呼吸鏈中蛋白的熱穩定性。此前有報導認為人體細胞中的線粒體在生理上可維持接近50℃的溫度,並且某些酶如複合物II,III,IV在46-50℃中具有最大活性。事實上,儘管線粒體蛋白基本上沒有比其他蛋白更穩定,但呼吸鏈的組成蛋白卻展現出更高的Tm值,特別是在原代T細胞中(圖6a)。作者在完整和通透處理過的HEK293細胞中測量了不同溫度下呼吸速率。完整細胞的呼吸速率依賴於功能性上遊糖酵解酶,在高於42℃時迅速下降,相反,通透處理過的細胞在外部供應呼吸鏈底物情況下,在46℃時具有接近正常的呼吸速率(圖6b),實驗結果驗證了猜測,呼吸鏈蛋白可能通過提高熱穩定性來適應更高的局部溫度。
之後,作者將繪製的圖譜嘗試用於藥物靶標發現,因為此前TPP已被證明過可以有效的鑑定藥物靶標,評估藥物-靶標在細胞中的參與情況,本次的研究對該領域的貢獻在於,它廣泛地定義了適合用於TPP藥物譜圖實驗的蛋白質組(圖6c)。基於細胞體系的TPP實驗中存在671個人類藥物靶標,1265個潛在藥物靶標和2242個疾病相關蛋白,其中分別有56,103,132個蛋白無法檢測Tm值,而基於裂解液體系中則存在285個人類藥物靶標,872個潛在藥物靶標和1357個疾病相關蛋白,其中59,108,365個無法檢測到Tm值。其中一些的蛋白目前為止無法預測某種蛋白會表現出藥物誘導的穩定/去穩定作用以及其強度如何。隨著技術的進步,比如說完整的膜蛋白提取流程,將來適合TPP分析的蛋白數量可能會繼續增加,本篇文章繪製的圖譜提供了很多蛋白的熔解特性,可以幫助採用蛋白質印跡法或質譜法對藥物-靶標結合的分析。
作者最後舉了幾個例子,先考察了賴氨酸特異性組蛋白去甲基酶1A(KDM1A)與反苯環丙胺(Tranylcypromine)的相互作用,此藥是用於抑制單胺氧化酶A和B從而治療抑鬱症,同時也可以共價結合KDM1A從而抑制KDM1A。幾種人細胞中的TPP數據(圖6d)顯示Tm值介於48℃(K562)-52℃(肝細胞)。在THP1細胞中進行二維TPP實驗(圖6e),溫度較低時(44℃),蛋白尚未完全熔解,很難測量穩定作用,溫度過高(60℃),則幾乎所有蛋白已經沉澱,因此測量相互作用也會受到影響。TPP實驗的溫度選擇最好能在蛋白的Tm溫度下進行,以最大程度發揮可測量作用(52℃)。第二個例子是研究大腸桿菌中甲氧苄啶靶標(圖6f)。在存在/不存在甲氧苄啶的情況下,蛋白FolA(二氫葉酸還原酶)的熔解曲線存在4℃差異。此處作者強調,通常需要多次重複藥物-TPP實驗才能解釋Tm值的細微變化。本文的圖譜價值在於為TPP實驗選擇合適的研究對象蛋白以及其合適的溫度範圍提供了可靠指導。
本篇文章匯總了來自生命樹不同部分的13種生物物種的蛋白質組熱穩定性圖譜,發現蛋白質的熱穩定性不僅與生物賴以生存的最佳生長溫度相關,還與特定的生理病理分子環境有關,對於人類細胞系,蛋白熱穩定性差異反映了生物過程活性的差異,呼吸鏈中一些蛋白可通過提高熱穩定性來適應更高的局部溫度。TPP方法在靶標發現領域具有重大意義,本篇文章中報導的TPP數據可供科研人員更好的用於藥物發現,蛋白質基因組以及基礎生物研究。
全文連結:http://dx.doi.org/10.1038/s41592-020-0801-4(或點左下閱讀原文)