這是一篇純技術的文章。我寫它的原因,是發現自己無論如何也搞不清所有的胺基酸,但在研究蛋白結構時,不能根據結構式反應出對應的胺基酸會帶來很多不便。這篇圖鑑收集了20種胺基酸的基本信息和常見用途,希望能通過拉近和它們的距離,更方便地記住它們。
形而上地說,一個胺基酸就是一個同時包含了羧基和胺基的分子。所有生物的蛋白質水解出的胺基酸都是L-α-胺基酸,也就是它們的胺基都位於α碳上,並且α碳的手性呈L構型。可以這樣表示所有的L-α-胺基酸:
在之後的結構式中,我們不會特別註明α碳的手性,但會把主鏈用灰色弱化。如果把結構式轉寫成化學式,則為H2N-CH(-R)-COOH,或R-C2H4O2N。
每種胺基酸都有一個三字母縮寫和一個單字母縮寫。三字母縮寫往往取英語名的前三個字母,特例:色氨酸Tryptophan-Trp;異亮氨酸Isoleucine-Ile;天冬醯胺Asparagine,穀氨醯胺Glutamine-Asn, Gln。至於單字母縮寫,則在安排時遵循一定順序。
獨佔一種首字母的胺基酸,直接用首字母命名:半胱氨酸Cysteine-C;組氨酸Histidine-H;異亮氨酸Isoleucine-I;甲硫氨酸Methionine-M;絲氨酸Serine-S;纈氨酸Valine-V。
首字母重複的,出現頻率高的優先用首字母命名:丙氨酸Alanine-A;甘氨酸Glycine-G;亮氨酸Leucine-L;脯氨酸Proline-P;蘇氨酸Threonine-T。
剩下的,儘量用能聯想到讀音的字母:精氨酸Arginine-R;苯丙氨酸Phenylalanine-F;酪氨酸Tyrosine-Y;色氨酸Tryptophan-W。
再後面,就隨意安排剩下的字母:天冬氨酸Aspartic acid-D;穀氨酸Glutamic acid-E;天冬醯胺Asparagine-N;穀氨醯胺Glutamine-Q;賴氨酸Lysine-K。
最後發現的兩種基本胺基酸,撈走了剩下的可用的字母:吡咯賴氨酸Pyrrolysine-O;硒代半胱氨酸Selenocysteine-U。
B表示天冬氨酸/天冬醯胺族、Z表示穀氨酸/穀氨醯胺族,X按習慣表示任意胺基酸。這樣,只剩J從未使用了。
如果要做胺基酸序列檢索(常用的比如BLAST算法),那麼序列往往就是用這25個字母表示的。
這篇文章中,我們把20種DNA鹼基所編碼的胺基酸,按它們側鏈的化學性質,分成了4類:
疏水胺基酸,8種;
疏水胺基酸的側鏈是非極性的,大部分是烴基或芳香基;鹼性胺基酸的側鏈含有鹼性的胺基,因此在水溶液中容易吸引氫離子從而帶正電;酸性胺基酸的側鏈含有酸性的羧基,因此在水溶液中容易給出氫離子從而帶負電。中性、鹼性和酸性胺基酸又合稱親水胺基酸,或極性胺基酸。
在每一類下,胺基酸首先按照側鏈的官能團種類分類,然後按照相對分子質量遞增排列。
疏水胺基酸
丙氨酸 Alanine
縮寫:Ala (A)
取代基:甲基 -CH3
蛋白質內的疏水胺基酸,基本都在疏水核心中抱團,也不會形成氫鍵,因此沒什麼存在感。丙氨酸又是其中最穩定,最簡單的一個,側鏈僅有一個甲基,因此它很容易作為反應副產品在生物體內產生——比如在肌肉中排除游離氨的丙氨酸-葡萄糖循環,就是由丙酮酸經轉氨作用生成丙氨酸,從而被安全排出肌肉進入血液,再在肝臟中脫氨,合成葡萄糖。
纈氨酸 Valine
縮寫:Val (V)
取代基:異丙基 -CH(-CH3)-CH3
把丙氨酸的甲基上再插兩個甲基,就變成了纈氨酸。它的命名來自纈草酸,後者是正戊酸,纈氨酸的系統命名則是2-胺基-異戊酸。
亮氨酸 Leucine
縮寫:Leu (L)
取代基:異丁基 -CH2-CH(-CH3)-CH3
亮氨酸比纈氨酸長一個甲基的長度。它的命名來自它閃亮的晶體。
異亮氨酸 Isoleucine
縮寫:Ile (I)
取代基:仲丁基 -CH(-CH3)-CH2-CH3
把亮氨酸的甲基從β碳挪到α碳,就變成了異亮氨酸。
纈氨酸、亮氨酸、異亮氨酸合稱支鏈胺基酸 (Branched-chain amino acid, BCAA)。支鏈胺基酸是骨骼肌的主要構成部分,也是一種健身補劑,對肌肉合成、減輕運動疲勞有一定作用。
脯氨酸 Proline
縮寫:Pro (P)
取代基:吡咯烷(經環化) -C3H6
脯氨酸是胺基酸中唯一一種仲胺,也就是R2NH,而不是RNH2。可以把它看作是先連一個丙基,然後環化形成的吡咯烷。
由於氮原子被環鎖死,因此它在蛋白中成的C-N鍵不能隨意旋轉,而是被固定在一個二面角。這使得它成為典型的α螺旋破壞者,往往出現在螺旋的最末端。就像這個meme所說的:
它旁邊的甘氨酸同樣是α螺旋破壞者,在之後會提到。
連續的脯氨酸和羥基脯氨酸組成的蛋白有剛性的結構,因此這樣形成的二級結構非常穩定,是膠原蛋白中的主要結構。
苯丙氨酸 Phenylalanine
縮寫:Phe (F)
取代基:苯甲基 -CH2-C6H5
在丙氨酸上加一個苯基,就變成了苯丙氨酸。它最著名的用處應該是合成天門冬醯苯丙氨酸甲酯,也就是阿斯巴甜。
人體把苯丙氨酸代謝成酪氨酸,如果缺少相關的酶,就無法代謝苯丙氨酸。苯丙氨酸堆積,並通過尿液排出,就會形成苯丙酮尿症 (Phenylketouria, PKU)。因此苯丙酮尿症患者忌食阿斯巴甜。苯丙酮尿症是新生兒篩查中最重要的一項。
色氨酸 Tryptophan
縮寫:Trp (W)
取代基:吲哚基甲基 -CH2-C8H6N
在丙氨酸上加一個吲哚基,就變成了色氨酸。它的命名可能來自於它在280nm的強烈吸收峰,要比另外兩種芳香胺基酸:苯丙氨酸和酪氨酸高得多。(記得在天然 GFP 中的大設計中提到過,共軛體系越大,吸收峰的波長就越長,但這幾個的共軛體系都沒有大到吸收峰位於可見光區域。)
它最重要的用處是在人體內作為血清素,也就是5-羥色胺的前體。血清素是一種神經抑制劑,能調節睡眠與情緒,血清素水平不足是抑鬱症一大病因。
甲硫氨酸 Methionine
縮寫:Met (M)
取代基:2-甲硫基乙基 -CH2-CH2-S-CH3
雞蛋蛋白中很常見的胺基酸。我有一段記憶:在某次胡搞的化學實驗中,我們將蛋清溶解後,向剩下的膠狀不溶物中加入稀鹽酸,產生了濃鬱的臭雞蛋味。這大概率就是甲硫氨酸的分解產生的硫化氫。
甲硫氨酸的密碼子是AUG,這同時也是轉錄的啟動子,因此在許多未經過修飾的蛋白中,氮端第一個胺基酸就是甲硫氨酸。(比如野生型綠色螢光蛋白)
在硫上再連一個腺苷,就變成了S-腺苷甲硫氨酸 (SAM)。這是一種甲基供體,在人體內用於許多甲基轉移反應。SAM可以作為膳食補品買到,功能包括保護肝臟、治療關節炎等。
中性胺基酸
甘氨酸 Glycine
縮寫:Gly (G)
取代基:氫 -H
最簡單的胺基酸,也是唯一一種沒有手性的胺基酸(因為兩邊都是氫原子,沒有不對稱中心)。有些分類會把它歸進疏水胺基酸,但一個氫原子到底是疏水基還是親水基也不好說,因此只能根據整個分子的性質,把它歸進親水胺基酸。它的命名來自於它的甜味,甜度可以和蔗糖相媲美。但作為食品添加劑,甘氨酸的用量被嚴格限制,因為過多攝入甘氨酸會影響其他胺基酸攝取。
相比同樣簡單的丙氨酸,甘氨酸實在太自由了,可以隨意轉動,因此反而會破壞很多二級結構的穩定性,比如α-螺旋。但因為它位阻最小,因此形成許多特殊結構時,需要在末端有一個不佔空間的甘氨酸,比如在天然 GFP 中的大設計中提到的生色團,就需要一個不礙事的Gly67。同理,在膠原蛋白中,需要每隔兩個胺基酸(通常是脯氨酸)就有一個甘氨酸,因為沒有別的胺基酸能擠在由脯氨酸形成的狹小鍵角中。
甘氨酸也是除了γ-氨基丁酸 (GABA) 以外另一種重要的抑制作用神經遞質,有心情舒緩的作用。
絲氨酸 Serine
縮寫:Ser (S)
取代基:羥甲基 -CH2-OH
在丙氨酸上加一個羥基,就得到了絲氨酸。它最早在蠶絲蛋白中發現,因此得名。
蘇氨酸 Threonine
縮寫:Thr (T)
取代基:1-羥基乙基 -CH(-OH)-CH2
蘇氨酸比絲氨酸又多了一個甲基。它的結構和蘇阿糖類似,因此得名。蘇阿糖把胺基變成了羥基,羧基上的羥基被挪到了另一端的甲基上。
絲氨酸和蘇氨酸都是帶有羥基的胺基酸,因此它們是常見的氫鍵給體和受體,也容易和有機磷、糖鏈等結合。大部分蛋白激酶的磷酸化位點都是絲氨酸或蘇氨酸,許多神經毒氣也通過和絲氨酸、蘇氨酸強結合,阻止神經遞質的正常工作。
半胱氨酸 Cysteine
縮寫:Cys (C)
取代基:巰甲基 -CH2-SH
在丙氨酸上加一個巰基,就得到了半胱氨酸。也可以把它看作硫代絲氨酸——如果再用硒取代硫,就叫做硒代半胱氨酸,這也是一種基本胺基酸,但在人體內含量極少。人們最早從膀胱結石中分離出胱氨酸,把它沿雙硫鍵切成兩半後,就變成了半胱氨酸。
它最廣為人知的作用是在蛋白中形成雙硫橋鍵。這是二級結構中唯一一種共價的作用力,相比其他主要靠氫鍵等次級鍵形成的結構,要牢固不少。
由於巰基的還原作用,它是一種不錯的抗氧化劑,可以添加在果汁中防止變色。(實驗室中的抗氧化劑是巰基乙醇,也是一樣的原理。)
酪氨酸 Tyrosine
縮寫:Tyr (Y)
取代基:對羥基苯甲基 -CH2-C6H4-OH
它最早從乳酪中分離出來,因此得名。比起苯丙氨酸,它在對位上多了一個酚羥基。因此它和絲氨酸、蘇氨酸功能類似,也是氫鍵的給體受體,同時也能被蛋白激酶作用。
有一類細胞受體,叫做受體酪氨酸激酶 (Receptor Tyrosine Kinase, RTK),是除了G蛋白偶聯受體以外最重要的受體,它便是通過細胞膜內側的酪氨酸被磷酸化來傳遞信息。
天冬醯胺 Asparagine
縮寫:Asn (N)
取代基:胺基甲醯甲基 -CH2-CONH2
把天冬氨酸的羧羥基換成胺基,即為天冬醯胺。
天冬醯胺可以用醯胺基和糖鏈的半縮醛羥基成N-糖苷鍵,因此是糖蛋白中的常見胺基酸。另一種常見的成鍵位點是絲氨酸、蘇氨酸等含羥基的胺基酸所成的O-糖苷鍵。
穀氨醯胺 Glutamine
縮寫:Gln (Q)
取代基:胺基甲醯乙基 -CH2-CH2-CONH2
把穀氨酸的羧羥基換成胺基,即為穀氨醯胺。
穀氨醯胺是人體內含量最高的游離胺基酸,因為它起到了轉運氨的作用。同時,人體內的許多胺基酸都從它們對應的酮經過胺化而來,而穀氨醯胺就是其中的氨基給體。穀氨醯胺還能用於合成嘧啶和嘌呤,因此它是蛋白和核酸合成的重要原料,決定了細胞的生長繁殖。現在的抗癌研究方向之一就是控制穀氨醯胺的活性,阻斷癌細胞的增殖。
鹼性胺基酸
賴氨酸 Lysine
縮寫:Lys (K)
取代基:4-胺基丁基 -CH2-CH2-CH2-CH2-NH2
它的側鏈有四個碳和一個胺基,是手最長、最靈活的胺基酸。
賴氨酸廣泛用於蛋白構築,因為它本身就具有兩親性質,胺基親水而長長的烴鏈疏水。因此,它可以用於構築膜蛋白,在許多蛋白靠近表面的地方都可以找到賴氨酸。
賴氨酸可以固定很多二級結構,提高結構蛋白的強度。比如膠原蛋白的三股螺旋就需要賴氨酸交聯,細菌胞壁也含有賴氨酸。
賴氨酸末端的胺基可以和羧基形成共價鍵,將硫辛酸等小分子固定在蛋白質上。在丙酮酸脫氫酶、酮戊二酸脫氫酶之類三羧酸循環涉及的酶中,正是這種硫辛醯胺複合體負責搬運醯基和甲胺等中間產物。
組氨酸 Histidine
縮寫:His (H)
取代基:咪唑基甲基 -CH2-C3H5N2
在丙氨酸上加一個咪唑基,就得到了組氨酸。組氨酸的鹼性不強,接受給出質子的速度都極快,因此常被用於質子傳遞鏈,也能在酶的活性中心起酸鹼催化作用。
組氨酸脫羧後得到組胺,這是一種血管擴張劑,可以緩解心絞痛,在炎症反應中也會被釋放。
蛋白結構解析中,有一種常見的技術,是在設計蛋白時,添加由幾個組氨酸組成的His-tag。由於咪唑基的配位作用,這樣的蛋白可以和鎳柱中的鎳離子鰲合,從而被分離出來,然後再用大劑量咪唑溶液洗脫,即得較純的目標蛋白溶液。
精氨酸 Arginine
縮寫:Arg (R)
取代基:3-胍基丙基 -CH2-CH2-CH2-NH-C(=NH)-NH2
精氨酸的側鏈結構是一個三個碳的碳鏈再安一個胍基。它的命名來自魚精蛋白,同時它也是精子蛋白的主要成分。
胍基的鹼性很強(因為電荷可以在三個胺基/亞胺基之間共振分散),精氨酸的鹼性也是所有胺基酸裡最強的,基本始終處於正離子狀態。因此,它在胺基酸中,可以通過自己的正電,穩定相鄰胺基酸的負電。
酸性胺基酸
天冬氨酸 Aspartic acid
縮寫:Asp (D)
取代基:乙羧基 -CH2-COOH
在丙氨酸上加一個羧基,就得到天冬氨酸。它的命名來自天門冬,一種草類植物。
它是鳥氨酸循環的原料之一,因此和同為原料的精氨酸一樣,可以促進尿素生成,用於治療氨中毒。
聚天冬氨酸是一種不錯的天然可降解螯合劑。在農業、水處理、金屬保護等方面都有用處,還可以作為綠色洗滌劑。
穀氨酸 Glutamic acid
縮寫:Glu (E)
取代基:丙羧基 -CH2-CH2-COOH
穀氨酸比天冬氨酸長一個甲基的長度。它的命名來自於谷蛋白。
它的鈉鹽因為被作為味精而廣為人知。在高溫下,穀氨酸離子脫水生成焦穀氨酸,使得味精變得苦澀,因此味精不能經受高溫。這個脫水反應會使得側鏈的羧基和主鏈的胺基成環,因此在肽鏈中,可以封閉氮端。
穀氨酸是非常重要的興奮性神經遞質,可以刺激學習、記憶,NMDA、AMPA受體都是通過穀氨酸工作的。
穀氨酸和天冬氨酸都常出現在蛋白的負電中心。鐮狀細胞貧血就是血紅蛋白中的一個穀氨酸突變成了非極性的纈氨酸,從而影響了它的二級結構,使血紅蛋白容易在低氧環境下發生多聚,從而成鏈。
如果把這20種胺基酸塞進一張圖鑑裡:
按單字母縮寫順序排列:
最後一提:20種胺基酸中,有8種人體不能合成而必須從外部攝取,它們被稱為「必需胺基酸」:纈氨酸、亮氨酸、異亮氨酸、苯丙氨酸、色氨酸、甲硫氨酸、蘇氨酸、賴氨酸。
另外,半胱氨酸、酪氨酸分別由甲硫氨酸、苯丙氨酸直接合成,後者則是必需胺基酸,因此前者稱為半必需胺基酸。還有,組氨酸嬰幼兒不能正常合成。
剩下9種胺基酸,丙氨酸來自糖酵解產生的丙酮酸的胺化,絲氨酸來自同一路徑產生的3-磷酸甘油酸的氧化、胺化、水解,甘氨酸來自絲氨酸脫去側鏈,也可以在肝臟中直接由二氧化碳和游離氨合成,天冬氨酸、天冬醯胺來自三羧酸循環中草醯乙酸的胺化,穀氨酸、穀氨醯胺來自同一循環中的2-氧戊二酸的胺化,精氨酸來自小腸中由穀氨酸和穀氨醯胺合成的瓜氨酸的胺化,脯氨酸來自穀氨酸半醛的環化、還原。
下次,當你聽到「色氨酸」、「半胱氨酸」等名字時,希望能對它們有點感覺。