經常聽到有人問類似這樣的問題,人類能夠上天入地,為什麼不能製造一個細胞,或者製造一粒米呢?其實答案很簡單,從某種程度上來說,一個細胞的複雜程度,要遠比人類文明現有的所有機器的複雜程度,還要複雜很多。
我們人類的一切活動,絕大多數都和蛋白質有關。你的眼睛能夠看見東西,是因為有視覺蛋白Opsin的存在;你的鼻子能夠聞到味道,是因為有嗅覺蛋白Olfactory-type G protein的存在;你的舌頭能夠嘗到味道,是因為有味覺蛋白的存在;你的耳朵能夠聽見聲音,是因為有聽覺蛋白的存在。心臟能夠跳動、肌肉能夠運動,這也都是蛋白質的功勞。你的消化系統,循環系統,都和蛋白質的活動有關。你的工作、學習和生活,甚至愛情,一切都與蛋白有關。
從某種程度上來說,人就是一部複雜的機器,從外部獲得蛋白質,分解蛋白質,然後再組裝成自己的蛋白,由蛋白質構成的微型機器不斷的運轉這樣一個過程。所以你攝入的營養,蛋白質是不可缺少的。
隨著沃森和克裡克的工作,科學家發現了遺傳物質DNA和中心法則。最簡單的中心法則就是遺傳信息從DNA傳遞給RNA,再從RNA傳遞給蛋白質,即完成遺傳信息的轉錄和翻譯的過程。也可以從DNA傳遞給DNA,即完成DNA的複製過程。這是所有的有細胞結構的生物所遵循的法則。人類也是由細胞組成的多細胞生物。
通過人類基因組計劃HGP,截止到2003年4月14日,人類基因組計劃的測序工作已經完成。除了人類之外,還包括對五種生物基因組的研究:大腸桿菌、酵母、線蟲、果蠅和小鼠,稱之為人類的五種「模式生物」。HGP測出人類基因組DNA的30億個鹼基對的序列,發現了所有人類基因,找出它們在染色體上的位置,破譯人類全部遺傳信息。
科學家們已經清楚地了解到,從DNA轉錄為RNA,從RNA的密碼子,通過翻譯過程產生蛋白質的胺基酸系列,也都基本搞清楚了。蛋白質就是多個胺基酸組成的多肽鏈經過盤曲摺疊形成的具有一定空間結構的物質。而常見的胺基酸只有二十種。多肽鏈經過摺疊之後就變成了一個一個的微型分子機械,也就是蛋白質分子,每一個蛋白質分子都有獨特的作用,正是由這些蛋白質分子摺疊成的機器,才有了人的各種生命活動。我們人體裡面到底有多少種蛋白質微型機器呢?據科學家估計有10萬種之多。
據說人類文明發展到現在,世界上所有的機器加在一起,從數量上也就跟你的小手指裡面的蛋白質分子機器總數差不多。神奇吧?更神奇的是,這10萬多種蛋白質,只是20種零件的積木式組合。就用這20種積木零件,能做成所有你見過的人類文明發明的機器!而且更為高效、無汙染。有好多科學家把中心法則跟《易經》關聯起來,還有一本著名的書《DNA與易經》。如果用一句IT術語來講,蛋白質把模塊化做到了極致。
問題來了,到底是怎麼從一條多肽鏈經過摺疊變成一個分子機器的,科學家們全部都茫然了。如果你能夠破解這個過程,下一個諾貝爾獎就會等著你。
蛋白質摺疊
蛋白質是以胺基酸為基本單位構成的生物高分子。蛋白質分子上胺基酸的序列和由此形成的立體結構構成了蛋白質結構的多樣性。蛋白質具有一級、二級、三級、四級結構,蛋白質分子的結構決定了它的功能。
一級結構(Primary Structure):胺基酸殘基在蛋白質肽鏈中的排列順序稱為蛋白質的一級結構,每種蛋白質都有唯一而確切的胺基酸序列。搞IT的,可以理解為帶裝配次序的單層BOM。
二級結構(Secondary Structure):蛋白質分子中肽鏈並非直鏈狀,而是按一定的規律捲曲(如α-螺旋結構)或摺疊(如β-摺疊結構)形成特定的空間結構,這是蛋白質的二級結構。在飄帶圖裡面,α-螺旋結構就是看起來像彈簧的飄帶,β-摺疊結構就用一個寬箭頭來表示。
三級結構(Tertiary Structure):在二級結構的基礎上,肽鏈還按照一定的空間結構進一步形成更複雜的三級結構。以肌紅蛋白、血紅蛋白為例,正是通過三級結構使其表面的空穴恰好容納一個血紅素分子。
四級結構(Quaternary Structure):具有三級結構的多肽鏈按一定空間排列方式結合在一起形成的聚集體結構稱為蛋白質的四級結構。這個主要是做更複雜的機器的時候要用到。
蛋白質的結構已經很神奇了,但蛋白質的結構只是結果,而從多肽鏈到蛋白質的摺疊過程就更神奇了。蛋白質摺疊問題被列為「21世紀的生物物理學」的重要課題,它是分子生物學中心法則尚未解決的一個重大生物學問題。你想不想試試?
蛋白質摺疊遊戲
由華盛頓大學醫學院蛋白質設計研究所(Institute for Protein Design)主導,一群研究者們將他們的畢生所學做成了一個電腦遊戲——Foldit。這款遊戲的開發者們最初的希望是鼓勵更多的人通過參與遊戲的方式來參與合成蛋白質的研究。
Foldit 更新了新玩法,如今大眾也可以幫助蛋白質研究人員創造新的疫苗、設計新的癌症治療法了,這些玩家被稱為「公民科學家」(citizen scientists)。
我也下載了這個遊戲,變成了一個「公民科學家(民間科學愛好者,簡稱民科)」。《Foldit》的57000名參與者提供了有用的結果,也登上了2010年科學雜誌《自然》雜誌。科學家們一直研究愛滋病的逆轉錄酶,已有十五年之久,這種蛋白質酶是愛滋病毒在活體細胞中複製和繁殖自己的重要關鍵,但在遊戲中逆轉錄酶的結構在十天內玩家們破解。
蛋白質的錯誤摺疊
蛋白質分子的胺基酸序列不發生改變,只是其結構或者說構象有所改變也能引起疾病,稱為「構象病」,或稱「摺疊病」。
摺疊病竟然能夠傳染!這種能傳染的錯誤摺疊蛋白質,被稱為朊毒體。人被真菌感染了,用抗真菌藥物;被細菌感染了,用抗生素;被病毒感染了,用抗病毒藥物。被朊毒體感染了,你就徹底沒救了。
最早發現的朊毒體感染是羊瘙癢症:患病的綿羊和小山羊奇癢難熬,常在粗糙的樹幹和石頭表面不停摩擦,以致身上的毛都被磨脫。羊會興奮、喪失協調性、站立不穩、瘙癢、癱瘓直至死亡。
1996年春天英國蔓延的「狂牛症」,它不僅引起英國一場空前的經濟和政治動蕩,而且也波及了整個歐洲。2019年,一種被稱為「殭屍鹿病毒」的致命性朊毒體疾病席捲美國和加拿大的24個州。
其它的蛋白質摺疊異常還有老年性痴呆症、囊性纖維病變、家族性高膽固醇症、家族性澱粉樣蛋白症、某些腫瘤、白內障等等。
人工智慧來幫忙
谷歌一直想用人工智慧來預測蛋白質空間結構,在AlphaGo打敗李世石之後, 柯潔被AlphaGo打哭,絕望到渾身顫抖。後來谷歌就打造了AlphaFold,建立在數十年來使用大型基因組數據集預測蛋白質結構的研究的基礎上,召集結構生物學,物理學和機器學習領域的專家,共同運用前沿技術僅根據遺傳序列來預測蛋白質的3D結構。AlphaFold生成的蛋白質的3D模型比以前的任何一種都要精確得多,這標誌著生物學的一項核心挑戰取得了重大進展。
圖:DeepMind從蛋白質序列預測結構的ALPHAFOLD系統的結構示意圖。《自然》雜誌。
不愧是谷歌,這麼牛的程序,代碼開源,都可以下載。你還等啥?不搶諾貝爾獎啦?
編輯:《升華洞察》馮升華