圖片來源:K. Krause and J. Krzysztofiak/Nature
Peter Kerpedjiev需要一堂關於基因學的速成課。作為一名接受過一些生物信息學培訓的軟體工程師,Kerpedjiev正在攻讀博士學位,並且認為這真的有助於他了解一些生物學基礎知識。「如果我想和某人開展一場智慧的對話,我需要了解哪些基因呢?」Kerpedjiev思索道。
他直奔這些數據而去。多年來,美國國家醫學圖書館(NLM)一直系統性地為其頗受歡迎的PubMed資料庫中的幾乎每篇文章加上標籤。這些標籤含有一些關於每個基因起什麼作用的信息。Kerpedjiev提取了所有描述某個基因或者該基因編碼蛋白的結構、功能或者位置的文章。
通過整理記錄,他列出了一個始終被研究得最多的基因榜單——有點像人類基因組「熱門點擊」的意味。
Kerpedjiev發現,在榜單上打頭的是一個名為TP53的基因。3年前,當他第一次開展此項分析時,研究人員在約6600篇論文中仔細分析了該基因或者其產生的蛋白p53。今天,這一數字已達到8500左右並且還在增長。平均而言,在每天發表的論文中約有兩篇描述TP53基礎生物學的最新細節。
TP53的受歡迎程度對於大多數生物學家來說不應當成為新聞。這是一種腫瘤抑制基因,也是廣為人知的「基因組衛士」。它會在約一半的人類癌症中發生突變。「這解釋了它的持久力。」約翰斯·霍普金斯大學醫學院癌症基因學家Bert Vogelstein表示,在癌症中,「沒有哪個基因比TP53更重要了」。
不過,還有一些高居榜首的基因就很少有人知道了,包括在基因研究的既往年代異軍突起但隨著技術進步開始過時的基因。「這個榜單令人感到驚奇。」目前在哈佛醫學院從事基因組數據可視化博士後研究的Kerpedjiev表示,「一些基因是可預測的,但有些完全出乎意料。」
《自然》雜誌同Kerpedjiev合作,分析了一直被研究最多的基因。此項工作提供的不僅僅是對話開場白:它闡明了生物醫學研究中的重要趨勢,並且揭示了關於特定疾病或者公共衛生問題的關切如何改變研究重點。它還揭示了一些基因——很多跨越學科和疾病領域——是如何主導研究的。
成為全球愛滋病病毒研究焦點
即便在1983年發現愛滋病病毒(HIV)是愛滋病的起因前,諸如David Klatzmann等臨床免疫學家便注意到愛滋病患者中出現的一種奇怪模式。「我對這些人體內沒有T4細胞的事實感到震驚。」目前在法國巴黎第六大學工作的Klatzmann表示。他在細胞培養試驗中證實,HIV似乎選擇性地感染並摧毀這些屬於免疫系統T細胞子集的細胞。問題在於:該病毒是如何進入細胞的?
Klatzmann推斷,曾被免疫學家用於定義這一系列細胞的表面蛋白(隨後被稱為CD4)可能還充當了HIV進入細胞的受體。1984年12月,他在一篇發表的論文中報告了這一發現。同時發表的還有一篇由當時在英國倫敦癌症研究所工作的分子病毒學家Robin Weiss及其同事撰寫的類似論文。
在3年的時間裡,CD4成為生物醫學文獻中的最熱門基因。它的熱度從1987年維持到了1996年。其間,CD4佔到NLM所加的全部標籤的1%~2%。
這種關注度部分源自應對新出現的愛滋病危機的努力。例如,上世紀80年代末,若干公司開始涉獵打造治療形式的CD4蛋白的想法。其能在HIV病毒感染健康細胞前肅清病毒粒子。不過,美國國家癌症研究所愛滋病和癌症病毒項目負責人Jeffrey Lifson介紹說,來自小型人類試驗的結果證實,這只是一個很平庸的想法。
導致CD4如此流行的更大一部分原因同基礎免疫學相關。1986年,研究人員意識到,表達CD4的T細胞可被細分成兩個不同的群體:一個能消除感染細胞的細菌和病毒,另一個會抵禦諸如蠕蟲等沒有入侵細胞也會引發疾病的寄生蟲。「這是一個非常激動人心的時刻,因為我們了解的太少了。」紐約大學醫學院免疫學家Dan Littman表示。就在一年前,他幫助克隆了編碼CD4的DNA並將其插入細菌,從而使大量的蛋白能被用於研究。
10年後,Littman還共同領導了一個團隊證實,為進入細胞,HIV會利用除了CD4的另一個受體:一種被確認為CCR5的蛋白。自此以後,它們和另一個名為CXCR4的共同受體持續成為密集的全球HIV研究的焦點,目標則是阻止該病毒進入細胞,雖然其尚未實現。
曇花一現
上世紀90年代初,TP53的地位已經開始上升。不過,在它爬上人類基因階梯的最頂端之前,一個鮮為人知的基因——GRB2出了很多年的風頭。
當時,研究人員開始辨別涉及細胞通訊的特定蛋白的相互作用。多虧了細胞生物學家Tony Pawson作出的開創性研究,科學家了解到,一些小的胞內蛋白含有被稱為SH2的模塊。它可能同細胞表面的被激活蛋白結合併將信號傳遞給細胞核。
1992年,耶魯大學醫學院生物化學家Joseph Schlessinger證實,被生長因子受體結合蛋白——GRB2編碼的蛋白就是這一中繼站。它含有一個SH2模塊以及兩個可激活涉及細胞生長和生存的蛋白區域。「它是分子『媒人』。」Schlessinger介紹說。
很快,其他研究人員填補了空白,並且開創了信號傳導研究領域。儘管細胞信號傳導的很多其他基本成分很快得以揭示並最終促成了針對癌症、自體免疫疾病、糖尿病和心臟病的療法,但GRB2始終「站」在最前沿並且在上世紀90年代末連續3年成為被提及次數最多的基因。
加州大學聖地牙哥分校生物化學家Peter van der Geer介紹說,部分原因在於GRB2「是信號傳導級聯兩部分之間的首個實體連接點」。更重要的是,「它涉及細胞調節的很多不同方面」。
GRB2有點像被研究最多基因榜單上的「局外人」。它並非疾病的直接起因,也不是藥物靶標。而這或許解釋了為何它會曇花一現。「有些冉冉升起的明星會迅速衰落,因為它們沒有臨床價值。」在瑞典斯德哥爾摩卡羅林斯卡研究所和巴黎第六大學長期研究TP53的科學家Thierry Soussi表示。
短暫超越TP53
TP53的主導地位被另一個基因APOE短暫地打斷。上世紀70年代中期,APOE蛋白最早作為涉及從血液中清除膽固醇的「運輸者」而被描述。該領域的開創者、來自加州大學舊金山分校的Robert Mahley介紹說,研究人員認真地考慮過將其作為預防心臟病的降脂療法。Mahley在兔子中測試了該療法。
最終,上世紀80年代末他汀類藥物的創建使上述策略落入製藥史的「垃圾箱」。但隨後,神經科學家Allen Roses和同事在阿爾茨海默氏症患者的黏性大腦斑塊中發現了APOE蛋白。他們在1993年證實,該蛋白的一種特定形式——APOE4同阿爾茨海默氏症大大增加的發病風險存在關聯。
這使科學家對其產生了更廣泛的興趣。當然,進入被研究最多基因榜單需要時間。澱粉樣蛋白假說稱,一種名為澱粉樣蛋白-β的蛋白質片段的累積引發了阿爾茨海默氏症。這一觀點在當時非常流行。很少有研究人員對尋找轉運膽固醇的蛋白同該疾病存在何種關聯感興趣。但Mahley表示,APOE4和阿爾茨海默氏症患病風險之間的基因關聯被證實是「無可辯駁的」。 2001年,APOE短暫地超越了TP53。
和其他流行的基因一樣,APOE之所以得到很好的研究,是因為它是目前未解決的一個重要健康問題的關鍵。但它的重要性還在於抗澱粉樣蛋白療法在臨床測試中逐漸失去勢頭。「雖然我討厭這麼說,但幫助我的正是失敗的試驗。」今年為自己公司籌集到6300萬美元用於研發靶向APOE4蛋白藥物的Mahley表示。在他看來,這些失敗迫使行業和資助機構重新思考應對阿爾茨海默氏症的治療策略。(宗華編譯)