近期,暨南大學生命科學技術學院何慶瑜教授、張弓教授(承啟生物首席科學家)、王通教授團隊在Nucleic Acids Research上發表論文,發現了大量 「非編碼基因」可以表達蛋白質(暨南大學發現隱藏的蛋白質組:大量「非編碼基因」可以表達蛋白質);小夥伴們都震驚了,紛紛後臺留言想要更多內幕。
或許本文能滿足你們的求學心!(溫馨提示:文末有大量講解視頻)
你研究的lncRNA很可能是編碼的
除了部分非編碼基因可以表達為小肽行使調控功能外,當諸如CLUU1, ESRG等這樣的、能翻譯成>50胺基酸的蛋白質的lncRNA出現時,人們就開始思考:它們是個例嗎?還是確實存在部分「編碼基因」被錯誤地標註成了「非編碼基因」?
這可是個嚴肅的問題——若lncRNA可編碼蛋白質並非少數個例,將意味著人基因組需要被系統性地重新注釋。
早在2013年,人類基因組計劃發起人之一的Eric Lander發文認為lncRNA不能編碼蛋白質,但拿不出蛋白質層面的證據。而次年,他們又發了篇文章認為lncRNA可能編碼蛋白質,但依然沒有蛋白質實驗證據;2014年,人類蛋白質組草圖在Nature上發表,聲稱發現千餘個lncRNA所編碼的「新蛋白質」,但使用較嚴格的標準進行質控後,這些所謂的「新蛋白質證據」幾乎都被認定為假陽性。
蛋白質組學質譜技術難以避免的固有缺陷,導致研究者們難以提供獨立的蛋白質編碼信息源,也致使了該問題多年來一直處於猜測卻無法證實階段。
翻譯組發現新蛋白
其實在2013年,暨南大學團隊就使用翻譯組測序這一新技術,在肺癌細胞中發現了1397個有可能被翻譯的「非編碼RNA」(Nucleic Acids Research 2013, 41, 4743),其中不少在肺癌細胞和正常細胞中存在著差異表達。
翻譯組測序(RNC-seq,測序正在翻譯的全長mRNA)是由暨南大學張弓教授課題組首先研發於2012年,由於該項技術能準確監測翻譯,精度比質譜高很多,可用於指導蛋白質組學,規避上面提到的問題,因此很快被作為人類蛋白質組計劃的核心支柱之一,並在2014年被人類蛋白質組組織列為人類蛋白質組計劃的首要突出貢獻。
經過6年的繼續探索,暨南大學教授團隊從9株人細胞系中共鑑定到約4700種lncRNA正在被翻譯,且可能以經典翻譯起始方式翻譯出>50胺基酸的蛋白質。利用目前公認的驗證標準,他們提供了其中314個新蛋白質的證據。這些蛋白質是穩定存在的,並且有著明確的細胞定位,功能實驗也證實它們以蛋白質形式(而非RNA形式)行使著明確的生物學功能。
而這已不是他們第一次發現原先認為的「非編碼RNA」能翻譯成蛋白質。
就在2018年,中山大學張弩教授、暨南大學張弓教授等人利用翻譯組測序技術,發現了人細胞內8000多個環狀RNA可能翻譯出蛋白質,顛覆了「只有極少數環狀RNA才能翻譯成蛋白質」的傳統觀念,並確證了其中一個蛋白質LINC-PINT具有明確的抑癌功能,顯示了翻譯組測序技術在尋找新蛋白方面有著難以比擬的優勢。
也因此,翻譯組測序為人類基因組的可能注釋錯誤提供了大規模校正的有效手段。
「隱藏的蛋白質組」為何「隱藏」
為何這些「新蛋白」長期以來一直被認為不存在?這是因為人類基因組的注釋一般是算法預測的結果,而任何算法預測都不會完全準確。通常,編碼基因都有多個外顯子,且在進化上相對保守,算法便是根據這兩個「經驗」進行判定。
但此次暨南大學團隊發現的新蛋白,大部分只有一個外顯子,而且進化上出現得非常晚,大量新蛋白只在靈長目才出現,連小鼠基因組中都沒有。因此,算法可能錯誤地將這些編碼基因歸為了「非編碼基因」。當然,這些新蛋白在轉錄、翻譯、蛋白質各水平上表達量都較低,理化性質也比較特殊,因此也增加了檢測的難度。
為了能更好地用質譜去檢測新蛋白,當今世界上兩大質譜儀生產商Thermo和AB Sciex的技術人員在本次研究過程中都給予了技術支持,幫助優化了質譜方法以及質譜儀上的數據收集;安徽國平藥業的技術人員在重同位素標記的MRM實驗上給予了幫助。這些幫助使得研究組能夠拿出滿足當前最嚴苛標準的高質量質譜證據。
這些新蛋白有什麼功能?本次發現的這些新蛋白,由於此前在人們視野中一直是」隱藏「著的,對其的功能預測便十分困難。對此,深圳承啟生物科技有限公司提供了系統生物學數據分析的幫助,在無法通過序列直接預測其生物學功能的情況下,通過序列準確預測了這些新蛋白的亞細胞定位,並得到了實驗驗證,從而引導了功能研究的大致方向;再通過翻譯組測序數據的定量分析,進一步推測其功能。
由此,研究組選擇了一個在肺癌細胞中翻譯比率(Translation Ratio, TR,反映翻譯起始效率)升高的「新蛋白」UBAP1-AST6進行功能實驗,結果證明過表達這一新蛋白就會增強細胞的增殖能力和克隆形成能力,說明UBAP1-AST6這一新蛋白是一個癌基因。因此,它可能是肺癌發生發展的一個重要分子,而此前人們從來不知曉其存在!
—————————————
本次發現可能存在的新蛋白就有4700多個,這些新蛋白質可能含有與人類生理病理相關的重要分子,因而打開了一個新的人類蛋白質的寶庫,開闢新的研究領域。兩年前,這項工作的進展就引起了廣泛的關注,《廣東新聞聯播》也對此作了專門報導:
瀏覽器版本過低,暫不支持視頻播放
今後,再有人聲稱研究了一個「lncRNA」,首先還得證明它是不能被翻譯為蛋白質的。
由於目前質譜的固有缺陷,直接從質譜數據中證明蛋白質不存在難度較大,因而翻譯組測序是目前最有效的方法。暨南大學張弓教授建立了全國第一個「翻譯組學實驗室」,開發出從整體上研究翻譯中各物質成分的各種組學技術,可實現細菌、真菌、動物、植物等各物種各組織的翻譯組測序,並通過承啟生物科技有限公司進行多項服務,掌握有大量翻譯組學的核心技術專利。2017年,承啟生物宣布為國際人類蛋白質組計劃(Human Proteome Project)免費提供翻譯組測序,助力人類蛋白質組計劃早日完成。
有興趣深入了解這項工作、又不想去啃論文的朋友們,可以搜索承啟生物首席科學家、暨南大學張弓教授2017年4月應邀在人類蛋白質組計劃會議(伊朗 德黑蘭)上做的演講。需要注意的是,當時學界的標準還不甚嚴苛,所以報告中的新蛋白數量會多一些。
英文不好的小夥伴們還可以搜索張弓教授2017年6月在廣州醫科大學的中文版演講。
更多前沿新發現、新技術,歡迎關注承啟生物!