編者按:去年年底,來自北京大學的研究人員在世界上首次創建並發布了長非編碼RNA疾病資料庫( LncRNADisease),這一資料庫收錄了160多種和長非編碼RNA有關的疾病,併集成了一個生物信息學工具用以預測新的人類長非編碼RNA和疾病的關係。
領導這一研究的是北京大學基礎醫學院醫學信息學系崔慶華教授,崔博士回國後加入北京大學基礎醫學院醫學信息學系,在5年多的生物信息學研究工作中,他的研究涉及到了生物標記物檢測、基因晶片數據分析、基因組學、蛋白質組學以及系統生物學等領域。
崔慶華教授是國際上最早從事miRNA生物網絡調控和miRNA /lncRNA與疾病關係生物信息學研究的學者之一,那麼是什麼吸引他關注並能長期執著於長非編碼RNA疾病資料庫創建這項研究?建立非編碼RNA疾病資料庫的最大價值與意義在哪裡?目前又面臨著怎樣的挑戰呢?
生物谷:去年底,您領導的長非編碼RNA疾病資料庫( LncRNADisease) 的創建可謂意義重大,影響深遠,收錄了160多種和長非編碼RNA有關的疾病,是國際上第一個長非編碼RNA疾病資料庫。在這之前, 您於2007年就創建了世界上第一個微小RNA(miRNA)疾病資料庫, LncRNADisease這項研究成果在此基礎上做出了哪些突破與改進?
崔慶華:相對於miRNA疾病資料庫,LncRNADisease做出了對lncRNA和疾病的關係進行收集、整理、注釋的改進。LncRNADisease在儲存了人類的非編碼RNA研究信息的同時,還收錄了其他物種的相關信息。
另外,在這項資料庫的創建過程中,序列、基因組位置等信息都被納入我們的考慮範圍中。
生物谷:您是國際上最早從事miRNA生物網絡調控和miRNA /lncRNA 與疾病關係生物信息學研究的學者之一,是什麼吸引您關注並能長期執著於長非編碼RNA疾病資料庫創建這項研究工作呢?
崔慶華:之所以長期關注該領域,是因為意識到了該領域研究不可忽略的重要性。隨著人類基因組計劃的初步完成,人們發現「能夠編碼蛋白質的基因只佔全部基因組的2%左右」,而之後的ENCODE計劃揭示了非編碼RNA佔據了剩下的98%人類基因組中的大量份額,非編碼RNA在生物信息領域中扮演著越來越重要的角色,有關非編碼RNA的研究也多次入選「世界科學十大進展」或「世界醫學十大進展」。
但是,目前相對於蛋白質編碼基因,人們對非編碼RNA的了解十分有限。非編碼RNA對於人類來說,可謂是一個巨大的具有無窮潛力的未知領域。ENCODE計劃也提及了對非編碼RNA的預測與展望:「健康領域的非編碼RNA研究將是未來的研究重點,是疾病預防、診斷與治療等中心研究領域的又一分子。」因此,本人實驗室長期貫注於該方面的研究與探索。
生物谷:最初人們普遍認為lncRNA僅僅是基因的「轉錄噪聲(transcriptional noise)」近幾年有哪些發現可以證明lncRNA具有一定功能與價值?在您看來,lncRNA在癌症等疾病中的作用?
崔慶華:近來有大量研究證明lncRNA具有十分重要的功能,並且其行使功能的方式十分多樣和複雜。這從lncRNA與其他分子的相互作用即可看出。
目前有很多研究報導lncRNA可以和蛋白質相互作用。如,lncRNA和組蛋白可以通過表觀遺傳影響基因調控,還能和轉錄因子結合影響基因調控,同時,lncRNA還能作為scaffold行使功能,募集多個蛋白構成複合體。除了蛋白質,lncRNA還可以和RNA相互作用。作用RNA包括mRNA,lncRNA和miRNA等。甚至,lncRNA能夠入核直接和DNA相互作用,發揮轉錄因子的功能。由此可見lncRNA的作用機制是複雜和多樣化的,是生物分子網絡的重要組成部分。
基於此,我們可以認為lncRNA在疾病中的作用也一定是複雜的和多樣的,是理解疾病發生發展,疾病預防、診斷和治療的潛在分子。
生物谷:建立長非編碼RNA疾病資料庫最大的價值與意義是什麼?以及lncRNA研究目前面臨的主要挑戰是什麼?(研究工具的問題等)
崔慶華:建立長非編碼RNA疾病資料庫,一方面為探索非編碼RNA和疾病關係的相關研究人員提供一個信息平臺,另一方面有助於生物信息學研究人員基於該資料庫開發出更多更好的生物信息學工具,用於分析長非編碼RNA和疾病關係。
我個人認為目前長非編碼RNA的挑戰有如下幾點:
·長非編碼RNA系統識別與功能注釋。人類的基因組中到底有多少lncRNA?它們的功能是什麼?——這些目前仍在探索中;
·長非編碼RNA的分類。目前長非編碼RNA的分類標準僅僅是根據核苷酸長度,這個標準比較粗糙,我們正在探索長非編碼RNA的細分標準;
·長非編碼RNA的系統生物學,長非編碼RNA和其他生物分子的關係,長非編碼RNA網絡等,這些都是我們目前正在面臨的研究課題;
·長非編碼RNA和疾病的關係,長非編碼RNA在疾病診斷、分型和治療中具有的意義。
我個人認為在幾萬個(目前已發現數量)長非編碼RNA的世界中,一定存在長非編碼RNA中的P53, PTEN。這有待於我們去發現,去揭示。
<版權所有,轉載請註明來源。為了最大限度地保護本文涉及到的人物(採訪對象或原始作者)的隱私權,其聯繫方式不公開,讀者如果有任何學術上的交流願望或諮詢需求,請聯繫生物谷(editor@bioon.com)代為轉達。>
關於崔慶華
崔慶華於2005年在中國科學院自動化研究所取得博士學位,研究方向為生物信息學與系統生物學。他2005年-2007年在加拿大國家研究委員會生物技術研究所從事博士後研究,2007年加入北京大學醫學部生物醫學信息學系任副教授,2012年任教授。崔博士長期從事非編碼RNA的生物信息學與系統生物學研究工作,是國際上最早從事miRNA生物網絡調控(Cui et al., MSB 2006)和miRNA (Lu et al., PLoS ONE 2008)/lncRNA(Chen et al., NAR 2013)與疾病關係生物信息學研究的學者之一。他以責任/第一作者身份共發表SCI論文25篇,總影響因子約125,其中影響因子大於10論文4篇,上述論文共獲得SCI引用約700餘次,其中兩篇論文單篇SCI引用超100次(Cui et al. MSB 2006, SCI引用123次,Google Scholar引用193次;Lu et al. PLoS ONE 2008, SCI引用138次,Google Scholar引用230次)。
名詞解釋
長非編碼RNA疾病:是指由於長非編碼RNA異常而引發的各種疾病,其實關於非編碼RNA在疾病發生、發展和防治中的作用已有大量文獻報導,特別是siRNA、miRNA、和RNAi已經成為現代醫學生理和病生理學的研究重點,但是關於長非編碼RNA與疾病發病和防治之間關聯的研究,還僅僅走出了第一步。
P53:p53基因。因編碼一種分子質量為53 kDa的蛋白質而得名,是一種抗癌基因。其表達產物為基因調節蛋白(P53蛋白),當DNA受到損傷時表達產物急劇增加,可抑制細胞周期進一步運轉。一旦p53基因發生突變,P53蛋白失活,細胞分裂失去節制,發生癌變,人類癌症中約有一半是由於該基因發生突變失活。
PTEN:(即MMAC1, mutated in multiple advanced cancers 1)為一新發現PTEN基因在染色體的位置的抑癌基因,其中文名為人第10號染色體缺失的磷酸酶及張力蛋白同源的基因,位於10q23.3,轉錄產物為515kb mRNA。屬於PTP(protein tyrosine phosphatases)基因家族成員。