2020-04-30 北京生命科學研究院
語音播報
4月28日,中國科學院北京生命科學研究院趙方慶團隊在國際期刊Genome Biology發表題為CircAtlas: an integrated resource of one million highly accurate circular RNAs from 1070 vertebrate transcriptomes 的研究論文。該研究基於現有的海量轉錄組數據,採用多維數據智能整合分析手段,成功解析了跨物種、多組織、大樣本的環形轉錄本表達特徵和進化規律,為探索真核生物複雜多變的環形RNA全貌和產生機制提供了強有力的數據支持。
近年來,環形RNA作為一類新型的內源性非編碼RNA在生物系統調控和疾病發展過程中的作用不斷被發現和擴展。高通量測序技術的快速發展和廣泛應用,更是將環形RNA研究帶入了大數據時代,使之迅速成為RNA研究領域的熱點之一。環形RNA轉錄組數據的大量積累,給研究人員帶來了新的機遇和挑戰:如何從轉錄組數據海洋中高效篩選和獲取具有重要生物學功能的環形RNA分子。物種信息的日益豐富為全面解讀複雜的環形RNA轉錄調控過程打開新的突破口:基於多物種的進化保守性分析將有助於篩選出具有潛在功能的環形轉錄本,而多組學數據的整合分析則可以從不同層次解析環形RNA的表達調控過程。
研究人員通過整合自有及公共轉錄組數據,獲得覆蓋6個物種(人、猴、小鼠、大鼠、豬和雞)的19個組織類型,共計1070個轉錄組數據集,構建了目前覆蓋物種最廣、數據最齊全的環形RNA整合數據資源平臺circAltas (http://circatlas.biols.ac.cn)。該平臺收錄超過100萬個高質量的環形RNA分子,其中>80%具有全長轉錄本序列。此外,通過整合功能組學數據和注釋信息,為環形RNA數據挖掘和功能研究提供了重要的數據資源和技術保障。
在上述數據的基礎上,他們進一步提出了新的保守環形RNA識別方法和保守性多層次評估機制。通過結合全局比對和反向剪接位點的局部比對特徵,篩選出超過12萬保守的環形RNA,並進一步結合物種間、組織間和個體間的表達一致性對其保守性進行打分(Multiple Conservation Score),直觀反映出環形轉錄本在不同層次的保守性和進化規律,對功能環形RNA分子的篩選具有重要意義。此外,研究人員還結合保守性和表達量信息,對收錄的環形RNA進行重新命名,並提供多個環形RNA資料庫間的名稱查詢和轉換功能,釐清了環形RNA領域存在的命名混亂問題。此外,利用重建的環形RNA全長序列,該團隊首次通過大規模分析其可能的ORF和IRES序列,去預測其翻譯成蛋白質的潛力。進一步結合CLIP等多組學數據,構建環形RNA和mRNA、miRNA及RBP的表達調控網絡,並結合網絡中眾多調控元件的注釋信息對環形RNA的功能進行預測。該研究為環形RNA的功能挖掘和注釋提供了重要的分析工具。
該工作由趙方慶課題組的博士研究生吳婉瑩和助理研究員冀培豐完成,並獲得了國家自然科學基金委、科技部重點研發計劃及中科院的經費支持。趙方慶團隊在前期的工作中建立了環形RNA識別和質控、轉錄本組裝、可變剪接識別及定量等一系列方法和工具,相關研究發表在Genome Biology (2015, 2020)、Nature Communications (2016,2020)、Briefings in Bioinformatics (2017)、Trends in Genetics (2018)、Genome Medicine (2019)、Cell Reports (2019)和Bioinformatics (2020)。這些研究豐富了人們對環形RNA的表達和功能的認識,為深入了解這一嶄新類型的非編碼RNA分子奠定了方法學基礎。
論文連結
圖1.環形RNA整合數據資源和挖掘平臺——circAtlas
圖2. 保守性環形RNA的識別和打分策略
4月28日,中國科學院北京生命科學研究院趙方慶團隊在國際期刊Genome Biology發表題為CircAtlas: an integrated resource of one million highly accurate circular RNAs from 1070 vertebrate transcriptomes 的研究論文。該研究基於現有的海量轉錄組數據,採用多維數據智能整合分析手段,成功解析了跨物種、多組織、大樣本的環形轉錄本表達特徵和進化規律,為探索真核生物複雜多變的環形RNA全貌和產生機制提供了強有力的數據支持。
近年來,環形RNA作為一類新型的內源性非編碼RNA在生物系統調控和疾病發展過程中的作用不斷被發現和擴展。高通量測序技術的快速發展和廣泛應用,更是將環形RNA研究帶入了大數據時代,使之迅速成為RNA研究領域的熱點之一。環形RNA轉錄組數據的大量積累,給研究人員帶來了新的機遇和挑戰:如何從轉錄組數據海洋中高效篩選和獲取具有重要生物學功能的環形RNA分子。物種信息的日益豐富為全面解讀複雜的環形RNA轉錄調控過程打開新的突破口:基於多物種的進化保守性分析將有助於篩選出具有潛在功能的環形轉錄本,而多組學數據的整合分析則可以從不同層次解析環形RNA的表達調控過程。
研究人員通過整合自有及公共轉錄組數據,獲得覆蓋6個物種(人、猴、小鼠、大鼠、豬和雞)的19個組織類型,共計1070個轉錄組數據集,構建了目前覆蓋物種最廣、數據最齊全的環形RNA整合數據資源平臺circAltas (http://circatlas.biols.ac.cn)。該平臺收錄超過100萬個高質量的環形RNA分子,其中>80%具有全長轉錄本序列。此外,通過整合功能組學數據和注釋信息,為環形RNA數據挖掘和功能研究提供了重要的數據資源和技術保障。
在上述數據的基礎上,他們進一步提出了新的保守環形RNA識別方法和保守性多層次評估機制。通過結合全局比對和反向剪接位點的局部比對特徵,篩選出超過12萬保守的環形RNA,並進一步結合物種間、組織間和個體間的表達一致性對其保守性進行打分(Multiple Conservation Score),直觀反映出環形轉錄本在不同層次的保守性和進化規律,對功能環形RNA分子的篩選具有重要意義。此外,研究人員還結合保守性和表達量信息,對收錄的環形RNA進行重新命名,並提供多個環形RNA資料庫間的名稱查詢和轉換功能,釐清了環形RNA領域存在的命名混亂問題。此外,利用重建的環形RNA全長序列,該團隊首次通過大規模分析其可能的ORF和IRES序列,去預測其翻譯成蛋白質的潛力。進一步結合CLIP等多組學數據,構建環形RNA和mRNA、miRNA及RBP的表達調控網絡,並結合網絡中眾多調控元件的注釋信息對環形RNA的功能進行預測。該研究為環形RNA的功能挖掘和注釋提供了重要的分析工具。
該工作由趙方慶課題組的博士研究生吳婉瑩和助理研究員冀培豐完成,並獲得了國家自然科學基金委、科技部重點研發計劃及中科院的經費支持。趙方慶團隊在前期的工作中建立了環形RNA識別和質控、轉錄本組裝、可變剪接識別及定量等一系列方法和工具,相關研究發表在Genome Biology (2015, 2020)、Nature Communications (2016,2020)、Briefings in Bioinformatics (2017)、Trends in Genetics (2018)、Genome Medicine (2019)、Cell Reports (2019)和Bioinformatics (2020)。這些研究豐富了人們對環形RNA的表達和功能的認識,為深入了解這一嶄新類型的非編碼RNA分子奠定了方法學基礎。
論文連結
圖1.環形RNA整合數據資源和挖掘平臺——circAtlas
圖2. 保守性環形RNA的識別和打分策略