2017-02-10 上海生命科學研究院
語音播報
國際學術期刊《科學報告》(Scientific Reports)近期在線發表了中國科學院-馬普學會計算生物學夥伴研究所邵振研究組關於PRC2與長非編碼RNA(lncRNA)之間相互作用的序列特異性研究成果,題為The PRC2-binding long non-coding RNAs in human and mouse genomes are associated with predictive sequence features。
由多梳(PcG)家族蛋白組成的表觀調控複合物PRC2是控制動物組織發育的重要因子,但在高等動物中PRC2如何被特異性招募到染色質特定區域的分子機制還不清楚。隨著XIST與HOTAIR等PRC2結合lncRNA的發現,人們猜測此類lncRNA可能決定了PRC2染色質招募的特異性(Margueron et al. Nature 2011)。但是,直到現在PRC2與RNA結合是否具有序列特異性仍被廣泛爭論(Davidovich et al. Mol Cell 2015)。邵振研究組首先開發了一個基於馬爾可夫鏈思想的序列組成分析流程,通過計算不同核苷酸間轉移在每條序列中出現的頻率來刻畫其組成,進而選擇被特定序列所顯著偏好或不偏好的核苷酸間轉移作為它們的序列組成特徵,並通過將所有可能的轉移映射到一個完整四叉樹來研究所選序列特徵在特徵空間中的分布是否具有非平凡性。通過將該流程應用於人基因組中已知的數百個PRC2結合lncRNA,該研究系統分析了這些lncRNA的序列特徵,發現其偏好的序列特徵傾向在四叉樹上組成連續偏好路徑,並且這些連續路徑上的序列特徵傾向於同時被人和小鼠基因組中的PRC2結合lncRNA所偏好。
受此啟發,該研究整合小鼠胚胎幹細胞中兩組已發表的RIP-seq和CLIP-seq數據,定義了一組高可信度的小鼠PRC2結合lncRNA,發現這些lncRNA能夠被人基因組中已知PRC2結合lncRNA所具有的序列特徵較好地預測。這些研究發現表明高等動物中PRC2與lncRNA結合具有序列特異性,並且其特異性具有較高的跨物種保守性。此外,該研究還通過發展一個局域打分模型,發現PRC2結合lncRNA的序列特徵在lncRNA上的分布表現出明顯的非隨機性。進一步研究發現,每個lncRNA上PRC2與lncRNA結合所偏好序列特徵最富集的小片段(定義為PRC2偏好片段),相對lncRNA其它部分具有顯著更高的進化保守性和RIP-seq信號強度(如圖),說明這些序列特徵的局域富集具有明確的功能意義。
該項研究在研究員邵振指導下,由計算生物學研究所博士研究生塗世奇完成,並得到了中科院和上海市科委的經費支持,以及美國哈佛醫學院教授袁國丞的指導和協助。
圖:PRC2結合lncRNA的序列特徵在lncRNA上的分布表現出明顯的非隨機性,並且這些序列特徵的局域富集具有明確的功能意義
國際學術期刊《科學報告》(Scientific Reports)近期在線發表了中國科學院-馬普學會計算生物學夥伴研究所邵振研究組關於PRC2與長非編碼RNA(lncRNA)之間相互作用的序列特異性研究成果,題為The PRC2-binding long non-coding RNAs in human and mouse genomes are associated with predictive sequence features。
由多梳(PcG)家族蛋白組成的表觀調控複合物PRC2是控制動物組織發育的重要因子,但在高等動物中PRC2如何被特異性招募到染色質特定區域的分子機制還不清楚。隨著XIST與HOTAIR等PRC2結合lncRNA的發現,人們猜測此類lncRNA可能決定了PRC2染色質招募的特異性(Margueron et al. Nature 2011)。但是,直到現在PRC2與RNA結合是否具有序列特異性仍被廣泛爭論(Davidovich et al. Mol Cell 2015)。邵振研究組首先開發了一個基於馬爾可夫鏈思想的序列組成分析流程,通過計算不同核苷酸間轉移在每條序列中出現的頻率來刻畫其組成,進而選擇被特定序列所顯著偏好或不偏好的核苷酸間轉移作為它們的序列組成特徵,並通過將所有可能的轉移映射到一個完整四叉樹來研究所選序列特徵在特徵空間中的分布是否具有非平凡性。通過將該流程應用於人基因組中已知的數百個PRC2結合lncRNA,該研究系統分析了這些lncRNA的序列特徵,發現其偏好的序列特徵傾向在四叉樹上組成連續偏好路徑,並且這些連續路徑上的序列特徵傾向於同時被人和小鼠基因組中的PRC2結合lncRNA所偏好。
受此啟發,該研究整合小鼠胚胎幹細胞中兩組已發表的RIP-seq和CLIP-seq數據,定義了一組高可信度的小鼠PRC2結合lncRNA,發現這些lncRNA能夠被人基因組中已知PRC2結合lncRNA所具有的序列特徵較好地預測。這些研究發現表明高等動物中PRC2與lncRNA結合具有序列特異性,並且其特異性具有較高的跨物種保守性。此外,該研究還通過發展一個局域打分模型,發現PRC2結合lncRNA的序列特徵在lncRNA上的分布表現出明顯的非隨機性。進一步研究發現,每個lncRNA上PRC2與lncRNA結合所偏好序列特徵最富集的小片段(定義為PRC2偏好片段),相對lncRNA其它部分具有顯著更高的進化保守性和RIP-seq信號強度(如圖),說明這些序列特徵的局域富集具有明確的功能意義。
該項研究在研究員邵振指導下,由計算生物學研究所博士研究生塗世奇完成,並得到了中科院和上海市科委的經費支持,以及美國哈佛醫學院教授袁國丞的指導和協助。
圖:PRC2結合lncRNA的序列特徵在lncRNA上的分布表現出明顯的非隨機性,並且這些序列特徵的局域富集具有明確的功能意義