lncRNA的一些基礎知識

2021-01-17 生信技能樹

前面我們系統性的總結了circRNA的相關背景知識:

同樣的策略,我們也可以應用到lncRNA的學習。以前我在:miRNA、LncRNA、CircRNA靠譜小結 也提到過一些基礎知識,但還不夠豐滿!其實讀一篇綜述是最好的學習方式,不過英文的畢竟難啃。假如你還是需要深入學習,建議看2009的CELL雜誌的超級經典綜述:Evolution and Functions of Long Noncoding RNAs

 

當然了,你假如僅僅是分析lncRNA的表達矩陣,你其實是可以不需要耗費時間去理解那麼多生物學背景的,把它當做是一個基因ID即可,一個有名字的基因。

首先lncRNA是Non-coding RNAs的一種

而且Non-coding RNAs的別名太多了,"non-protein-coding RNA", "npcRNA", "non-messenger RNA", "nmRNA", "functional RNA", "fRNA", "ncRNA"。而Non-coding RNA 的分類就太多了,在:https://www.genenames.org/data/genegroup/#!/group/475可以看到信息列表。非編碼RNA(Non-coding RNA)是指不編碼蛋白質的RNA。其中包括rRNA、tRNA、snRNA、snoRNA 和microRNA 等多 種已知功能的 RNA,還包括未知功能的RNA。這些RNA的共同 特點是都能從基因組上轉錄而來,但是不翻譯成蛋白,在RNA 水平上就能行使各自的生物學功能。如果你對Non-coding RNA 感興趣呢,可以看 https://www.nature.com/collections/sqtqxdnvdz 裡面的合輯:

SERIES | 01 JANUARY 2018

With improved methods to explore the transcriptome, in recent years there have been great advances in identifying and understanding non-coding RNAs. Regulatory pathways involving small RNAs, such as microRNAs, are now being elucidated in detail, and functions for long non-coding RNAs are also coming to light. The articles in this series discuss insights into the biology of non-coding RNAs of all sizes in a wide range of organisms

話說這個系列的綜述裡面的機製圖,都畫的好漂亮啊!

長鏈非編碼RNA(long noncoding RNA,lncRNA)

長 度>200bp的RNA,由RNA聚合酶Ⅱ轉錄,lncRNA具有保守的 二級結構, 大部分不編碼蛋白質,也有報導,其可以編碼多肽,多 肽大部分無功能。

LncRNA來源很廣,可以來源於基因編碼區、 非編碼區、外顯子、內含子、正義鏈或反義鏈。

LncRNA發揮功 能的方式很廣,可以與蛋白、DNA和RNA相互作用,參與多種 生物學過程的調控。

再次強調,如果你僅僅是處理數據,可以把LncRNA跟其它基因一樣的處理即可。大部分都是看表達差異罷了。

在GENCODE Release (version 32)的LncRNA信息

ENCODE (Encyclopedia of DNA Elements)項目統計,人類基因 組中約75%區域都可以轉錄。其中1%為編碼蛋白外顯子,40% 為蛋白編碼基因(外顯子+內含子)轉錄區域,剩下絕大多數轉 錄區域產生lncRNA。因為Long non-coding RNA genes資料庫來源太多,研究也不統一,我比較喜歡GENCODE 資料庫的。我傾向於把基因分成Protein-coding和Non-coding 兩個大類,其在 GENCODE 數量如下:

Total No of Genes    60609
Protein-coding genes    19965
Long non-coding RNA genes    17910
Small non-coding RNA genes    7576
Pseudogenes    14749
- processed pseudogenes    10668
- unprocessed pseudogenes    3556
- unitary pseudogenes    228
- polymorphic pseudogenes    42
- pseudogenes    18
Immunoglobulin/T-cell receptor gene segments    
- protein coding segments    408
- pseudogenes    237

這裡面的17910個 Long non-coding RNA genes    是需要重點關注的。參考:https://www.gencodegenes.org/human/stats.html

所以,如果你分析LncRNA的數據,最後最好是輸出的結果,以GENCODE資料庫的ID為準,這樣方便你我他!再次強調,如果你僅僅是處理數據,可以把LncRNA跟其它基因一樣的處理即可。大部分都是看表達差異罷了。

lncRNA功能

前面我們提到過LncRNA發揮功 能的方式很廣,可以與蛋白、DNA和RNA相互作用,參與多種 生物學過程的調控。同理我們應該是看綜述,這個時候推薦的同樣是引用最多的,發表在 Mol Cell. 2011 Sep 16; 43(6): 904–914. 的Molecular mechanisms of long noncoding RNAs

 

如果你覺得不過癮,也可以繼續看其它,再比如:   Functional Classification and Experimental Dissection of Long Noncoding RNAs

LncRNA調控分析 LncRNA順式(cis)調控基因分析

Antisense長鏈非編碼RNA,至少其中相當多的一部分,能夠順式調節鄰近蛋白編碼基因的轉錄,精密控制這些發育多樣性基因位點的時空表達,並參與到與之相關的發育和其它生物學過程。順式調控就是指非編碼RNA對臨近mRNA的一種轉錄激活與表達調控方式。LncRNA以序列互補為原理結合在未解鏈的染色質大溝中,或者和解鏈的DNA鏈結合,LncRNA位點附近的基因轉錄會受到該LncRNA對正在轉錄或者剪接體的影響,某個基因的轉錄起始元件出現在臨近的LncRNA轉錄位點中。

LncRNA 反式(trans)調控基因分析

反鏈LncRNA反式(trans)調控,是對遠端mRNA轉錄的調控LncRNA可以調控遠距離的基因的表達,例如結合增強子和啟動子等。LncRNA可以起到支架作用,組織蛋白複合物行使功能,充當亞細胞結構,LncRNA以劑量依賴形式在胞質或者胞核內,調控結合的蛋白或者RNA的活性。通過皮爾森相關係數(閾值大於0.95)可以判斷LncRNA是否調控基因。

lncRNA-miRNA相互作用

這個其實是目前的數據分析重點,就是我們一直說的ceRNA 理論。

lncRNA因其存在Introns等片段組成,長度可達數千nt,這就為吸附結合大量的miRNA提供了良好的物質基礎,通過競爭佔有胞內大量的miRNA,像海綿一樣緩衝並削減其幹涉靶基因mRNA編碼蛋白的能力,我們就稱這樣的lncRNA與mRNA互為ceRNA關係,因此可見,作為關聯節點的就是miRNA,它的靶構成了ceRNA,共同組合就是ceRNA網絡。

lncRNA種類

主要是根據其在參考基因組上的位置,一個 lncRNA 可以歸於以下五類中的一種或五種:(1)sense(2)antisense (3)bidirectional(4)intronic(5)intergenic,這個在很多綜述都可以看到,我建議看最新的,就是發表在J Anim Sci Technol. 2018; 的綜述:Long non-coding RNA: its evolutionary relics and biological implications in mammals: a review

 

參考綜述是:Dhanoa et al. Journal of Animal Science and Technology (2018) 60:25

也可以分成更多類型,各種各樣的綜述都有:

反義型(antisense lncRNAs)、

內含子型(intronic lncRNAs)、

反向型(divergent lncRNAs)、

基因間型(intergenic lncRNAs)、

啟動子上遊型(promoter upstream lncRNAs)

啟動子型(promoter-associated lncRNAs)

轉錄起始位點型(transcription start site-associated lncRNAs)

利用RNA-seq技術發現並且鑑定lncRNA

做到RNA-seq技術來鑑定lncRNA比較少,主要是非模式生物的,數據分析的難點主要在:LncRNA鑑定,可以看一寫公司的結題報告:

 

主要是通過三個軟體鑑定樣本中的LncRNA,分別是CPAT、CPC2和CNCI。但是由於 LncRNA的特徵,單一一種軟體鑑定出來的結果假陽性較多,因此取三個軟體得到結果的交集作為最終結果,三個軟體結果可以做韋恩圖。

發現並且鑑定lncRNA就需要命名啦,也是有一定規則的。

lncRNA的命名

實際上,目前lncRNA的命名還沒有一個統一的原則,但為了讓lncRNA的命名具有唯一性、準確性並最大程度上反映其功能,雨果基因命名委員會(HGNC,唯一的制定人類基因命名標準的官方授權機構)提供了一個命名指導指南,以供參考。參考文獻:A short guide tolong non-coding RNA gene nomenclature

作者在發表新lncRNA時,可先獲取HGNC的認可,如果作者發布的名字已在其他地方使用過,HGNC將會指定一個新名字供作者選擇。

lncRNA的名字應是描述基因的縮寫,便於人們理解名字的含義。如BANCR就是BRAF-activatednon-proteincoding RNA的縮寫。

功能性轉錄假基因在命名時應保留它們假基因名稱且不應改變其基於功能的名稱。為了方便搜索,這個功能應加在名字的最後。eg: PTENP1 是「phosphatase and tensin homolog pseudogene 1 (functional)」.

而對於未知功能的lncRNA應依據基因組上下文來命名

如果有一個很接近的蛋白編碼基因,lncRNA的名字應該以這個編碼基因名字開始,再加後綴即可。

後綴的分類:

反義(antisense,AS),eg: BACE1-AS;

內含子(intronic,IT),eg: SPRY4-IT1;

重疊(overlapping,OT),eg: OSX2-OT;

長鏈基因間lncRNA(Longintergenic lncRNAs,lincRNAs),以LINC為前綴,數字為後綴,eg: LINC00485。

此外,有些lncRNA與編碼基因是頭碰頭(headto head),可推斷它們擁有雙向啟動子,HGNC推薦將其命名為反義上遊(Antisense upstream,AU),例如,GENE2-AU1。

lncRNA的常用資料庫大全

因為實在是太多,介紹起來沒完沒了,我們這裡重點講解一個即可,就是:RNAcentral,它整合了多個資料庫,並且提供4個重要的功能:text search, sequence similarity search, bulk downloads, and programmatic data access.

如果你確實感興趣它所整合的那些資料庫本身,也可以自己慢慢學習:https://rnacentral.org/expert-databases

 

在Wikipedia可以查到更多:https://en.wikipedia.org/wiki/List_of_long_non-coding_RNA_databases

相關焦點

  • 史上最全的lncRNA資料庫大全及心得分享
    雖然老談一直默默覺得部分lncRNA就是伸長了的miRNA,其作用機制比較類似,但有關所有lncRNA全方面的功能研究還需要進一步的探索。小夥伴們更需要裝配研究的利器,幫助我們在尋求相關lncRNA信息時能夠手到拈來,不費吹灰之力!今天老談就跟大家分享一些研究lncRNA的資料庫,幫助大家做好科研準備工作。當然lncRNA資料庫較之於miRNA可能相對較少,畢竟後者的研究已經非常成熟。
  • 關於恆星光譜的一些基礎知識
    所以我們檢測遙遠恆星發出的光,基於光譜知識,就可以知道其大致的溫度,從而給恆星分類。 恆星光譜型:O到M型亮星的光譜照片。 恆星歷史分類在哈佛的分類中,字母排列古怪的原因是缺乏知識,它是從早期的西奇教派演變而來的,隨著人類知識系統的提高,逐漸被修改了。在19世紀60年代和19世紀70年代,開創性的恆星光譜學家安吉洛·西奇為了對觀測到的光譜進行分類而創建了西奇分類。
  • 鋰電池的基礎知識?
    大家可能不知道鋰電池的一些基礎知識!今天給大家分享一些關於鋰電池的基礎知識!鋰離子電池以碳素材料為負極。以含鋰的化合物作為正極,沒有金屬鋰的存在,只有鋰離子電池,這就是鋰離子電池。鋰離子電池是指以鋰離子嵌入化合物為正極材料電池的總稱。鋰電池的充放電過程,就是鋰離子的嵌入和脫嵌過程。在鋰離子的嵌入和脫嵌過程中,同時伴隨著鋰離子等當電子的嵌入和脫嵌。
  • 電子元件基礎知識
    導讀:電子元件基礎知識有哪些呢,不僅包括電阻、電容等常用元件的區分,還包括一些電子常用術語喲,快來看看吧~~本文引用地址:http://www.eepw.com.cn/article
  • 基礎知識 | 雲的種類
    如果積雲幾乎不向上發展,在裡面飛行可能會遇到一些顛簸,並且不會有明顯積冰。如果是在濃積雲中飛行,則會遇到非常強烈的顛簸,並且如果實在結冰高度層以上,會有明冰形成。濃積雲是雷暴的第一個階段。欄目推薦閱讀基礎知識 | 商用航空中最受歡迎的發動機——CFM56基礎知識 | 儀表著陸系統基礎知識 | 航向臺基礎知識 | 你所不知道的特技飛行運動基礎知識 | 飛機的主要組成部分及功能基礎知識 | 歸航臺(NDB)
  • 茶樹的一些基礎知識
    茶樹能忍耐的絕對最低溫度,因品種、樹齡、器官、栽培管理水平、生長季節而異如當氣溫降到-2℃時,茶花大部分脫落而死亡;氣溫下降到1-2℃時萌發的茶芽也會枯焦,而茶樹的枝梢忍耐低溫的能力較強,喬木型大葉種能忍耐-5℃左右;灌木型中、小葉種能忍受低溫的能力更強一些,一般在-10℃左右,若處於大雪覆蓋,則可忍受零下15℃左右的低溫侵襲。
  • 雷達傳感器的一些基礎知識
    數位化版本是計算範圍和確定目標的基礎。當目標移動時,會出現複雜情況。由於都卜勒效應,反射波的頻率會發生變化,因此IF頻率不僅取決於範圍,而且取決於目標的相對速度。為了解決歧義,自動雷達通常使用其信號處理器將都卜勒頻率與範圍頻率分開。通常的技術是發出幾個快速的rp聲,即a聲序列。
  • 關於手機中的一些基礎知識
    天線至天線開關 前面我已經談到了關於天線的一些知識,在天線至天線開關之間一般有幾個電感和電容,這部分元件是阻抗匹配電路,當然有的手機是沒有的。
  • 計算保持CSP LED冷卻所需的熱流量的一些基礎知識
    計算保持CSP LED冷卻所需的熱流量的一些基礎知識 李倩 發表於 2018-06-21 09:50:04 晶片尺寸封裝(CSP)LED技術並不新鮮,但在電視背光應用中已經使用了一段時間,但對於照明應用來說這是相對較新的
  • 電子基礎知識
    導讀:本文主要介紹的是電子基礎知識,電子零件種類繁多千差萬別,但主要可分二大類,一類稱之為被動元件,一類稱之為主動元件,被動元件包括電容、電阻、電感、晶振等;主動元件包括:集成電路、二三極體
  • 黃老師聊數學(214)微積分入門的一些基礎知識
    微分學。第一次知道球的體積和表面積的關係,圓的面積和周長之間的關係的時候,是多麼令人驚嘆!極限求面積,累加求和有技巧。積分的基本思想,極限為工具。
  • 電路基礎知識- -絕對夠基礎~
    導讀:本文所講述的都是電路的基礎知識,包括電路的定義、構成、分類、作用,電路的基本概念及歐姆定律、基爾霍夫電流定律、基爾霍夫電壓定律等,是廣大電路初學者進步的階梯
  • 電子元器件基礎知識
    本文就詳解電子元器件基礎知識,大神請飄過~~本文引用地址:http://www.eepw.com.cn/article/272107.htm  電阻,符號為R,單位為歐姆,是一種限流元件,表示導體對電流的阻礙作用的大小。可分為線繞電阻器、碳膜電阻器、保險電阻、敏感電阻器等等等等,其中敏感電阻器根據其敏感特性不同,又可分為壓敏電阻、光敏電阻、熱敏電阻等等。
  • 新手學電工基礎知識
    電工學習網:www.diangon.com 關注電工學習網官方微信公眾號「電工電氣學習」,收穫更多經驗知識。  《新手學電工基礎知識》全書共分7章,實戰演練26個。《新手學電工基礎知識》是作者在分析多種同類「電工基礎」上,以自己的親身教學經驗及國外電路教材和自學輔導書為主線而撰寫的。《新手學電工基礎知識》可作為愛好電工的初、中級讀者的自學參考書,也可作為農村電工、相關技能培訓班、家電售後維修人員的培訓和自學用書。
  • 公共基礎知識考什麼
    事業單位公共基礎知識考什麼1、馬克思主義哲學原理:7、語文基礎知識和公文寫作:漢字、詞彙、語法、修辭、文學常識,黨政機關公文基本知識、常用公文寫作、常用事務文書寫作、公文處理。8、經濟知識和科技知識:微觀經濟、宏觀經濟、國際經濟、金融經濟、產業經濟,科技創新、科學前沿、科技常識。
  • 花粉症的基礎知識
    花粉症的基礎知識北京同仁醫院 鼻過敏科 歐陽昱暉了解一些花粉過敏的知識,可以讓自己度過一個愉快舒適的春天。 花粉症的原因  花粉症,是由於植物的花粉作為過敏源引起的一系列過敏反應,包括連續打噴嚏、流眼淚、流鼻涕,鼻堵,鼻子眼睛發癢,咳嗽等。有明顯的季節性,常發生於春季3-4月及夏秋的8-9月。中國北方發病人數多,引起春季花粉症的主要來源是楊柳、榆、柏、白蠟、樺、松等樹木花粉。
  • 相對於經典力學而言,它需要的數學基礎少一些
    相對於經典力學而言,它需要的數學基礎少一些。所以,從以後找工作的話,專業性要求不如經典力學的專業,如果學校排名優秀或者有關係之類的,其實也還不錯,畢竟現在各大航空公司和研究所以及科研機構都十分看重專業。
  • 視界網|電磁鐵基礎知識介紹
    關於電磁鐵的基礎知識,總共分為四大部分,電磁鐵概論、電磁鐵典型結構、電磁鐵磁場方向判定、電磁鐵術語來講解,以下為小編對電磁鐵基礎知識的總結。以上就是給大家介紹的一些電磁鐵的基礎知識,希望對大家會有所幫助,大家也可以去更多的了解一下電磁鐵的作用,發現更多它可以應用的地方,讓人們的生活可以越來越方便。
  • lncRNA-seq數據分析之新lncRNA鑑定和注釋視頻課程眾籌
    前面我系統性的總結了:lncRNA的一些基礎知識 ,和lncRNA晶片的一般分析流程 ,還有LncRNA-seq的一般分析流程 ,裡面提到了一個目前非常小眾的分析方向
  • 私藏的一些C語言基礎知識點,需要的快看看吧
    C語言是學習其他大多數計算機語言的基礎,很多人認為學習C語言很難,其實只要懂得了C語言的基礎知識,C語言學習起來並不是很難,最近整理了有關計算機C語言的一些知識點,希望對C語言的基礎學者有些幫助="表示,沒有符號"< >",scanf函數的一般形式為scanf(格式控制,變量1地址,變量2地址,…),其中,格式字符串要與數據類型保持一致,所以格式字符串中應為%lf,後面應該為變量地址,所以需要加上符號"&",時間匆忙,有關的基礎知識下次將繼續發布,歡迎關注我哦!