啟動子序列提取-EPD真核生物啟動子資料庫!

2021-01-18 組學大講堂

基因結構有很多概念,經常會把我們繞暈,之前小編給大家整理過mRNA、CDS、ORF等概念知識(感興趣的點擊查看:CDS、cDNA、ORF等等傻傻分不清);今天我們再補充一些概念性知識及著重說下啟動子以及啟動子序列查找方法。

基礎概念

1. 啟動子(Promoter):啟動子是RNA 聚合酶識別、結合和開始轉錄的一段DNA 序列,它含有RNA 聚合酶特異性結合和轉錄起始所需的保守序列,多數位於結構基因轉錄起始點的上遊,啟動子本身不被轉錄。所以一般所說的啟動子是DNA序列上的結構,在mRNA、cDNA中它是不存在;但是也有一些例外,如tRNA啟動子就位於轉錄起始點的下遊,這些DNA序列是可以被轉錄的,只能說啟動子一般位於轉錄起始位點的上遊。

2. 轉錄組起始點(TSS):是指與新生RNA鏈第一個核苷酸相對應的DNA鏈上的鹼基,通常為一個嘌呤(A 或G),即5』UTR的上遊第一個鹼基;注意轉錄起始點和起始密碼子的區別。

3. 起始密碼子和終止密碼子:mRNA的開放閱讀框架中,每3個相鄰的核苷酸編碼一種胺基酸,這種存在於mRNA開放閱讀框架區的三聯體形式的核苷酸序列稱為密碼子(codon);由A、U、C、G四種核苷酸可組成64個密碼子,其中有61個密碼子可編碼胺基酸。AUG既編碼甲硫氨酸,又作為多肽鏈合成的起始信號,作為起始信號的密碼子稱為起始密碼子;而終止翻譯的密碼子稱為終止密碼子,包含3個:UAG、UAA、UGA。

4. UTR區:UTR(Untranslated Region),即非翻譯區;在分子遺傳學中,是指任意一個位於mRNA鏈編碼序列兩端的片段;如果其位於5′端,則稱為5′非翻譯區(5'-untranslated region,5'-UTR)(或"前導序列,leader"),反之若位於3′端,則稱為3′非翻譯區(3'-untranslated region,3'-UTR)(或"尾隨序列,trailer")。儘管它們被稱為"非翻譯區",並且不是構成該基因的蛋白質編碼區,但在5′非翻譯區內的上遊可讀框可以被翻譯成多肽。

5. 5'帽子(cap):真核生物mRNA的5'端有特殊的帽子(cap)結構,它由甲基化鳥苷酸經焦磷酸與mRNA的5'末端核苷酸相連,形成5',5'-三磷酸連接(5',5'-triphosphate linkage);這種結構有抗5'-核酸外切酶的降解作用;在蛋白質合成過程中,它有助於核糖體對mRNA的識別和結合,使翻譯得以正確起始。

6. PolyA尾巴:真核生物mRNA尾部特有的150-200個腺苷酸殘基,保護mRNA,免受核酸外切酶攻擊,並且對轉錄終結、將mRNA從細胞核輸出及進行翻譯都十分重要;PolyA尾巴是mRNA轉錄後修飾加上去的,DNA基因序列中是不存在的,經mRNA反轉錄出的cDNA是有PolyA結構的。

7.  CDS與ORF:這是一個經常被人混淆的兩個概念;CDS是Coding sequence的縮寫,是指編碼一段蛋白產物的序列,是與蛋白質密碼子一一對應的序列,注意其與mRNA序列的差異;ORF是open reading frame的縮寫,翻譯成開放閱讀框,是指從一個起始密碼子開始到一個終止密碼子結束的一段序列,但並不是所有ORF都能表達出蛋白產物,但CDS必定是一個ORF,但也可能包括多個ORF,相反,每個ORF不一定都是CDS。

DNA/mRNA結構示意圖

啟動子序列的查找

在實際生信分析中,一般取轉錄組起始位置前1500-2000bp作為啟動子區域序列,擁有生信技能的人提取及批量提取某些基因啟動子序列簡直就是小菜一碟;但是對於生信小白來說就難上青天了;不過還有一些在線資料庫是可供我們查找提取啟動子序列之用,常見的比如NCBI,ensembl,UCSC 等等;但小編覺得那些都不怎麼好用,上周我們其實給大家分享過一個非常好用的植物啟動子分析資料庫PlantPAN3.0,簡單好用,功能非常強大,感興趣點此連結查看:植物啟動子分析網站PlantPAN3.0-不可或缺的基因表達調控資料庫!;今天我再跟大家分享一個小巧好用的真核生物啟動子資料庫:The eukaryotic promoter database(EPD)。

EPD資料庫操作演示

EPD 是一個非冗餘的真核啟動子資料庫,其轉錄起始位點已經通過實驗驗證。該資料庫包含來自十餘種物種的啟動子序列信息(如下圖),界面友好,操作簡單,適合小白操作學習。

1. EPD界面非常簡單,如下圖所示可在是檢索框輸入基因ID或者基因名(gene symbol),再選擇物種,點擊search即可,我們以擬南芥基AT1G66550為例。

2. 有時候會檢索出多個基因,選擇自己感興趣的即可,示例數據僅一個檢索結果,直接給出了啟動子序列信息頁面,如下圖,可在Sequence Retrieval Tool 下設置啟動子序列提取範圍,一般轉錄組起始點前1500-2000bp,設置好點擊右側的GET SEQL即可;還可以在Search Motif Tool項下預測TATA-box等順式作用元件。


3. 下圖是提取好的啟動子序列及預測的順式作用元件,不過小編覺得順式作用元件繪圖很是難看,我們完全可以用提取的序列用其他軟體去繪圖,順式作用元件預測及繪圖操作教程見連結:充電課-順式作用元件分析(基礎知識及預測)和收藏貼-順式作用元件分布圖繪製。

好了,這樣啟動子序列就提取好了,你get到了嗎?最後奉上EPD資料庫網址:https://epd.epfl.ch//index.php

延伸閱讀:

1.植物代謝通路注釋+基因表達可視化神器--Mapman

2.收藏貼-基因/蛋白功能注釋、富集分析在線工具詳解

3. 如何下載基因組及查找基因

4. CDS、cDNA、ORF等等傻傻分不清

5. qRT-PCR相對定量計算詳解

6. 繪一棵超酷炫的系統發育樹!

7. 2020年1-4月100+篇基因家族分析文獻信息免費領取

8. 100個接收基因家族分析類文獻的期刊匯總!速領!

9. 2020年轉錄組文章到底有多難發?一文說明白!

10. 生物信息軟體安裝解決方案-docker虛擬化技術

11. 充電課-(適合小白自學生信)《Linux生信分析環境搭建Bio-linux》

12. 充電課-限時免費領取《癌症TCGA-文章套路解析》

13. 充電課-免費領取《illumina測序原理及Fastq文件解讀》視頻課程

14. 充電課-限時免費領取《基因家族分析詳解課程》

相關焦點

  • 真核生物的啟動子與轉錄起始
    按照慣例,真核生物的啟動子更加複雜。真核生物有三種RNAP,所以有相應的三類啟動子。RNAP I負責轉錄rRNA,對應的是I類(class I)啟動子,由核心啟動子(-45至+20)和上遊控制元件(-180至-107)構成。
  • 真核生物的啟動子與轉錄起始
    按照慣例,真核生物的啟動子更加複雜。真核生物有三種RNAP,所以有相應的三類啟動子。RNAP I負責轉錄rRNA,對應的是I類(class I)啟動子,由核心啟動子(-45至+20)和上遊控制元件(-180至-107)構成。小RNA對應的III類啟動子又有3種類型,其中5 S rRNA基因和tRNA基因的啟動子都屬於下遊啟動子,即位於轉錄起點下遊。
  • 原核生物的啟動子與轉錄起始過程
    對於轉錄起始的調控,啟動子是最重要的調控元件。啟動子(promoter)是RNA聚合酶識別、結合以開始轉錄的DNA序列。啟動子對基因的表達非常重要,可以決定基因在什麼組織、什麼生長階段或什麼條件下表達,也可以決定表達的頻率等。強啟動子平均2秒鐘啟動一次轉錄,而弱啟動子需要10分鐘以上。
  • 啟動子的查找與序列分析-Follow me!
    無論是基因的時空表達譜還是基因表達調控都是由啟動子決定的,因此研究基因的轉錄調控就離不開對啟動子的研究。對啟動子的基本研究過程大致為:查找啟動子序列-分析啟動子序列-啟動子序列克隆與活性驗證。      一、查找啟動子序列       有參考基因組的物種,可以直接利用基因組資料庫查找啟動子序列。沒有參考基因組的物種只能利用移步法對啟動子進行克隆,本文暫不討論。在基因組上,大多數相鄰基因之間的區域短於2 kb,因此對啟動子的研究一般也限於2 kb的範圍。
  • 尋找啟動子的三種方法.
    計算啟動子區域啟動子區域一般位於基因上遊的2000bp或者下遊的1000bp(保守一些的話可以縮短到下遊500bp),此處我們查詢上遊2000bp。對於啟動子計算正義鏈上:小的數字-2000反義鏈上:大的數字+2000在change region shown中的selected region輸入我們上步計算的啟動子區域
  • 真核RNA聚合面目不能單獨識別和結合啟動子
    它們是一類與靶基因啟動子和增強子特異結合的轉錄因子,具有細胞及基因特異性.可以增強或抑制靶基因的轉錄。第三類是輔調節因子,它們往往在轉錄因子和前DNA復刺起始複合體之間形成橋梁作用,還可以改變局部染色質的構象,對基因轉錄的起始具有推動作用。
  • Nature亮點 |下遊核心啟動子區域是真實存在的嗎?
    經過數十年的研究(詳見BioArt報導:致敬Robert Roeder & 紀念真核生物RNA聚合酶發現50周年——轉錄調控研究簡史),人們已經知道,在原核和真核生物中,基因轉錄水平的決定因素都包括順式調控元件
  • 啟動子克隆方法研究進展(1)
    而近年來又有許多改進的克隆啟動子的方法獲得了多方面的成功,本文就近年來改進的啟動子克隆方法作一綜述,以期促進對啟動子分離技術的應用。  當插入段同時滿足(1)具有基因啟動子序列;(2)具有翻譯啟始區;(3)具有啟始密碼子;(4)插入方向正確;(5)插入片段3'端編碼區序列抗性基因編碼區讀碼框一致,則有可能形成有功能的抗性融合基因,從而啟動抗性基因的表達。   最早由Rachael等在大腸桿菌中以四環素抗性基因作為報告基因構建了啟動子探針質粒pBRH3B,並克隆了一些原核和真核啟動子片段。
  • 顧秀林:農桿菌,基因槍,35S啟動子——顧秀林的轉基因科普 
    顧秀林:農桿菌,基因槍,35S啟動子——顧秀林的轉基因科普 再貼幾段來自《扭曲的真相》一書的譯文。看了生物科學家講的真故事,誰再相信「轉基因讓它有害就有害,讓它無害就無害」?抱定轉基因無害論、繼續推動中共中央國務院的轉基因重大專項,那不就是民族自裁嗎?
  • 除真核細胞病毒外,基因是連續的,即不含內含子序列
    重複頻率也不盡相同;高度重複序列重複頻率可達106次,包括衛星DNA、反向重複序列和較複雜的重複單位組成的重複序列;中度重複序列可達103~104次,如為數眾多的Alu家族序列,KpnI家族,Hinf家族序列,以及一些編碼區序列如rRNA基因、tRNA基因、組蛋白基因等;單拷貝或低度重複序列,指在整個基因組中只出現一次或很少幾次的核苷酸序列,主要是編碼蛋白質的結構基因,在人基因組中佔約60~65%,
  • Nature:轉錄輔助因子對不同類型的核心啟動子具有特異性
    2019年5月26日訊/生物谷BIOON/---轉錄輔助因子(transcriptional cofactor, COF)在增強子與啟動子之間傳遞調控線索,是轉錄激活和基因表達的核心效應物。雖然已證實某些COF比其他COF更偏好某些啟動子類型,但是不同COF對不同啟動子顯示出的內在特異性的程度尚不清楚。
  • Nat Microbiol | 真核系統基因迴路的自動化設計
    這是實現計算機輔助設計基因迴路的基礎,並且用相似策略實現非模式原核生物——擬桿菌(一種腸道主要定殖菌)的基因迴路的自動化設計【7】。然而,相同的策略卻不能直接應用於真核生物,進而團隊將Cello架構升級為Cello 2.0,以適應更多場景的應用。
  • 啟動子克隆方法研究進展(4)
    近年來由IJiu等設計的TAIL-PCR(Termal Asymmetric Interlaced PCR)又叫熱不對稱交錯PCR,則解決了這個問題,後來有研究表明,經改良過的TAIL-PCR成功地從突變體中克隆到外源插入基因的旁側序列,從而為啟動子的克隆提供了有效的新方法
  • 真核基因表達以正性調控為主導
    換言之,真核基因表達以正性調控為主導,真核生物基因大部分是正調節機制的主要原因是染色質內儲存的DNA使大部分啟動子具有不可接觸性,因此,在其他調節作用不在的時候基因總是沉默的。另些採收正調節的原因是真核基因組太大及正調節作用更同單,高效。
  • 【收藏版】生物信息學資料庫大全
    http://www.dna.affrc.go.jp/~nakamura/CUTG.html  http://www.kazusa.or.jp/codon/  http://www.dna.affrc.go.jp/~nakamura/CUTG.html  ★EPD,真核生物啟動子資料庫(Eukaryotic Promotor Database)。
  • 生物信息學資料庫大全
    http://www.dna.affrc.go.jp/~nakamura/CUTG.html  http://www.kazusa.or.jp/codon/  http://www.dna.affrc.go.jp/~nakamura/CUTG.html  ★EPD,真核生物啟動子資料庫(Eukaryotic Promotor Database)。
  • 啟動子克隆方法研究進展(2)
    先用小量法提取轉基因水稻的總DNA,總DNA用10倍過量的限制內切酶進行過夜酶切,酶切片段進行自連接,然後根據工程質粒的T-DNA區設計2對反向引物,進行套式PCR擴增旁側序列。建立了適合於處理大量材料的克隆轉基因水稻中外源基因旁側序列的技術體系。
  • 利用定點突變分析白念珠菌依賴鐵基因FRP1啟動子元件 - 中科院微...
    , CAS & CSM, All rights reserved桂磊, 梁勇, 魏東盛, 鄭雯, 邢來君, 李明春南開大學微生物學系 分子微生物學與技術教育部重點實驗室, 天津 300071摘  要: 通過對白念珠菌高鐵還原酶基因FRP1啟動子進行突變分析, 確認啟動子中特殊調控元件。
  • Nature:啟動子和增強子上組蛋白修飾分布圖
    專題:Nature報導對於啟動子、增強子和其他DNA調控元素在決定細胞類型特異性基因表達中的相對作用,研究人員還很不了解。現在,一種基於染色質-免疫沉澱反應的微陣列(ChIP-晶片)方法,被用來生成在幾個不同人類細胞系中的啟動子和增強子上的組蛋白修飾分布圖。啟動子上的修飾分布模式被發現在不同細胞類型之間基本不變,而在大部分增強子上的修飾分布模式則對某一種細胞類型有特異性,並且與細胞類型特異性基因表達有關。
  • Spt5介導的增強子轉錄直接偶聯增強子激活與啟動子相互作用
    Spt5介導的增強子轉錄直接偶聯增強子激活與啟動子相互作用 作者:小柯機器人 發布時間:2020/4/13 12:41:01 近日,奧地利分子病理研究所Rushad Pavri課題組發現,Spt5