本文授權轉載自:諾禾生信
剪接(Splicing,又稱拼接),是一種基因重組現象,在分子生物學中,主要是指細胞核內基因信息在轉錄過程中或是轉錄後的一種修飾,即將內含子移除及合併外顯子——內含子與外顯子的名稱是通用於編碼基因的DNA及其轉錄後的RNA——是真核生物的信使RNA前體(precursor messenger RNA)變成成熟mRNA的過程之一。
前體RNA變為成熟RNA的過程中發生可變剪切,在剪接識別位點發生的插入、缺失和鹼基改變可能會導致剪接位點的改變。
GeneSplicer主要是針對擬南芥開發的,同時有網頁版和Linux版。它需要待分析物種的training data,對於擬南芥、人、果蠅、水稻、瘧原蟲已經有training data,對於其他想分析的物種則需要自己使用他們提供的程序自己創建。
基於sequence作預測
http://www.cs.jhu.edu/~genomics/GeneSplicer/gene_spl.html
MaxEndScan主要用於human剪切位點強弱的計算,同時有網頁版和可下載至本地的Perl程序。輸入序列可以是單條sequence,也可以是保存在文件中的多條sequence。預測5'剪切位點強度需要的每條序列的長度是9bp (3 bases in exon and 6 bases in intron),預測3』剪切位點強度需要的每條序列的長度是23bp (20 bases in intron and 3 bases in exon)。
基於sequence作預測
預測5'剪切位點
http://genes.mit.edu/burgelab/maxent/Xmaxentscan_scoreseq.html
預測3'剪切位點
http://genes.mit.edu/burgelab/maxent/Xmaxentscan_scoreseq_acc.html
Python轉化
https://github.com/kepbod/maxentpy
Human Splicing Finder(HSF)
HSF除了可以splice site score計算之外還可以進行轉錄本剪切位點預測、branch site預測等。而且可以直接分析mutation位點對於splice site或者branch point的影響。
在疾病分析的研究當中,我們更需要這種可以直接針對mutation位點預測splicing impact的功能。
http://www.umd.be/HSF3/technicaltips.html
接下來,小編帶大家一起在Human Splicing Finder做一下基於snp位點的splicing site預測
以NRG1基因的ENST00000520407 exon1:c.C633T 突變為例,按如下模式輸入基因名稱、轉錄本、變異方式:
結果:
這裡是檢出了有splicing impact的結果。
下面再介紹一種用序列預測的方式:
此處輸入基因名稱和關注的Exon number
選擇變異的具體形式,此處選擇將224位的T突變為G(原來是T突變為G,可以手動輸入)
結果:該突變沒有顯著的splicing impact。
/End.
生信者言推薦閱讀
點擊下方圖片即可閱讀
喜馬拉雅FM搜索並訂閱:生信者言;收聽內容:
《一分鐘聽懂NGS基礎概念》,讓生信分析不再遙不可及
《親愛的姑娘,你值得被溫柔以待》,11個真實的人物故事
《眾病之王:癌症傳》,一起聆聽人類對抗癌症的鬥爭史
回復文字:果然科學,看一篇好玩的科普文。