動植物基因組中存在著大量重複序列,根據這些序列的重複程度,可將它們分為簡單重複序列、中度重複序列和高度重複序列。簡單重複序列(Simple Sequence Repeat,SSR)亦稱微衛星DNA(microsatellite DNA),其在真核生物基因組中廣泛存在,一般是以1-6bp組成的較低程度的重複序列。
作為建立在PCR基礎上的第二代分子標記,對SSR多態性分析做的第一步工作是SSR引物設計,今天給大家介紹一種基於perl腳本,整合了簡單重複序列鑑定軟體MISA(MIcroSAtellite identification tool)和Primer3的批量SSR引物設計方法。
前方高能,老司機開車了,大家坐好,出發咯~
MISA是一個用perl語言寫的一個從fasta序列中鑑定SSR的腳本。下載地址:http://pgrc.ipk-gatersleben.de/misa/misa.html,分別下載Misa.pl和misa.ini,其中Misa.pl從fasta序列文件鑑定SSR,misa.ini為SSR鑑定參數,默認:
definition(unit_size,min_repeats):1-10 2-6 3-5 4-5 5-5 6-5
interruptions(max_difference_for_2_SSRs):100
參數說明:1個鹼基重複10次及10次以上;2個鹼基重複6次及6次以上;3個鹼基重複5次及5次以上;4個鹼基重複5次及5次以上;5個鹼基重複5次及5次以上;6鹼基重複5次及5次以上的鹼基重複序列算是微衛星序列。兩個微衛星之間的距離小於100bp的時候,兩個微衛星組成一個複合微衛星。
除了需要下載Misa腳本,還需要下載Primer3軟體,下載連結:https://sourceforge.net/projects/primer3/files/primer3/1.1.4/primer3-1.1.4-WINXP.zip/download;以及Primer3輸入文件和輸出文件格式處理腳本p3_in.pl、p3_out.pl,下載連結:http://pgrc.ipk-gatersleben.de/misa/primer3.html。
SSR引物批量設計步驟:
1.perl 在windows作業系統下的安裝:從http://www.activestate.com/ activeperl/中獲得適合不同進位windows版本的activeperl;按照默認安裝在C 盤根目錄下。
2.將Misa.pl、misa.ini以及序列文件(以Trinity_unigene.fasta為例)放在一起,運行指令:perl Misa.pl Trinity_unigene.fasta,產生結果文件Trinity_unigene.fasta.misa(以表格的形式列出微衛星的類型和位點)和Trinity_unigene.fasta.statistics(統計微衛星的類型和頻數)。
3.p3_in.pl,生成Primer3輸入文件,指令為:perl Trinity_unigene.fasta.misa,產生了一個名為Trinity_unigene.fasta.p3in的primer3輸入文件;
4.primer3後,複製Trinity_unigene.fasta.p3in文件到primer3\bin根目錄下,運行primer3_core.exe實現批量的引物設計,具體操作:cmd打開打開命令提示符;cd primer3-1.1.4-WINXP\bin進入軟體操作路徑;
5.指令 primer3_core.exe< Trinity_unigene.fasta.p3in >Trinity_unigene.fasta.p3out,產生一個名為Trinity_unigene.fasta.p3out的文件;
6.運行p3_out.pl,指令為:perl p3_out.pl Trinity_unigene.fasta.p3out Trinity_unigene.fasta.misa,運行後得到Trinity_unigene.fasta.results文件,此文件為最終結果文件。
今天的分析技能就講到這裡了,有問題或者想了解更多分析技能的小夥伴,可以留言給小編哦~
擴展閱讀:
微生物研究必知的6個知識點 | 16S專題
微生物實驗樣本獲取及製備指南(上篇) | 16S專題
微生物實驗樣本獲取及製備指南(下篇) | 16S專題
16S rDNA測序如何鑑定微生物到種 | 16S專題
想即時獲取專題更新嗎?
想了解更多精彩資訊嗎?
想擁有更多乾貨嗎?
掃一掃二維碼,
關注「聯川生物」就能實現~