假期快到了,對於許多熱愛學習的小夥伴來說,又是一個默默成長然後在春天驚豔所有人的絕佳機會。而我們的工作就是成就你的願望。
在年關將至的這幾天,小編會陸續為大家帶來一系列總結性的材料,希望對大家有用。還沒關注小編的趕緊點擊上方【密碼子實驗室】關注哦。
今天為大家帶來第二份禮!(往期內容查看公眾號獲取)
想要學習細菌基因組分析的小夥伴趕緊看過來。
細菌基因組分析最基礎、最核心的部分是獲得完整準確的組裝序列(包括染色體和質粒),其次進行組分分析,即通常所說的基因注釋、移動元件分析等,接下來可以根據研究目的選擇方法進行比較基因組研究,最後挖掘並關聯結果,解答科學問題,當然,過程中可能會涉及到實驗或其他組學方法。下面給大家整理了各分析模塊所需的軟體、資料庫,記得收藏哦。
1、序列質控
FastQC
用途:對Fastq文件的測序質量進行統計
優點:既可圖形化界面運行,又可命令行運行
下載地址:http://www.bioinformatics.babraham.ac.uk/projects/fastqc/
Seqprep
用途:去序列接頭
缺點:需要配置接頭序列
下載地址:https://github.com/jstjohn/SeqPrep
Sickle
用途:測序質量剪切
下載地址:https://github.com/najoshi/sickle
Smrtanalysis
用途:三代數據質控
下載地址:
https://s3.amazonaws.com/files.pacb.com/software/smrtanalysis/2.3.0/smrtanalysis_2.3.0.140936.run
Trimmomatic
用途:用於數據質控
下載地址:http://www.usadellab.org/cms/index.php?page=trimmomatic
2、基因組組裝
Celera Assembler
用途:對組裝結果進行序列成環判斷、基因組序列及質粒序列區分
下載地址:http://sourceforge.net/projects/wgs-assembler/files/wgs-assembler/wgs-8.3/
Flye
用途:ONT真菌精細圖組裝
優點:組裝效果很好,準確可靠
下載地址:https://github.com/fenderglass/Flye
GapCloser
用途:二代組裝結果中gap區域的填補
下載地址:https://sourceforge.net/projects/soapdenovo2/files/GapCloser/bin/r6/GapCloser-bin-v1.12-r6.tgz/download
GATK
下載地址:https://software.broadinstitute.org/gatk/
HGAP
用途:用於三代測序數據組裝
下載地址:https://programs.pacificbiosciences.com/e/1652/l-1652-2018-10-02-3y7d24/3y7d3d/535674923?h=84WaWkTsxWK_kzKnYXObNhuJzPkCJNLksE-0vt9JhEs
proovread2.12
用途:對組裝結果進行序列成環判斷、基因組序列及質粒序列區分
下載地址:https://github.com/BioInf-Wuerzburg/proovread
SMRT Analysis
用途:對組裝結果進行序列成環判斷、基因組序列及質粒序列區分
下載地址:https://github.com/PacificBiosciences/SMRT-Analysis/wiki/SMRT-Pipe-Reference-Guidev2.3.0
Unicycler
用途:ONT細菌完成圖組裝軟體
優點:二+三混合組裝,組裝效果很好,準確可靠
下載地址:ttps://github.com/rrwick/Unicycler
Velvet
用途:用於二代測序數據組裝
下載地址:https://www.ebi.ac.uk/~zerbino/velvet/
3、基因組質量評估
BUSCO
用途:評價基因組組裝質量
CheckM
用途:bins質量評估/基因組組裝質量評估
下載地址:https://github.com/Ecogenomics/CheckM
QUAST
用途:QUAST可直接統計fasta文件中的序列長度、GC含量、N50等指標,提供組裝結果的基本信息。若在評估時額外輸入另一個已存在的參考基因組,這時除了統計基本指標外,還會將組裝結果與參考序列進行比較,包括長度、GC含量、對齊程度等,為基因組的組裝質量評估提供更多的參考內容
下載地址:http://quast.bioinf.spbau.ru/
Bwa
用途:二代矯正
4、基因組組分分析
Augustus
用途:真菌基因預測
優點:從頭預測,能夠偵測在序列資料庫中缺少同源片段的編碼區
下載地址:http://augustus.gobics.de/
Barrnap
用途:rRNA預測
下載地址:https://github.com/tseemann/barrnap/archive/0.8.tar.gz
BLAST+
用途:多類資料庫注釋比較分析等
局限性:速度慢
下載地址:ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/2.3.0/ncbi-blast-2.3.0+-x64-linux.tar.gz
Blast2go
用途:GO注釋
局限性:依賴於mysql和NR注釋
CGView
用途:圈圖繪製
下載地址:http://wishart.biology.ualberta.ca/cgview/download.html
Circos
用途:圈圖繪製
地址:http://circos.ca/
CRISPRFinder
用途:預測crispr
地址:http://aclame.ulb.ac.be/Tools/Prophinder/
Cufflinks
用途:真菌基因預測
優點:基於轉錄組預測,輔助預測
下載地址:https://www.plob.org/tag/cufflinks/
Diamond
用途:多類資料庫注釋比較分析等
優點:速度快,將預測基因的蛋白序列與各功能資料庫進行Diamond 比對
下載地址:https://github.com/bbuchfink/diamond/releases/download/v0.8.35/diamond-linux64.tar.gz
Genewise
用途:真菌基因預測
優點:同源預測,預測同源片段的編碼基因
下載地址:https://www.ebi.ac.uk/Tools/psa/genewise/
Infernal
用途:RNA注釋
Islander
用途:基因組島預測
下載地址:https://bioinformatics.sandia.gov/islander/download.html
IslandPath-DIMOB
用途:基因組島預測
下載地址:http://www.pathogenomics.sfu.ca/islandviewer/
Minced
用途:CRISPR-Cas系統預測
下載地址:https://sourceforge.net/projects/minced/
Phage_Finder
用途:前噬菌體預測
下載地址:http://phage-finder.sourceforge.net/
PHAST
用途:預測前噬菌體
下載地址:http://phast.wishartlab.com/
Prokka
用途:基因預測
下載地址:https://github.com/tseemann/prokka
PromPredict
用途:啟動子預測
下載地址:http://nucleix.mbu.iisc.ernet.in/prompredict/download.html
RepeatMasker
用途:散在重複序列預測
Rfam cmsearch
用途:sRNA 預測
Tandem Repeats Finder
用途:串聯重複序列預測
下載地址:http://tandem.bu.edu/trf/trf.html
Tmhmm
用途:跨膜蛋白預測
下載地址:http://www.cbs.dtu.dk/services/software.php
TRF
用途:串聯重複序列分析
下載地址:https://tandem.bu.edu/trf/trf.download.html
antiSMASH
用途:次級代謝產物合成基因簇分析
下載地址:https://dl.secondarymetabolites.org/releases/4.0.2/antismash-4.0.2.tar.gz
HMMER
用途:蛋白結構比對分析
下載地址:http://eddylab.org/software/hmmer/hmmer-3.1b2.tar.gz
SignalP
用途:分泌蛋白預測
下載地址:http://www.cbs.dtu.dk/cgi-bin/sw_request?signalp+4.1
5、比較基因組分析
MUMmer
用途:SNP目標基因組和參考基因組比對
下載地址:http://mummer.sourceforge.net/
SSU-ALIGN
用途:多序列比對
下載地址:http://eddylab.org/software/ssu-align/
TrimAl
用途:比對位點提取
下載地址:https://sourceforge.net/projects/trimal/?source=navbar
IQ-TREE
用途:構建進化樹
下載地址:http://www.iqtree.org/#download
MAFFT
用途:多序列比對
下載地址:https://mafft.cbrc.jp/alignment/software/linux.html
MEGA
用途:構建進化樹
下載地址:https://www.megasoftware.net/
ModelFinder
用途:構樹模型選擇
下載地址:http://www.iqtree.org/#download
CD-hit
用途:泛基因組/基因家族分析
下載地址:https://github.com/weizhongli/cdhit/tree/V4.8.1
GET_HOMOLOGUS
用途:泛基因組/基因家族分析
下載地址:https://github.com/eead-csic-compbio/get_homologues/releases/tag/v3.2.3
MMseqs2
用途:泛基因組/基因家族分析
下載地址:https://mmseqs.com/latest/mmseqs-osx-avx2.tar.gz
OrthoFinder
用途:泛基因組/基因家族分析
優點:經典,引用量大
局限性:速度慢,常用於真核生物如植物比較基因組
下載地址:https://github.com/davidemms/OrthoFinder/releases/tag/2.3.7
OrthoMCL
用途:泛基因組/基因家族分析
局限性:速度慢,常用於真核生物如植物比較基因組
下載地址:https://orthomcl.org/common/downloads/software/v2.0/orthomclSoftware-v2.0.9.tar.gz
PGAP
用途:泛基因組/基因家族分析
下載地址:https://jaist.dl.sourceforge.net/project/pgap/PGAP-1.2.1/PGAP-1.2.1.tar.gz
Usearch
用途:泛基因組/基因家族分析
下載地址:http://www.drive5.com/usearch/
Circos
用途:共線性分析
下載地址:http://circos.ca/software/download/
Lastz
用途:indel/共線性/SV區域比對
優點:常用區域比對軟體
下載地址:http://www.bx.psu.edu/miller_lab/dist/README.lastz-1.02.00/README.lastz-1.02.00a.html
6、資料庫
CARD
用途:CARD_DB,以找到耐藥性相關基因的名稱,所耐受的抗生素種 類等信息
地址:https://card.mcmaster.ca/
COG
用途:COG資料庫,編碼蛋白系統進化關係
地址:http://www.ncbi.nlm.nih.gov/COG/
DFVF
用途:DFVF資料庫,真菌毒力因子資料庫,收集了來自85個屬的228個真菌菌株所產生的2058個致病基因
地址:https://academic.oup.com/database/article/doi/10.1093/database/bas032/436515
GO
用途:GO資料庫,一套國際標準化的基因功能描述的分類系統
地址:http://www.geneontology.org/
KOG
用途:KOG資料庫,針對真核生物的直系同源資料庫
地址:http://www.ncbi.nlm.nih.gov/COG/
P450
用途:P450資料庫,一類亞鐵血紅素—硫醇鹽蛋白的超家族
地址:http://p450.riceblast.snu.ac.kr/index.php?a=view
PHI
用途:PHI資料庫,病原與宿主互作資料庫
地址:http://www.phi-base.org/
TCDB
用途:TCDB資料庫,轉運蛋白分類資料庫
地址:https://www.researchgate.net/publication/33768103_TCDB_a_membrane_transport_protein_classification_database
7、分析工具包
CLC Genomics Workbench
用途:二代和三代基因組質控、拼接、注釋等
優點:無需編程,簡單易用,每季度進行更新
局限性:需要購買License
地址:https://digitalinsights.qiagen.com/
猜你喜歡
SnapGene viewer
微生物基因組公開課回放
1.細菌基因組測序方式:重測序、掃描圖、完成圖、轉錄組如何選擇
2.細菌基因組研究思路和案例分享
3.常見的比較基因組分析有哪些
5.PC電腦上如何繪製高水平的基因組圈圖?
6.如何使用BRIG繪製比較基因組圈圖?
7.如何通過BLAST軟體進行比較基因組分析?
8.BRIG高級使用與常見問題?