新年成長禮2|細菌基因組分析常用軟體整理(含下載連結)

2021-02-26 密碼子實驗室

   假期快到了,對於許多熱愛學習的小夥伴來說,又是一個默默成長然後在春天驚豔所有人的絕佳機會。而我們的工作就是成就你的願望。

在年關將至的這幾天,小編會陸續為大家帶來一系列總結性的材料,希望對大家有用。還沒關注小編的趕緊點擊上方【密碼子實驗室】關注哦。

 

今天為大家帶來第二份禮!(往期內容查看公眾號獲取)

想要學習細菌基因組分析的小夥伴趕緊看過來。

細菌基因組分析最基礎、最核心的部分是獲得完整準確的組裝序列(包括染色體和質粒),其次進行組分分析,即通常所說的基因注釋、移動元件分析等,接下來可以根據研究目的選擇方法進行比較基因組研究,最後挖掘並關聯結果,解答科學問題,當然,過程中可能會涉及到實驗或其他組學方法。下面給大家整理了各分析模塊所需的軟體、資料庫,記得收藏哦。

1、序列質控

FastQC

用途:對Fastq文件的測序質量進行統計

優點:既可圖形化界面運行,又可命令行運行

下載地址:http://www.bioinformatics.babraham.ac.uk/projects/fastqc/

Seqprep

用途:去序列接頭

缺點:需要配置接頭序列

下載地址:https://github.com/jstjohn/SeqPrep

Sickle

用途:測序質量剪切

下載地址:https://github.com/najoshi/sickle

Smrtanalysis

用途:三代數據質控

下載地址:

https://s3.amazonaws.com/files.pacb.com/software/smrtanalysis/2.3.0/smrtanalysis_2.3.0.140936.run

Trimmomatic

用途:用於數據質控

下載地址:http://www.usadellab.org/cms/index.php?page=trimmomatic

2、基因組組裝

Celera Assembler

用途:對組裝結果進行序列成環判斷、基因組序列及質粒序列區分

下載地址:http://sourceforge.net/projects/wgs-assembler/files/wgs-assembler/wgs-8.3/

Flye

用途:ONT真菌精細圖組裝

優點:組裝效果很好,準確可靠

下載地址:https://github.com/fenderglass/Flye

GapCloser

用途:二代組裝結果中gap區域的填補

下載地址:https://sourceforge.net/projects/soapdenovo2/files/GapCloser/bin/r6/GapCloser-bin-v1.12-r6.tgz/download

GATK

下載地址:https://software.broadinstitute.org/gatk/

HGAP

用途:用於三代測序數據組裝

下載地址:https://programs.pacificbiosciences.com/e/1652/l-1652-2018-10-02-3y7d24/3y7d3d/535674923?h=84WaWkTsxWK_kzKnYXObNhuJzPkCJNLksE-0vt9JhEs

proovread2.12

用途:對組裝結果進行序列成環判斷、基因組序列及質粒序列區分

下載地址:https://github.com/BioInf-Wuerzburg/proovread

SMRT Analysis

用途:對組裝結果進行序列成環判斷、基因組序列及質粒序列區分

下載地址:https://github.com/PacificBiosciences/SMRT-Analysis/wiki/SMRT-Pipe-Reference-Guidev2.3.0

Unicycler

用途:ONT細菌完成圖組裝軟體

優點:二+三混合組裝,組裝效果很好,準確可靠

下載地址:ttps://github.com/rrwick/Unicycler

Velvet

用途:用於二代測序數據組裝

下載地址:https://www.ebi.ac.uk/~zerbino/velvet/

3、基因組質量評估

BUSCO

用途:評價基因組組裝質量

CheckM

用途:bins質量評估/基因組組裝質量評估

下載地址:https://github.com/Ecogenomics/CheckM

QUAST

用途:QUAST可直接統計fasta文件中的序列長度、GC含量、N50等指標,提供組裝結果的基本信息。若在評估時額外輸入另一個已存在的參考基因組,這時除了統計基本指標外,還會將組裝結果與參考序列進行比較,包括長度、GC含量、對齊程度等,為基因組的組裝質量評估提供更多的參考內容

下載地址:http://quast.bioinf.spbau.ru/

Bwa

用途:二代矯正

4、基因組組分分析

Augustus

用途:真菌基因預測

優點:從頭預測,能夠偵測在序列資料庫中缺少同源片段的編碼區

下載地址:http://augustus.gobics.de/

Barrnap

用途:rRNA預測

下載地址:https://github.com/tseemann/barrnap/archive/0.8.tar.gz

BLAST+

用途:多類資料庫注釋比較分析等

局限性:速度慢

下載地址:ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/2.3.0/ncbi-blast-2.3.0+-x64-linux.tar.gz

Blast2go

用途:GO注釋

局限性:依賴於mysql和NR注釋

CGView

用途:圈圖繪製

下載地址:http://wishart.biology.ualberta.ca/cgview/download.html

Circos

用途:圈圖繪製

地址:http://circos.ca/

CRISPRFinder

用途:預測crispr

地址:http://aclame.ulb.ac.be/Tools/Prophinder/

Cufflinks

用途:真菌基因預測

優點:基於轉錄組預測,輔助預測

下載地址:https://www.plob.org/tag/cufflinks/

Diamond

用途:多類資料庫注釋比較分析等

優點:速度快,將預測基因的蛋白序列與各功能資料庫進行Diamond 比對

下載地址:https://github.com/bbuchfink/diamond/releases/download/v0.8.35/diamond-linux64.tar.gz

Genewise

用途:真菌基因預測

優點:同源預測,預測同源片段的編碼基因

下載地址:https://www.ebi.ac.uk/Tools/psa/genewise/

Infernal

用途:RNA注釋

Islander

用途:基因組島預測

下載地址:https://bioinformatics.sandia.gov/islander/download.html

IslandPath-DIMOB

用途:基因組島預測

下載地址:http://www.pathogenomics.sfu.ca/islandviewer/

Minced

用途:CRISPR-Cas系統預測

下載地址:https://sourceforge.net/projects/minced/

Phage_Finder

用途:前噬菌體預測

下載地址:http://phage-finder.sourceforge.net/

PHAST

用途:預測前噬菌體

下載地址:http://phast.wishartlab.com/

Prokka

用途:基因預測

下載地址:https://github.com/tseemann/prokka

PromPredict

用途:啟動子預測

下載地址:http://nucleix.mbu.iisc.ernet.in/prompredict/download.html

RepeatMasker

用途:散在重複序列預測

Rfam  cmsearch

用途:sRNA 預測

Tandem Repeats Finder

用途:串聯重複序列預測

下載地址:http://tandem.bu.edu/trf/trf.html

Tmhmm

用途:跨膜蛋白預測

下載地址:http://www.cbs.dtu.dk/services/software.php

TRF

用途:串聯重複序列分析

下載地址:https://tandem.bu.edu/trf/trf.download.html

antiSMASH

用途:次級代謝產物合成基因簇分析

下載地址:https://dl.secondarymetabolites.org/releases/4.0.2/antismash-4.0.2.tar.gz

HMMER

用途:蛋白結構比對分析

下載地址:http://eddylab.org/software/hmmer/hmmer-3.1b2.tar.gz

SignalP

用途:分泌蛋白預測

下載地址:http://www.cbs.dtu.dk/cgi-bin/sw_request?signalp+4.1

5、比較基因組分析

MUMmer

用途:SNP目標基因組和參考基因組比對

下載地址:http://mummer.sourceforge.net/

SSU-ALIGN

用途:多序列比對

下載地址:http://eddylab.org/software/ssu-align/

TrimAl

用途:比對位點提取

下載地址:https://sourceforge.net/projects/trimal/?source=navbar

IQ-TREE

用途:構建進化樹

下載地址:http://www.iqtree.org/#download

MAFFT

用途:多序列比對

下載地址:https://mafft.cbrc.jp/alignment/software/linux.html

MEGA

用途:構建進化樹

下載地址:https://www.megasoftware.net/

ModelFinder

用途:構樹模型選擇

下載地址:http://www.iqtree.org/#download

CD-hit

用途:泛基因組/基因家族分析

下載地址:https://github.com/weizhongli/cdhit/tree/V4.8.1

GET_HOMOLOGUS

用途:泛基因組/基因家族分析

下載地址:https://github.com/eead-csic-compbio/get_homologues/releases/tag/v3.2.3

MMseqs2

用途:泛基因組/基因家族分析

下載地址:https://mmseqs.com/latest/mmseqs-osx-avx2.tar.gz

OrthoFinder

用途:泛基因組/基因家族分析

優點:經典,引用量大

局限性:速度慢,常用於真核生物如植物比較基因組

下載地址:https://github.com/davidemms/OrthoFinder/releases/tag/2.3.7

OrthoMCL

用途:泛基因組/基因家族分析

局限性:速度慢,常用於真核生物如植物比較基因組

下載地址:https://orthomcl.org/common/downloads/software/v2.0/orthomclSoftware-v2.0.9.tar.gz

PGAP

用途:泛基因組/基因家族分析

下載地址:https://jaist.dl.sourceforge.net/project/pgap/PGAP-1.2.1/PGAP-1.2.1.tar.gz

Usearch

用途:泛基因組/基因家族分析

下載地址:http://www.drive5.com/usearch/

Circos

用途:共線性分析

下載地址:http://circos.ca/software/download/

Lastz

用途:indel/共線性/SV區域比對

優點:常用區域比對軟體

下載地址:http://www.bx.psu.edu/miller_lab/dist/README.lastz-1.02.00/README.lastz-1.02.00a.html

6、資料庫

CARD

用途:CARD_DB,以找到耐藥性相關基因的名稱,所耐受的抗生素種 類等信息

地址:https://card.mcmaster.ca/

COG

用途:COG資料庫,編碼蛋白系統進化關係

地址:http://www.ncbi.nlm.nih.gov/COG/

DFVF

用途:DFVF資料庫,真菌毒力因子資料庫,收集了來自85個屬的228個真菌菌株所產生的2058個致病基因

地址:https://academic.oup.com/database/article/doi/10.1093/database/bas032/436515

GO

用途:GO資料庫,一套國際標準化的基因功能描述的分類系統

地址:http://www.geneontology.org/

KOG

用途:KOG資料庫,針對真核生物的直系同源資料庫

地址:http://www.ncbi.nlm.nih.gov/COG/

P450

用途:P450資料庫,一類亞鐵血紅素—硫醇鹽蛋白的超家族

地址:http://p450.riceblast.snu.ac.kr/index.php?a=view

PHI

用途:PHI資料庫,病原與宿主互作資料庫

地址:http://www.phi-base.org/

TCDB

用途:TCDB資料庫,轉運蛋白分類資料庫

地址:https://www.researchgate.net/publication/33768103_TCDB_a_membrane_transport_protein_classification_database

7、分析工具包

CLC Genomics Workbench

用途:二代和三代基因組質控、拼接、注釋等

優點:無需編程,簡單易用,每季度進行更新

局限性:需要購買License

地址:https://digitalinsights.qiagen.com/

 

 猜你喜歡

SnapGene viewer

微生物基因組公開課回放

    1.細菌基因組測序方式:重測序、掃描圖、完成圖、轉錄組如何選擇

    2.細菌基因組研究思路和案例分享

    3.常見的比較基因組分析有哪些

    5.PC電腦上如何繪製高水平的基因組圈圖?

    6.如何使用BRIG繪製比較基因組圈圖?

    7.如何通過BLAST軟體進行比較基因組分析?

    8.BRIG高級使用與常見問題?

 

相關焦點

  • 材料、化學領域常用的十六大繪圖軟體(部分附下載連結)
    原標題:材料、化學領域常用的十六大繪圖軟體(部分附下載連結) 1 ATOMS 2 Hyperchem 軟體介紹: Hyperchem是一款以高質量、靈活
  • 細菌比較基因組分析,這樣做更有效
    疫情期間,為支持大家在特殊時期更好地充電學習,同時積極響應國家防控疫情的號召,華大基因學院特推出「遠程講解+面授實操」的全新培訓模式開設細菌比較基因組分析實戰培訓。目前線上直播課程已順利結束,通過遠程直播課程使大家對細菌基因組研究趨勢、常用分析方法與流程有了系統全面的了解。
  • 2019微生物組—宏基因組分析專題培訓第三期
    從Linux和R基礎、宏基因組Linux伺服器分析平臺搭建、Windows常用統計分析軟體、數據分析圖表解讀和實戰、宏基因組有參(Reference-based適合人類、動物腸道等)和無參(De novo適合植物、環境樣本等)標準分析流程、Binning(挖掘單菌基因組)、統計分析以及各類高級分析(多基因連接進化樹、網絡圖繪製和美化、網絡屬性比較、機器學習等),和CNS級圖片修改排版。
  • 靶基因預測分析已上線
    為此我們特地推出在線靶基因預測雲分析,幫老師排憂解難!(雲平臺地址:https://www.omicstudio.cn/analysis/target_gene/create?(點擊下載圖標),按照示例數據整理文件。
  • 細菌基因組信息分析與解讀專題系列(二)——細菌基因組注釋Ⅰ(基因預測和ncRNA)
    細菌基因組通過測序平臺測序以及經過相應的組裝之後,便獲得了基因組的序列。
  • NCBI微生物基因組批量下載
    不要哭,今天小編就為大家提供幾個批量下載某物種或特定物種基因組並獲取基因組預測及注釋信息的方法。/genomes/genbank/(3) ftp://ftp.ncbi.nlm.nih.gov/genomes/refseq/2、通過軟體Filezila批量獲取:將FTP地址輸入Filezila軟體中,點擊快速連結,即可批量將數據導入個人電腦。
  • 使用BioNumerics軟體批量下載NCBI中基因序列
    使用BioNumerics軟體批量下載NCBI中基因序列大家可能曾經都被如何批量下載NCBI中的數據所困擾,在NCBI的網站上苦苦搜尋,但是無從下手。本文將介紹如何通過BioNumerics軟體實現基因序列的批量下載。
  • 這幾本生信入門書籍你不能不知,附下載連結
    基因組學相關的書籍:                                                                   基因組學概論這本書比較全面系統的介紹了  DNA、蛋白質序列和結構、基因組、蛋白質組、轉錄組和系統生物學內容,也分別對原核生物
  • 產Macrolactins的海洋細菌X-2中Ⅰ型PKS基因簇的篩選鑑定與功能分析
    微生物學通報 SEP 20, 2008, 35(9): 1367~1372產Macrolactins的海洋細菌X-2中Ⅰ型PKS基因簇的篩選鑑定與功能分析董曉毅 王梁華 孫銘娟 宗英 焦豫良 焦炳華(中國人民解放軍第二軍醫大學基礎醫學部生物化學與分子生物學教研室  上海  200433)摘  要: Macrolactins
  • 常用生物學軟體的安裝與應用(四)—MEGA
    在做功能基因組學研究時,經常會用到多序列比對,其主要用於描述一組序列之間的相似性關係,以便對一個基因家族的特徵有一個簡明扼要的了解
  • 9文聚焦:宏基因組學與微生物組分析方法和工具
    ,同時強調了宏基因組學數據分析的挑戰;③ 鑑於與模式生物相比,環境細菌功能資料庫的缺乏以及異質環境樣品中宏基因組組裝和定量的技術難度,功能注釋仍面臨重大挑戰;④ 使用多種技術平臺的數據整合將使人們更好地了解如何利用宏基因組技術。
  • 全基因組複製基因分析軟體DupGen finder
    根據複製原因和結果,可以分為下面幾種情況:1.基因組複製加倍事件,即WGD,2.串聯重複,因為複製滑動等原因,3.臨近重複,同源交換滑動,或者串聯重複中又插入其他基因。4.轉座複製產生,5.基因組散布複製。區分這幾種情況對於我們分析物種演化,基因功能分化等都有重要的作用。小麥基因組計劃完成之後,大家把目光轉向了更多的小麥近緣物種和更重要的品種材料的測序。
  • DNA甲基化和表觀遺傳學必看的經典綜述(含下載連結)
    應大家要求,今天我們來為大家推薦DNA甲基化需要看的經典綜述,下面的綜述的篩選標準是:時間是2016年以來,雜誌的影響因子大於10分,並且儘量照顧到各個領域的研究,文末是綜述文章的下載連結。DNA甲基化修飾和對基因表達的轉錄調控作用1.
  • 宏基因組binning分析免費做
    、多組學……今天,我們通過1篇經典案例,具體看看「可視化」和「高級分析」這些策略在文章中的應用。但由於SEM分析指明了「氮」元素的重要性,圍繞細菌與藍藻「互利共生」的研究中心,文章進行了物種基因組氮(N)循環功能的研究,可謂畫龍點睛。那麼,宏基因組測序,哪裡來的物種基因組呢?這就是我們在上一篇進階策略中提到的binning分析。從26個樣本的200G數據中,binning獲得了51個參與N循環過程的高質量bin(draft genome)。
  • 城市環境所在水環境細菌抗生素抗性基因檢測分析方法比較研究中獲...
    抗生素抗性基因(antibiotic resistance genes, ARGs)是一種新興環境汙染物,可通過水平基因轉移等方式進入病原菌並賦予宿主對抗生素的耐藥性,從而嚴重威脅人類的健康。環境中ARGs多樣複雜,導致對其全面、系統的定量和定性檢測分析難度極大。目前,高通量定量PCR和宏基因組學方法是兩種最常用也是應用潛力最大的環境ARGs定性、定量檢測手段。
  • 微生物組學數據分析工具綜述 | 16S+宏基因組+宏病毒組+宏轉錄組
    此外,由於原核、真核生物的「分類標籤」完全不同,即使細菌和古菌的16S也相去甚遠,以進化快著稱的病毒更難以捕獲。宏基因組有效避免了擴增偏差,由於是直接打斷,理論上不限制物種(細菌、真菌、古菌、真核生物等,事實上當前宏基因組測序多還是以細菌為主),可能組裝獲得新基因乃至新物種信息,但根據取樣情況可能存在少量或大量的宿主汙染,因需組裝,數據量要求大,成本貴、周期長。
  • 水環境細菌抗生素抗性基因如何檢測?中國學者比較了兩種方法
    論文中提到,目前高通量定量PCR和宏基因組學方法是兩種最常用也是應用潛力最大的環境抗生素抗性基因定性、定量檢測手段。但是,在研究水環境抗生素抗性基因時採用不同檢測方法分析同一份環境樣本很可能會得出不同的結果。
  • 起來嗨,2019年SCI期刊影響因子出爐(含下載連結)
    聽說2019年最新的期刊影響因子更新啦,作為一隻勤勞的小蜜蜂,連夜整理出來,分析來分析去,搞得像研究股票一樣。
  • (內含軟體下載)
    或軟體工作檯由菜單欄、常用工具欄、組空間和樣本空間組成。 以3 color comp 文件夾中的CyPE comp.fcs進行分析演示。將此文件夾移至桌面,並把該數據文件夾從桌面拖入Flowjo中的組空間中。
  • 臨床科研那點事之軟體學習(二):OncoLnc在線分析軟體
    作為新年的第一帖,今天向大家介紹一款非常有用的腫瘤學研究軟體:OncoLnc。我們知道,曾幾何時,通過晶片或者測序篩選腫瘤組織中異常表達基因包括mRNA, miRNA, lncRNA是許多腫瘤科研工作的第一步,也是一種發表SCI論文的便易方法,當然也是燒錢的一種境界,但是現如今由於TCGA資料庫的存在,讓這種套路已漸漸成為歷史。