在與生物相關的研究中,生信分析基本上已經成為了一個繞不開的過程,面對高通量測序的大量數據,我們可能需要在Linux系統中使用專門的生信分析工具完成,這些工具通常學習成本較高,對於大部分研究人員來說很難快速的獨立完成。
但是在研究過程中,我們除了需要對大數據進行分析之外,面對少量的數據進行一些統計、識別、比對、功能分析、可視化也是需求量很大的工作內容,這是一些功能單一、操作簡單的在線分析工具就成為了更優的選擇。
本篇文章將介紹100個在線的生信分析小工具,涵蓋了幾乎所有可能遇到的分析內容。
這些在線分析工具通常操作比較簡單,所以本文只會給出工具的網址及其能夠實現的功能,部分工具可能會簡單介紹一下工具使用的限制,但是並不會詳細介紹這些工具的使用方法。
PS:如果特別想要知道某一個自己搞不懂的工具的用法,可以後臺私信我或者加微信私聊,對於詢問的多的工具,後面也會寫專門的文章進行介紹。
1. PathogenFinder
網址:https://cge.cbs.dtu.dk//services/PathogenFinder/
根據細菌的全基因組預測其對人類的致病性。
2. ResFinder
網址:https://cge.cbs.dtu.dk//services/ResFinder/
識別細菌全基因組序列中的抗生素抗性基因。
3. DNA/RNA GC Content Calculator
網址:http://www.endmemo.com/bio/gc.php
計算核酸序列的GC含量和序列長度。
4. RAST
網址:https://rast.nmpdr.org/
基於SEED的細菌和古菌全基因組注釋工具。
5. USCS Genome Browser
網址:http://genome.ucsc.edu/cgi-bin/hgGateway
基因組數據瀏覽器。
6. CGView
網址:http://stothard.afns.ualberta.ca/cgview_server/
以環狀形式對基因組進行可視化。
7. ATGC:Alignable Tight Genomic Clusters
網址:http://atgc.lbl.gov/atgc/
微生物基因組聚類及系統發育關係資料庫。
8. IslandViewer
網址:http://www.pathogenomics.sfu.ca/islandviewer/
整合了IslandPick、IslandPath-DIMOB和SIGI-HMM預測方法的基因島預測工具。
9. EasyGene
網址:http://www.cbs.dtu.dk/services/EasyGene/
根據核酸序列預測原核生物的基因,有在線分析工具和下載工具兩個版本,在線分析工具需要提交序列並且選擇模板微生物,以R-value反應提交的序列是否為具有蛋白質編碼ORF。
10. Resistance Gene Identifier
網址:https://card.mcmaster.ca/analyze/rgi
基於CARD對DNA序列進行ARGs自動注釋的在線分析工具。
11. TestCode
網址:http://bioinformatics.org/sms/testcode.html
在線ORF識別工具。
12. ORFinder
網址:https://www.ncbi.nlm.nih.gov/orffinder/
在線ORF識別工具。
13. REPuter
網址:https://bibiserv.cebitec.uni-bielefeld.de/reputer?id=reputer_view_submission
基因組DNA重複序列識別在線分析工具,最多提交數據量為5Mb。
14. IslandPick
網址:http://www.pathogenomics.sfu.ca/islandviewer2/run_islandpick.php
通過細菌基因組的比較鑑定基因島並對其進行可視化的在線工具。
15. RNAmmer
網址:http://www.cbs.dtu.dk/services/RNAmmer/
預測核酸序列中的5S/8S、16S/18S和23S/28S核糖體RNA。
16. siDirect
網址:http://sidirect2.rnai.jp/
siRNA在線設計工具。
17. tRNAscan-SE
網址:http://lowelab.ucsc.edu/tRNAscan-SE/
注釋序列中的tRNA基因。
18. DINAMelt
網址:http://unafold.rna.albany.edu/?q=DINAMelt
核酸雜交和融解譜圖預測工具。
19. Mfold
網址:http://unafold.rna.albany.edu/?q=mfold
DNA和RNA摺疊預測工具。
20. RNAStructure
網址:http://rna.urmc.rochester.edu/RNAstructureWeb/
RNA二級結構預測工具。
21. VecScreen
網址:https://www.ncbi.nlm.nih.gov/tools/vecscreen/
去除核酸序列中的載體序列。
22. Prophinder
網址:http://aclame.ulb.ac.be/Tools/Prophinder/
基於ACLAME注釋的細菌基因組前噬菌體在線識別工具。
23. SigniSite
網址:http://www.cbs.dtu.dk/services/SigniSite/
分析胺基酸殘基中基因型和表型的相關性,通過多序列比對文件預測與表型相關的胺基酸殘基的顯著性,提交的多序列比對文件不能超過500000個胺基酸殘基,工具只能識別20個proteogenic胺基酸和gap,其它胺基酸殘基不能識別。
24. LipoP
網址:http://www.cbs.dtu.dk/services/LipoP/
識別革蘭氏陰性基因中的脂蛋白及其信號肽,最多可同時提交5000條序列,每條序列的胺基酸個數要超過70同時低於5000。
25. TatP
網址:http://www.cbs.dtu.dk/services/TatP/
預測細菌中的Twin-arginine信號肽的剪切位點,最多提交4000條序列,每條序列不超過5000個胺基酸。
26. NetCorona
網址:http://www.cbs.dtu.dk/services/NetCorona/
預測Coronavirus 3C-like蛋白酶剪切位點,最多提交10條序列,每條序列不超過10000個胺基酸。
27. NetPhosBac
網址:http://www.cbs.dtu.dk/services/NetPhosBac-1.0/
預測細菌中絲氨酸和蘇氨酸的磷酸化位點,最多提交2000條序列,每條序列不超過6000個胺基酸。
28. ArchaeaFun
網址:http://www.cbs.dtu.dk/services/ArchaeaFun/
預測古菌序列對應的酶分類,最多同時提交10條序列,每條序列不低於15同時不超過4000個胺基酸。
29. CDART
網址:https://www.ncbi.nlm.nih.gov/Structure/lexington/lexington.cgi
NCBI下屬的保守蛋白質結構域在線識別工具。
30. TMHMM
網址:http://www.cbs.dtu.dk/services/TMHMM/
蛋白質跨膜α-螺旋在線預測工具
31. PSORTb
網址:http://www.psort.org/psortb/
細菌蛋白質亞細胞位置在線預測工具,最多一次可以同時預測100個蛋白質。
32. SignalP
網址:http://www.cbs.dtu.dk/services/SignalP/
預測胺基酸序列中的信號肽裂解位點的在線分析工具。
33. I-TASSER
網址:https://zhanglab.ccmb.med.umich.edu/I-TASSER/
同時預測蛋白質3D結構和功能的在線分析工具。
34. FASTA
網址:https://www.ebi.ac.uk/Tools/sss/fasta/
蛋白質序列相似性搜索,類似於BLASTP,參考資料庫為Swiss-Prot。
35. NetSurfP
網址:http://www.cbs.dtu.dk/services/NetSurfP/
預測胺基酸序列的表面可接近性和二級結構,表面可接近性以Z-score表示,最多同時提交1500條序列。
36. NetTurnP
網址:http://www.cbs.dtu.dk/services/NetTurnP/
預測蛋白質序列中是否存在β-轉角。
37. PSIPRED
網址:http://bioinf.cs.ucl.ac.uk/psipred/
蛋白質二級結構預測工具。
38. Jpred
網址:http://www.compbio.dundee.ac.uk/jpred/index.html
蛋白質二級結構預測工具。
39. SWISS-MODEL
網址:https://swissmodel.expasy.org/
在線蛋白質三維結構同源建模工具。
40. CPHmodels
網址:http://www.cbs.dtu.dk/services/CPHmodels/
在線的蛋白質三維結構同源建模工具,不需要提供模板信息,只需要提供待分析序列,會自動搜索資料庫進行建模。
41. Phyre
網址:http://www.sbg.bio.ic.ac.uk/phyre2/html/page.cgi?id=index
蛋白質摺疊識別在線工具,根據胺基酸序列識別蛋白質的摺疊結構。
42. ENDscript
網址:http://espript.ibcp.fr/ESPript/cgi-bin/ENDscript.cgi
蛋白質一級到四級結構的綜合在線分析工具,結果中會用不同的顏色表示胺基酸序列中不同的二級結構單元,每個殘基的溶劑可接觸性及hydropathy scales,二硫鍵的位置,與同源蛋白質的多序列比對結果以及保守區域,同源蛋白質中已知的二級結構單元,蛋白質的三維結構其中不同的保守區域應用不同的顏色表示,待分析序列與其它同源蛋白質主鏈中α-C的差異。
43. SPPIDER
網址:http://sppider.cchmc.org/
蛋白質相互作用位點在線預測工具。
44. InterProSurf
網址:http://curie.utmb.edu/prosurf.html
在線的蛋白質預測工具,預測PDB資料庫中的蛋白質選擇PDB Complex,預測用戶自己的蛋白質選擇User Complex。
45. PDBeFold
網址:https://www.ebi.ac.uk/msd-srv/ssm/cgi-bin/ssmserver
蛋白質三維結構比對工具,可以比較兩個蛋白質,也可同時比較多個蛋白質,還可以進行蛋白質結構域PDB或SCOP資料庫的結構比對。
46. Proteins Plus
網址:https://proteins.plus/
蛋白質活性口袋預測在線分析工具。
47. Active Site Prediction
網址:http://www.bioinformatics.cm-uj.krakow.pl/activesite/
基於Fuzzy-oil-drop模型的蛋白質功能位點識別的在線分析工具。
48. Primer3
網址:http://bioinfo.ut.ee/primer3/
PCR引物在線設計工具
49. Splign
網址:https://www.ncbi.nlm.nih.gov/sutils/splign/splign.cgi?textpage=online&level=form
mRNA與基因組序列比對的在線分析工具。
50. RNAfold
網址:http://rna.tbi.univie.ac.at/cgi-bin/RNAWebSuite/RNAfold.cgi
RNA或DNA二級結構預測工具。
51. APSSP
網址:http://crdd.osdd.net/raghava/apssp/
利用胺基酸序列預測蛋白質的二級結構。
52. Blast2Fasta
網址:http://imed.med.ucm.es/Tools/blast2fasta.html
將BLAST輸出格式轉換成FASTA格式。
53. BoxShade
網址:https://embnet.vital-it.ch/software/BOX_form.html
多序列比對文件美化工具,可以對MSF和ALN格式文件進行修改,輸出格式可以為Postscript/EPS、RTF、XFIG、ASCII、HPGL、PICT。
54. CFSSP
網址:http://www.biogem.org/tool/chou-fasman/
應用Chou & Fasman算法預測胺基酸序列的二級結構。
55. ClustalW
網址:https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_clustalw.html
在線多序列比對工具。
56. COILS
網址:https://embnet.vital-it.ch/software/COILS_form.html
預測蛋白質序列中的無規捲曲。
57. Coiled-Coils prediction
網址:https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_lupas.html
預測蛋白質序列中的無規捲曲。
58. Compute pI/Mw
網址:https://web.expasy.org/compute_pi/
計算蛋白質的等電點和分子質量。
59. ColorSeq
網址:https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_color.html
對蛋白質序列中特定的胺基酸殘基進行顏色標註。
60. DAS-TMfilter
網址:http://mendel.imp.ac.at/sat/DAS/DAS.html
預測蛋白質的跨膜結構域。
61. DendroUPGMA
網址:http://genomes.urv.cat/UPGMA/
利用序列差異、相似性矩陣或距離矩陣進行UPGMA聚類分析,對於應用差異的分析輸入文件要為fasta格式,對於相似性軍陣和距離矩陣分析,輸入文件要為CSV格式的矩陣文件。
62. Decrease Redundancy
網址:https://web.expasy.org/decrease_redundancy/
對於一系列序列文件進行去冗餘。
63. Dialign
網址:https://bibiserv.cebitec.uni-bielefeld.de/dialign?id=dialign_view_id
胺基酸、DNA、RNA多序列比對工具。
64. DisEMBL
網址:http://dis.embl.de/
預測蛋白質的不規則區域。
65. ESTScan
網址:https://myhits.sib.swiss/cgi-bin/estscan
檢測DNA序列中的蛋白質編碼區域,同時能夠檢測和修正導致移碼的測序錯誤,該工具不是一個基因預測工具,而是一個ORF識別工具,但是有別於其他ORF識別工具,該工具可以識別不完成的ORF。
66. FindMod
網址:https://web.expasy.org/findmod/
預測蛋白質中的後轉錄修飾和單胺基酸取代。
67. GENO3D
網址:https://geno3d-prabi.ibcp.fr/cgi-bin/geno3d_automat.pl?page=/GENO3D/geno3d_home.html
蛋白質三維結構預測工具。
68. GlobPlot
網址:http://globplot.embl.de/
蛋白質domain、globularity、disorder預測工具。
69. GPS
網址:http://gps.biocuckoo.cn/online.php
蛋白質激酶磷酸化位點預測。
70. HAMAP-scan
網址:https://hamap.expasy.org/
蛋白質家族注注釋工具。
71. CCTOP
網址:http://cctop.enzim.ttk.mta.hu/?_=/jobs/submit
蛋白質跨膜螺旋區域及其拓撲學預測工具。
72. Isotopident
網址:http://education.expasy.org/student_projects/isotopident/htdocs/
估計多肽、蛋白質、核酸、化學化合物的同位素分布情況。
73. LALIGN
網址:https://embnet.vital-it.ch/software/LALIGN_form.html
兩條序列配對比對工具。
74. One to Three
網址:http://bioinformatics.org/sms2/one_to_three.html
將以單字母簡寫形式表示的胺基酸序列轉換為三字母簡寫格式。
75. Paircoil2
網址:http://cb.csail.mit.edu/cb/paircoil2/paircoil2.html
預測蛋白質序列中平行的coiled coil。
76. PeptideCutter
網址:https://web.expasy.org/peptide_cutter/
根據蛋白質序列預測特定蛋白酶或化學物質可能的裂解位點。
77. Phobius
網址:http://phobius.sbc.su.se/
跨膜結構拓撲和信號肽預測工具。
78. Phylogibbs
網址:https://phylogibbs.unibas.ch/cgi-bin/phylogibbs.pl?part=runit&page=advanced
DNA序列調控位點預測工具。
79. PRATT
網址:https://www.ebi.ac.uk/Tools/pfa/pratt/
發現蛋白質序列中保守patterns的工具。
80. ProSA-web
網址:https://prosa.services.came.sbg.ac.at/prosa.php
蛋白質3D結構模型合理性檢測工具。
81. ProtParam
網址:https://web.expasy.org/protparam/
計算蛋白質的分子質量、pl、胺基酸組成、原子組成、滅絕稀疏、半衰期、親水性等物理化學性質。
82. ProtScale
網址:https://web.expasy.org/protscale/
蛋白質親水性範圍、二級結構構想參數範圍計算。
83. RADAR
網址:https://www.ebi.ac.uk/Tools/pfa/radar/
蛋白質序列中重複序列的檢測和比對工具。
84. Reverse Translate
網址:http://www.bioinformatics.org/sms2/rev_trans.html
根據蛋白質序列反轉錄生成DNA序列。
85. SAPS
網址:https://www.ebi.ac.uk/Tools/seqstats/saps/
蛋白質序列組成差異、電荷和胺基酸類型聚類,重複結構的差異,周期性的模體和相同殘基之間的不規則間隙統計。
86. STRING
網址:https://string-db.org/
蛋白質相互作用識別。
87. BioVenn
網址:https://www.biovenn.nl/
在線的Venn圖繪製工具,一張圖中最多可以有三個樣品,可以修改字號,名稱和顏色。
88. Draw Venn Diagram
網址:http://bioinformatics.psb.ugent.be/webtools/Venn/
在線的Venn圖繪製工具,可以繪製三個以上的樣品,分為對稱和不對稱兩種模式。
89. Venny
網址:https://bioinfogp.cnb.csic.es/tools/venny/index.html
在線的Venn圖繪製工具,最多公式繪製4個樣品。
90. jvenn
網址:http://jvenn.toulouse.inra.fr/app/example.html
在線Venn圖繪製工具,最多可以繪製6個/組樣品。
91. Orphelia
網址:http://orphelia.gobics.de/submission
宏基因組數據蛋白質編碼基因在線預測工具。
92. MetaBioME
網址:https://metasystems.riken.jp/metabiome/
基於web的宏基因組和細菌全基因數據中新型的商業可利用酶預測工具。
93. WEGO
網址:http://wego.genomics.org.cn/
基於web的在線宏基因組數據GO富集及繪圖工具。
94. iPath
網址:https://pathways.embl.de/
基於web的交互式KEGG代謝路徑可視化、分析和自構建在線工具。
95. Anti-SMASH
網址:https://antismash.secondarymetabolites.org/#!/start
細菌次級代謝路徑在線分析工具,次級代謝產物包括抗生素、激素、生物鹼、毒素、維生素等。
96. CAP3
網址:http://doua.prabi.fr/software/cap3
用於序列拼接的在線工具,上傳序列不超過50kb。
97. PathPred
網址:https://www.genome.jp/tools/pathpred/
細菌外源汙染物代謝路徑在線預測工具。
98. PhyML
網址:http://www.atgc-montpellier.fr/phyml/
應用最大擬然法進行系統發育分析的在線工具。
99. iToL
網址:https://itol.embl.de/index.shtml
系統發育樹在線美化工具。
100. Mapbox
網址:https://www.mapbox.com/
可以通過添加圖層的方式在各種風格的地圖上繪製自定義地圖的在線工具。
分析專輯
單細胞scRNA | R包繪圖 | 免疫浸潤分析 | 腫瘤純度評估工具 | 資料庫
文章解讀專輯
多區域進化文章精讀 | 高分文章精讀 | 免疫微環境文獻解讀
文字均為原創,歡迎讀者分享或轉發到朋友圈,任何公眾號或其他媒體未經許可不得私自轉載或抄襲。
作圖丫分析作圖群進群要求:轉發任一篇「zuotuya」公眾號文章至微信朋友圈,並附「作圖丫關注繪圖和精品分析,期待你的關注」,並獲得10個贊後加小編微信「zuotuya」邀請你加入。
聽說點擊「點讚/在看」的都是人美心善的小哥哥小姐姐!