NCBI微生物基因組批量下載

2021-02-20 美吉生物

親愛的科研同僚們,在曲折的探索道路上是否還在為找不到目標物種的基因組而抓耳撓腮?不要哭,今天小編就為大家提供幾個批量下載某物種或特定物種基因組並獲取基因組預測及注釋信息的方法。

1、ftp://ftp.ncbi.nlm.nih.gov/genomes/GENOME_REPORTS

主要是在分類學水平上對物種基因組信息以文件夾的形式歸類,最終基因組整理統計的基本信息展示在Browse網站(第二部分詳述)

(1) ftp://ftp.ncbi.nlm.nih.gov/genomes/all/

(2) ftp://ftp.ncbi.nlm.nih.gov/genomes/genbank/

(3) ftp://ftp.ncbi.nlm.nih.gov/genomes/refseq/

2、通過軟體Filezila批量獲取:將FTP地址輸入Filezila軟體中,點擊快速連結,即可批量將數據導入個人電腦。

二、Batch Entrez微生物基因組批量下載:

1、根據登錄號

① 將登錄號整理成一個List文件

② 登陸網址Batch Entrez(http://www.ncbi.nlm.nih.gov/sites/batchentrez),將準備好的登錄號文件(如下左圖)上傳至該網站,點擊「Retrive」獲取目標格式文件。

     ③ 跳轉到統計界面,共搜索到8327條序列,點擊「UID」

④ 點擊「Send to」可選擇批量下載核苷酸序列、胺基酸序列以及gbk文件等。

2、根據物種名

① 登陸Browse網站https://www.ncbi.nlm.nih.gov/genome/browse/#!/overview/

② 根據物種對網站篩選條件進行限定,點擊「Download」下載篩選後的物種信息統計表

③ 整理下載後表格,用Excel自帶的「分列/替換」功能對下圖高亮列處理,提取物種基因組登錄號,重複上述根據登陸號下載基因組的步驟。

FTP中基因組是以文件夾層級的形式存儲,有些是將某物種基因組序列及注釋信息存放在一起,有些是對目前所有已發表基因組序列的合併儲存。

Batch Entrez軟體批量下載結果中將list中包含的所有物種的基因組序列(fatsa)、基因序列(ffn)、gbk文件(gb)等分別儲存至一個文件,以txt或fasta的形式存儲,這需要用用戶後續對所需信息進行提取。

這兩種方法用戶可很據需求及所需下載的數據量進行選擇,若下載數據量過大建議使用FTP及Filezila軟體結合的方法;若需要快速簡便下載數量少的基因組信息,建議用Batch Entrez。

1、FTP

File Transfer Protocol(文件傳輸協議)的英文簡稱,用戶可通過它連接到遠程主機上,並從其下載文件。通過FTP連結到NCBI伺服器,並從該伺服器上免費下載NCBI整理好的儲存文件

NCBI的FTP地址:https://ftp.ncbi.nih.gov/

NCBI的 FTP資源:資料庫(dbSNP、Entrez Gene、Refseq、CCDS)和分析工具(Blast、e-PCR)等

2、Batch Entrez網站報錯解決方法

可能出現的報錯有以下兩種:

(1)建議使用谷歌瀏覽器打開,清空瀏覽器歷史記錄

(2)存儲物種基因組登錄號的List文件不要太大,若下載基因組多可拆成幾個相對小的文件分別提交

(3)網絡不穩定的情況下可嘗試多次提交,下載完成後建議檢查數據下載的完整性

   

                          微生物基因組產品線 文案|馬貝貝

相關焦點

  • 凌波微課|NCBI數據批量下載,你會了嗎?
    NCBI批量下載數據實操經過分離、實驗室純化培養、基因組測序,小Young終於拿到了心心念念的菌株的基因組序列,迫不及待的要開展分析
  • NCBI教程|如何從NCBI批量下載序列並用MEGA畫進化樹
    後,利用序列的NC號或者GI號直接搜索下載即可。但是如果需要下載的序列過多(多至幾百條?幾千條?),這個時候就很麻煩了。其實,NCBI自帶的Batch Entrez 只需簡單的幾步就可以很快的實現序列的批量下載。你只需要按照如下的幾步進行就可以完成任務。
  • 教你無限制批量下載JGI-IMG基因組數據!
    其主頁如下所示:IMG整理了詳細的微生物基因組信息,包括物種的分類、生存環境、基因組序列長度、GC含量、編碼基因數目、數據質量以及研究項目信息等,目前僅細菌基因組收錄的數目已超過基因組注釋信息我們可以很方便的導出到表格,那麼如何批量下載對應的基因組序列數據呢?
  • 使用BioNumerics軟體批量下載NCBI中基因序列
    使用BioNumerics軟體批量下載NCBI中基因序列大家可能曾經都被如何批量下載NCBI中的數據所困擾,在NCBI的網站上苦苦搜尋,但是無從下手。本文將介紹如何通過BioNumerics軟體實現基因序列的批量下載。
  • NCBI介紹
    HomoloGene下載功能能下載HomoloGene中的轉錄體、蛋白質和基因組序列信息,還能下載基因組中特定基因的上遊和下遊序列。用戶設計完引物後,可以用反向e-PCR搜索該物種基因組資料庫和轉錄體資料庫來預測基因組結合位點、擴增片段大小和引物特異性,在線版的物種很少,用戶可以自己下載軟體,然後用自己的基因組。
  • 生物信息神奇網站系列(九):批量下載序列
    在《手把手教你生信分析平臺搭建專欄》中,我們介紹過利用Aspera快速下載生物數據,例如下載某個物種基因組數據。
  • 微生物分類學研究利器:模式微生物基因組資料庫
    由國家微生物科學數據中心(世界微生物數據中心)建立的模式微生物基因組資料庫(gcType)http://gctype.wdcm.org/,是為分類學家進行基因組研究、新種鑑定的一個非常有價值的工具平臺。
  • 微生物分類學研究利器:模式微生物基因組資料庫
    由國家微生物科學數據中心(世界微生物數據中心)建立的模式微生物基因組資料庫(gcType)http://gctype.wdcm.org/,是為分類學家進行基因組研究、新種鑑定的一個非常有價值的工具平臺。
  • 《核酸研究》:高質量模式微生物基因組資料庫及分析平臺
    (中國科學院微生物研究所微生物資源與大數據中心、世界微生物數據中心)團隊關於全球模式微生物基因組資料庫gcType的文章。>、古菌模式菌株基因組測序,建立全球微生物模式菌株基因組測序合作網絡,現已有來自美國的ATCC、日本JCM和NBRC、韓國的KCTC等超過12個國家的26個微生物資源保藏中心正式加入該計劃並形成了重要了階段性成果。
  • 《核酸研究》:高質量模式微生物基因組資料庫及分析平臺
    2018年,微生物所牽頭組織發起了全球模式微生物基因組測序計劃,從全球微生物資源保藏中心選擇目前未進行測序的模式微生物菌株(包括細菌、古菌和可培養真菌),預計5年內完成超過10,000種的細菌、真菌、古菌模式菌株基因組測序,建立全球微生物模式菌株基因組測序合作網絡,現已有來自美國的ATCC、日本JCM和NBRC、韓國的KCTC等超過12個國家的26個微生物資源保藏中心正式加入該計劃並形成了重要了階段性成果
  • 分分鐘搞定NCBI GenBank序列上傳
    在此,我將對目前高通量測序數據的提交做一個簡單概述,並著重對提交基因組測序進行講解,希望對大家有用。有不對的地方,請大家批評指正。2、分析數據 目前的高通量測序就項目類型而言可概括分類為:基因組測序、轉錄組測序、meta測序(如16S測序等)等。 基因組測序數據可以提交組裝結果和注釋信息到WGS資料庫,或者Complete Genomes,而基因組草圖draft只能提交到WGS資料庫。
  • 模式微生物基因組可以免費測序了
    自從2018年1月起,在《國際系統與進化微生物學雜誌》(IJSEM)雜誌上發表微生物的新種,都需要提供基因組測序數據了。依託於中國科學院微生物研究所的世界微生物數據中心(WFCC-MIRCEN World Data Centre for Microorganisms, WDCM)在2017年底啟動了全球微生物模式菌株基因組測序計劃(GCM2.0),目前已經有16個國家的25家微生物資源保藏中心的正式加入。
  • 最全最實用的微生物數據與資源在這裡下載
    每一個微生物學家在分析數據的時候都會遇上各種數據的問題:做16S比對用的數據集要自己清洗和處理,做基因組分析用的NT,NR資料庫從NCBI下載太慢了,做基因組注釋的資料庫版本又需要更新了,甚至要擔心有一天國際資料庫切斷了,我們該從哪裡下載數據?
  • 新年成長禮2|細菌基因組分析常用軟體整理(含下載連結)
    page=trimmomatic2、基因組組裝Celera Assembler用途:對組裝結果進行序列成環判斷、基因組序列及質粒序列區分下載地址:http://sourceforge.net/projects/wgs-assembler/files/wgs-assembler/wgs-8.3/Flye
  • EM:環境微生物領域一些實用網站
    Microbial diversity in natural ecosystemshttps://www.ncbi.nlm.nih.gov/pmc/articles/PMC4852739/這是一篇綜述,討論了當前測序技術帶來的影響,及像地球微生物組計劃這樣的項目對探索地球不同生態系統中的微生物多樣性的影響。
  • 數據上傳NCBI三劍客之③—上傳菌種鑑定序列
    前兩篇推文中,小編為各位小夥伴們介紹了測序原始數據上傳SRA資料庫和微生物基因組上傳NCBI,在本期小編繼續帶小夥伴們輕鬆學會將菌種鑑定序列上傳Genbank資料庫。Step 21、登錄NCBI,進入Genbank上傳頁面(https://submit.ncbi.nlm.nih.gov
  • Nucleic Acids Reasearch 重磅推薦 | NCBI多個核心資料庫:核酸序列、PubMed等更新與使用指南!
    Entrez全局搜索頁面(www.ncbi.nlm.nih.gov/search/)提供了每個資料庫的Web門戶連結。Entrez支持使用簡單的布爾查詢進行文本搜索,下載各種格式的數據以及基於聲明關係在資料庫之間的連結記錄。LinkOut服務擴展了連結範圍,包括外部資源,例如特定生物體的基因組資料庫。在Entrez中檢索到的記錄可以以多種格式顯示,可以單獨或成批下載。
  • R批量下載B細胞和T細胞受體VDJ序列文件
    今天給大家介紹一個做免疫組庫數據分析很實用的資料庫IMGT,以及如何使用R從IMGT批量下載B細胞和T細胞受體VDJ序列文件。IMGT將對醫學研究(自身免疫病、愛滋病、白血病,淋巴瘤)、治療方法(抗體工程學)、基因組多樣性和基因組進化研究具有重要影響。
  • 手把手教你提交微生物基因組序列數據
    l 支持微生物項目、樣本、核酸序列、微生物基因組、宏基因組、微生物元基因組、轉錄組、蛋白質結構、期刊附件等多種類型數據提交。l 支持國家重點研發計劃、科技資源調查專項、國際合作專項等項目數據匯交。l 數據當日提交三個工作日內完成審核並發放編號。l 為每條數據提供DOI編號。
  • 全球微生物模式基因組測序計劃獲進展
    (中國科學院微生物研究所微生物資源與大數據中心、世界微生物數據中心)關於全球模式微生物基因組資料庫gcType的論文。2018年,微生物所牽頭髮起全球模式微生物基因組測序計劃,從全球微生物資源保藏中心選擇目前未進行測序的模式微生物菌株(包括細菌、古菌和可培養真菌),預計5年內完成超過10,000種的細菌、真菌、古菌模式菌株基因組測序,建立全球微生物模式菌株基因組測序合作網絡,美國典型菌種保藏中心、日本理化學研究所生物資源中心、日本技術評價研究所生物資源中心、韓國典型菌種保藏中心等微生物資源保藏中心已正式加入該計劃並形成階段性成果