使用samtools tview對bam文件進行可視化

2021-01-14 楊博士聊生信

大家好,今天給大家介紹一下samtools如何對bam文件進行可視化。說起來這個軟體也挺有意思。明明叫samtools,偏偏大部分都是對bam文件進行操作。

 

第一步:下載samtools軟體,網址https://sourceforge.net/projects/samtools/files/samtools/0.1.19/samtools-0.1.19.tar.bz2/download,作者用的是samtools-0.1.19版本,有喜歡其他版本的小可愛也可以嘗試其它版本。進入samtools-0.1.19所在目錄,在命令行輸入:./samtools,出現以下界面,則表明軟體安裝成功。

第二步:接下來,給大家分享一下如何samtools對sam和bam文件進行互相轉換以及對bam文件進行可視化

我們用軟體裡面examples文件夾中的文件進行分析,文件如下:


利用以下命令行,使用samtools進行分析 

./samtools faidx ex1.fa  #對參考文件ex1.fa構建索引,生成ex1.fa.fai

./samtools import ex1.fa.fai ex1.sam.gz ex1.bam #將SAM轉換成BAM文件

./samtools index ex1.bam #對BAM文件建立index,生成ex1.bam.bai

./samtools tview ex1.bam ex1.fa #可視化alignment


如果我們想看一下seq1中第520個位置比對情況,直接輸入

g Goto:seq1:520

在samtools tview中,「.」代表和ex1.fa內容完全一樣;「,」表示比對到ex1.fa的互補鏈;寫了字母就代表mismatch。

 

你學會了嗎?歡迎轉載。感謝關注


相關焦點

  • 處理SAM、BAM你需要Samtools
    View作用:轉換sam與bam,對bam進行排序(sort)和提取的操作sam轉bam,-S指輸入文件格式(不加-S默認輸入是bam),-b指定輸出文件(默認輸出sam)samtools view -Sb SRR3589956.sam >SRR3589956.bam 【如果要bam轉sam,-h設置輸出sam時帶上頭注釋信息】samtools
  • 宏基因組實戰7. bwa序列比對, samtools查看, bedtools豐度統計
    最後送上本教程使用到的所有文件同步共享文件夾連結:http://pan.baidu.com/s/1hsIjosk 密碼:y0tb 。># 參考序列建索引samtools faidx subset_assembly.fa# 壓縮sam為bam用於可視化for i in *.samdo samtools import subset_assembly.fa $i $i.bam samtools sort $i.bam -o $i.bam.sorted.bam samtools index $i.bam.sorted.bamdone#
  • nanopore測序技術專題(十九):利用samtools處理sam格式文件
    比對得到的不能直接使用,必須經過轉換bam,排序,建立索引三大步驟。這次內容我們就來系統介紹一下如何處理sa格式文件。sam格式文件 sam文件是一種列表格式,用來記錄reads比對到基因組上的信息,包括哪一條reads,比對到哪條基因組上的哪個位置,是一對一比對還是一對多比對,有無錯配,錯配是怎樣的。
  • samtools命令大全
    1.Viewview命令的主要功能是:將sam文件與bam文件互換;然後對bam文件進行各種操作,比如數據的排序(sort)和提取(這些操作 是對bam文件進行的,因而當輸入為sam文件的時候,不能進行該操作);最後將排序或提取得到的數據輸出為bam或sam(默認的)格式。
  • 生信人必會之samtools
    將sam文件瞅成bam文件;這是對sam文件最早的操作,然後對bam文件進行各種操作,比如數據的排序(view不行,是別的命令,光瞅能幹啥!)和提取(這些是對bam文件的操作,sam不行,就是不願意);瞅你咋的?最後將排序或提取得到的數據輸出為bam或sam(默認的)格式。
  • nanopore測序技術專題(二十):tablet可視化比對結果
    而tablet就是一款可視化高通量數據的一款軟體,我們可以通過該軟體直接看到每個位點的比對細節,例如該位點被測序了多少次,每個鹼基具體是什麼,記得還在深圳工作的時候,我們經常使用這款軟體一點點檢測利用二代測序做出的細菌基因組完成圖連接的是否正確,一看就是1個多小時,導致晚上做夢滿腦子都是花花綠綠的鹼基,這算是工傷。
  • 如何進行基因組序列比對?
    至於具體分析過程中使用哪個版本的參考基因組序列,可根據自己需求進行選擇。 使用三種算法之前,均需要先對參考序列構建FM-index (Full-text index Minute space)。 FM-index是基於Burrows-Wheeler transform進行全文壓縮和構建索引的算法。
  • 使用MISO進行可變剪切的分析
    運行miso運行miso需要第一步建好的索引以及樣本對應的bam文件,該bam文件必須是經過排序處理的,而且有對應的bai索引,對於雙端數據,用法如下miso --runindex_db algin.sorted.bam \  --output-dir out_dir --read-len 150 --paired-end
  • 使用CNVnator進行CNV檢測
    CNVnator是一款CNV檢測軟體,基於Read-Depth的分析策略,通過對全基因組測序數據進行分析來預測CNV, 原始碼保存在github上,網址如下https://github.com/abyzovlab/CNVnator這個軟體的安裝比較複雜,我這裡直接使用別人裝好的docker