去測序接頭trimmomatic的使用

2021-03-02 Mitty C

由於實驗室暫時沒有轉錄本的測序文件,因此是從網上找的一批測序文件和參考基因組文件

1.利用conda安裝trimmomatic軟體

2.查看fastqc報告,看測序文件是哪種接頭

這裡的接頭是Truseq Adapter

3.設置合理的去接頭參數

trimmomatic PE -threads 4 \  #線程數
01raw_data/sample2_R1.fastq.gz  01raw_data/sample2_R2.fastq.gz \    #指定要處理的文件位置
02clean_data/sample2_paired_clean_R1.fastqc.gz \    #指定文件配對與不配對鹼基的輸出文件位置
02clean_data/sample2_unpair_clean_R1.fastqc.gz \
02clean_data/sample2_paired_clean_R2.fastqc.gz \
02clean_data/sample2_unpair_clean_R2.fastqc.gz \
ILLUMINACLIP:/home/chengwb/anaconda3/share/trimmomatic-0.39-1/adapters/TruSeq3-PE-2.fa:2:30:10:1:ture \   #設置接頭的種類、數目、閥值
LEADING:3 TRAILING:3 \
SLIDINGWINDOW:4:20 MINLEN:50 TOPHRED33 #設置滑窗,輸出文件設置成TOPHRED33格式

2.運行trimmomatic

得到上圖文件,輸出的paired文件即是去掉接頭後的測序文件,至此,文件的預處理已結束。

相關焦點

  • 數據質控工具:Trimmomatic
    簡介二代測序數據中低質量或者技術序列(比如接頭)會影響下遊分析的準確性
  • 隨機宏基因組測序數據質量控制和去宿主的分析流程和常見問題
    準備輸入數據通常測序公司會返回原始(raw)或純淨(clean)數據兩類數據:原始數據為下機後按測序文庫的索引(Index)拆分獲得的樣本序列,純淨數據是去除了明顯的低質量、測序引物和接頭汙染序列後的結果。推薦大家使用體積更小、質量更高的純淨序列進行下遊分析和提交數據中心。此外,涉及人類研究的數據,需要上傳去除人類相關序列後再上傳數據中心(即本文的輸出結果)。
  • 全基因組測序(WGS)流程及實踐
    連結:http://www.usadellab.org/cms/uploads/supplementary/Trimmomatic/Trimmomatic-0.39.zip下載後,直接解壓,目錄下的trimmomatic-*.jar就是執行程序,可以直接使用java來運行。
  • 看一眼你的測序數據質量-Fastqc安裝使用和結果解讀-吐血分享
    軟體使用# 首先確保自己的Fastq文件所在(接受.gz壓縮文件)ls *.fq.gz# 使用最高8個線程同時處理當前目錄下所有測序數據文件fastqc -t 8 *.fq.gz# 運行結束後,針對每個樣本會出現兩個結果文件sampleName_fastqc.zip  # 這個文件包括了所有分析結果信息,除非有比較細緻的分析需要
  • 單細胞測序技術原理
    一.基本原理 單細胞測序首先不是僅僅對一個細胞進行測序,而是說該項技術能對單一細胞的基因組或轉錄組進行測序,可以理解為單細胞水平上的測序。 在介紹基本原理之前先讓我們嘗試著回答一下:為什麼要進行單細胞測序?
  • 測序數據的解析:Fastq與FastQC
    對於新下機的原始數據,我們可以使用軟體FastQC來對其測序質量進行可視化,軟體地址:http://www.bioinformatics.babraham.ac.uk/projects/fastqc/FastQC使用方法如下:其中參數-o設置結果文件輸出路徑,默認為當前路徑;-q為安靜模式運行;-t設置所使用的核數,根據伺服器情況而定,更多命令行選項使用命令fastqc -h來查看。
  • 三代基因組測序技術原理簡介
    其中,焦磷酸測序法是後來Roche公司454技術所使用的測序方法2–4,而連接酶測序法是後來ABI公司SOLID技術使用的測序方法2,4,但他們的共同核心手段都是利用了Sanger1中的可中斷DNA合成反應的dNTP。
  • 基因組測序原理及其發展歷程
    這個網站為Sanger測序法製作了一個小短片,形象而生動。值得注意的是,在測序技術起步發展的這一時期中,除了Sanger法之外還出現了一些其他的測序技術,如焦磷酸測序法、連接酶法等。其中,焦磷酸測序法是後來Roche公司454技術所使用的測序方法,而連接酶測序法是後來ABI公司SOLID使用的測序方法,但他們的核心手段都是利用了Sanger中可中斷DNA合成反應的dNTP。
  • 腸道菌群:宏基因組測序分析流程解讀(上)
    如果樣本汙染宿主DNA比較嚴重,例如腸道黏膜樣本,直接宏基因組測序會產生大量的宿主汙染,為了降低實驗成本,可以使用16S測序。如果想快速鑑定未知病原感染,直接通過metagenome測序可以鑑定是細菌、真菌或者是病毒感染。
  • 99% 科研人會忽略的測序致命傷
    高通量的測序儀由於每一條 lane 的測序能力都遠大於一個樣本所需的數據量,為了避免試劑浪費,會將不同樣本混合在一起測序。樣本標籤是不同序列的寡核苷酸片段,通過對樣本添加標籤就可以區分不同樣本,獲得測序數據後通過樣本標籤將分屬於不同樣本的測序數據歸攏到一起。所以樣本標籤是用於區分不同樣品的,是樣品的「身份」。
  • 各代測序技術簡介
    第一代DNA測序技術(又稱Sanger測序)在1975年,由Sanger等人開創,並在1977年完成第一個基因組序列(噬菌體X174),全長5375個鹼基。研究人員經過30年的實踐並對技術及測序策略的不斷改進(如使用了不同策略的作圖法、鳥槍法),2001年完成的首個人類基因組圖譜就是以改進了的Sanger法為其測序基礎。
  • PVC法蘭式橡膠軟接頭使用介質
    PVC法蘭式橡膠軟接頭使用介質PVC法蘭式橡膠軟接頭安裝是否正確;法蘭之間,有沒有大小不同之處,並且安裝面與面的尺寸是否正確。檢查過度伸長,過度壓縮,橫向或者角向。降低噪音、伸縮性好,使用方便。單球PVC法蘭式橡膠軟接頭又稱橡膠軟接頭,軟接頭,減振器、管道減震器、避震喉等,是一種高彈性、高氣密性,耐介質性和耐氣候性的管道接頭。
  • 【技術】基因測序那些事 - 基因治療專區 - 生物谷
    導讀狹義上講,測序就是指利用技術手段確定一段核糖核酸或脫氧核糖核酸裡面的鹼基順序,例如DNA中的ATCG如何排列。廣義上的測序不僅需要確定DNA中的ATCG鹼基順序,還包括這些鹼基與整個基因組的關係,鹼基變化給個體帶來的有利或有害的影響。
  • RNA-seq測序基本知識
    如果我們使用單端測序100nt(或雙端測序50nt),則1M reads給出100M nt序列數據,其等於1×覆蓋。普通平臺的典型Read輸出是30Mreads,將提供30×覆蓋。因此,如果reads為30M,那麼我們可以預計會有大量的表達基因,對大多數基因有很好的覆蓋率,並且可能會遺漏一些低表達或很少表達的基因。
  • 法庭科學DNA二代測序檢驗規範GB/T 1693-2020(20210101)
    3.2 二代測序 second generation sequenc ing區別於傳統Sanger(雙脫氧法)測序,能夠一次並行對大量核酸分子進行序列測定的技術,通常一次測序反應能產出不低於100 Mb的測序數據。
  • 簡單介紹一下埋地橡膠軟接頭的使用特點
    簡單介紹一下埋地橡膠軟接頭的使用特點埋地橡膠軟接頭介紹:橡膠軟接頭埋地橡膠軟接頭又叫橡膠軟接頭防護罩,一種專為橡膠軟接頭設計的保護裝置。橡膠軟接頭防護罩的設計目的就是保護接頭不受外力損.,延長接頭的使用壽命等。通常橡膠軟接頭埋地橡膠軟接頭使用在地下,材質為Q235,且通常根據用戶橡膠軟接頭的實際埋地深度和地理位置來定製防護罩的設計尺寸,是埋地使用橡膠軟接頭的配套產品。橡膠軟接頭埋地橡膠軟接頭由兩個半圓形中空組合而成,將接頭和管道平焊法蘭全部裝入體內,兩端設有小平面鋼帶騎於兩側法蘭內圓面起到兩端立面支撐的作用。
  • 美國約翰霍普金斯大學科學家開發了新的第三代DNA測序技術
    隨著基因組時代的到來和人們越來越高的基因序列信息的需求,測序技術得以快速發展。雖然,目前二代的高通量測序仍是在基因組測序和轉錄組測序中應用最廣泛的技術手段,但其存在讀長短、成本高、依賴PCR擴增等缺陷。近年來,不需要PCR擴增便可以用來讀取長片段的第三代測序技術-單分子實時測序技術發展越來越快,並在基因組組裝,甲基化鑑定和基因組結構變化等方面得以廣泛應用。