由於實驗室暫時沒有轉錄本的測序文件,因此是從網上找的一批測序文件和參考基因組文件
1.利用conda安裝trimmomatic軟體
2.查看fastqc報告,看測序文件是哪種接頭
這裡的接頭是Truseq Adapter
3.設置合理的去接頭參數
trimmomatic PE -threads 4 \ #線程數
01raw_data/sample2_R1.fastq.gz 01raw_data/sample2_R2.fastq.gz \ #指定要處理的文件位置
02clean_data/sample2_paired_clean_R1.fastqc.gz \ #指定文件配對與不配對鹼基的輸出文件位置
02clean_data/sample2_unpair_clean_R1.fastqc.gz \
02clean_data/sample2_paired_clean_R2.fastqc.gz \
02clean_data/sample2_unpair_clean_R2.fastqc.gz \
ILLUMINACLIP:/home/chengwb/anaconda3/share/trimmomatic-0.39-1/adapters/TruSeq3-PE-2.fa:2:30:10:1:ture \ #設置接頭的種類、數目、閥值
LEADING:3 TRAILING:3 \
SLIDINGWINDOW:4:20 MINLEN:50 TOPHRED33 #設置滑窗,輸出文件設置成TOPHRED33格式
2.運行trimmomatic
得到上圖文件,輸出的paired文件即是去掉接頭後的測序文件,至此,文件的預處理已結束。