我用這個技能一杯咖啡的功夫就掙了800塊錢

2021-02-21 生信技能樹

昨天我們在生信技能樹解讀了 從招聘信息看一個合格的生信工程師該會哪些 ,朋友圈有一小撮人冷嘲熱諷,說辛辛苦苦學了那麼多,工資也就萬把塊錢每個月。

我就呵呵,誰讓你當年選擇了生物呢?你本來應該是去賣保險信用卡股票期貨的你,因為遇到了生信,有幸找到一份養家餬口的工作你還得寸進尺?

好不容易你才走入了社會正常運轉的一環,成為一個不可或缺的螺絲釘,對沒有背景的你來說,已經是鯉躍龍門啦!

我不知道到底多少錢的工資才符合你的期望,社會上反正多得是一夜暴富,收入顯赫的職業,你做不來,在我們生信技能樹這裡抱怨是沒有用的。但是,我仍然是可以給你秀一下,學生物信息學數據分析,也不是不可以掙錢。記住,是掙錢,合理的掙錢,不是賺錢!

話說,也許是五年前,或者是四年前,我還在寫生信菜鳥團博客的時候,分享了大量的RNA-seq分析實戰教程,非常的受歡迎。遇到一個粉絲,跟著我的教程學了好久,至少郵件問了我不下十個問題,最後還是搞不定。其實就是因為沒有學Linux,自己的Windows電腦搞虛擬機折騰起來累人。然後博士畢業需要用那個數據,確實沒辦法,就乾脆找我,開價800塊錢,我幫忙拿到表達矩陣。

公共數據首先下載sra文件

內容如下:

下載sra文件然後轉為fastq文件

可以看到,都是單端測序數據,如下:

得到fastq測序數據

這些fastq文件需要根據項目信息來合併,因為一個樣本測到了兩個fastq文件。如下:

項目信息接著走RNA-seq的上遊分析流程

主要是拿到bam文件和表達矩陣

bam文件

流程代碼,真心很簡單,但是是對會的人來說,這個ngs上遊分析能力,真的很簡單,但是如果你並沒有學過Linux的shell編程,下面代碼的確是難如天書!

# for i in {0..5};do bash step1-fastp-hisat2-se.sh `pwd` config.se 6 $i;done
analysis_dir=$1
config_file=$2
number1=$3
number2=$4
conda activate rna
index=/home/yb77613/reference/index/hisat/hg38/genome
# for config.se
# sampleName and fastq files(for single end)
# SCBO-9_orgP9    /home/bladder/1.1.raw_fq/SCBO-9_orgP9.fastq.gz
cat $config_file |while read id
do
echo $id
    arr=($id)
    fq=${arr[1]}
    sample=${arr[0]}
    if((i%$number1==$number2))
    then
    ## step1: basic QC for fastq files
    if [  ! -f  ok.fastp.$sample.status ]; then
          fastp -i $fq -o 2.1.clean_fq/${sample}.fq.gz \
          --thread=4 --length_required=36 --n_base_limit=6 \
          --compression=6 -R ${sample}  \
          1>0.0.logs/log.fastp.${sample}.txt 2>&1
    fi ## end for if files
    if [ $? -eq 0 ]; then
             touch  ok.fastp.$sample.status
                else
                     echo "fastp failed" $sample
    fi
    fastqc $fq  -O 0.1.qc
    fastqc 2.1.clean_fq/${sample}.fq.gz -O 0.1.qc
    ## step2: alignment by hisat2
    if [  ! -f  ok.hisat2.$sample.status ]; then
          hisat2  -p 4  -x  $index -U  2.1.clean_fq/${sample}.fq.gz  | \
          samtools sort  -O bam  -@ 4 -o - > 3.1.hisat2_align/${sample}.se.bam
    fi ## end for if files
    if [ $? -eq 0 ]; then
             touch  ok.hisat2.$sample.status
          else
             echo "hisat2 failed" $sample
    fi

    fi # check the number1 number2
    i=$((i+1))
done

對所有的bam文件,統一進行定量流程

代碼都是三五年前就寫好的:

gtf="/home/reference/gtf/gencode/gencode.v32.annotation.gtf"
bin_featureCounts="/home/biosoft/featureCounts/subread-1.5.3-Linux-x86_64/bin/featureCounts";
$bin_featureCounts -T 4  -t exon -g gene_name  -a $gtf -o all.counts.id.txt  ../hisat2/*.bam 1>counts.id.log 2>&1

有了表達矩陣就走一個差異分析咯

我也不記得我分享過多少次代碼,多到大家都責怪我在炒冷飯了。

RNA-seq我們在生信技能樹應該是至少推出了400篇教程,而且是我們全國巡講的標準品知識點,其中還有一個閱讀量過兩萬的綜述翻譯及其細節知識點的補充:

相信大家聽完了我B站的RNA-seq分析流程後,對這個數據的應用方向都不陌生。

簡化一下結果交付給對方  

首先是hisat.stat.xlsx這個excel表格裡面保存著本次對原始測序數據的比對情況,包括比對率,多比對情況等等。

然後是raw_reads_matrix.csv包含著8個樣本的近5萬個在GENCODE資料庫記錄著的基因的表達量矩陣。

而filter_reads_matrix.csv就是把5萬個基因裡面過濾掉那些低表達量基因表達量矩陣。

最後的rpkm.txt就是把filter_reads_matrix.csv的reads的counts轉換為RPKM值,你可以跟paper做比較。

GSM860182_SG.A_correlation.pdf 這個是其中一個比較的結果,可以看出相關性很不錯,說明兩個流程的結果大致是一致的趨勢。

親愛的粉絲們,大家覺得這個項目,8個樣本的RNA-seq數據的分析,值800塊錢嗎?歡迎留言參與哦!

文末友情宣傳

強烈建議你推薦給身邊的博士後以及年輕生物學PI,多一點數據認知,讓他們的科研上一個臺階:

不點讚也不打賞,為什麼呢?

相關焦點

  • 每一杯咖啡裡的文案哲學.
    —  文案君你愛喝的是美式咖啡不加糖,還是綿密香甜的拿鐵?不管是哪一種,你有沒有想過,你喝的這杯咖啡裡,是你亦或是他,豐滿的人生。每一杯咖啡都有著屬於自己的哲學,每一句不同定義的話,則形成屬於我們自己的咖啡文案哲學。在於點,在於面,於生活處,而非理想,越是生活裡的平常,越是可以打動我們的心。浪漫的,其實不是形式。
  • 女同事借我800塊錢,下班時多給了300,低聲的說……
    1剛才搶了個紅包,十多塊錢的大紅包呀,把我高興得合不攏嘴,還嘚瑟地給同事看了一眼,同事淡淡的說:「這麼高興!是不是比你今年工資的餘額還多呀?」頓時大好的心情全沒了,還不敢反駁,他說的對呀!2一天,小胖深情地對同桌小紅說:小紅等我長大了,一定要賺好多好多錢。
  • 一杯咖啡帶來的思考:怎樣「客觀」的給別人提意見?
    — 1 —有次出差,我住在一家高端的酒店,用完早餐後,我想請服務員幫忙打包一杯拿鐵咖啡。這個小夥子信誓旦旦說:聽他說話的語氣,我猜可能是把我當成了愛佔小便宜的客人,還想用主管威脅他……我倒沒覺得被冒犯,只是覺得這個小夥子可能還是缺乏培訓,至少別被客戶覺察到嘛。更讓我感興趣的是這家酒店的制度 —— 打包一杯咖啡帶走這件事,到底是否被允許?
  • 加拿大CEO喝兩杯咖啡的時間,就已賺到了大家一年的薪水!
    也許普通職員們為去年一年能得到多少獎金髮愁,但加拿大收入最高的100名CEO卻不必為此煩心,因為到今天中午之前,準確地說是在上午11時左右,也就是兩杯咖啡的時間,他們就能賺到普通僱員一年所賺到的錢。CCPA的高級經濟學家麥當勞(David Macdonald)在報告中指出,說得通俗一點,一名全職僱員一年到頭的辛苦錢,加拿大上市公司的老總們今天上班之後用喝兩杯咖啡的時間就能賺到。
  • 那些每天一杯咖啡的年輕人,後來怎麼樣了?
    對於當代社畜來說,咖啡到底有多重要?一個人時,走進一家網紅咖啡廳,自拍一張精修一小時發朋友圈,裝逼的格調瞬間讓社畜們提升了一個level。我有個在某時尚品牌工作的朋友,每天報告寫不停,經常加班到凌晨2點,每天上班都靠著咖啡維持精神。經常喝咖啡的她,最常和我們講的就是「今天沒喝咖啡,覺得整個人都不精神了」。
  • 生活哪有什麼拼勁 全靠一杯咖啡續命!
    那些上班昏昏欲睡的年輕人、那些被困在鋼筋水泥的工人、那些在寫字樓加班熬夜的白領們,在哈欠連天的午後或是夜深人靜的午夜,總喜歡把精神寄托在一杯洋溢著熱情的咖啡裡面,在咖啡的香氣中打起精神,應對職場上的連番挑戰。
  • 住家保姆用這個辦法,掙了十五萬塊錢!
    今天見到了學校的老學員程阿姨,她給我講了她的經歷:        三年前,在福海做家政的程阿姨又一次想辭職了
  • 如果你在星巴克遇到這個顏色的圍裙 那就趕緊點一杯咖啡吧!
    人們常用綠圍裙和黑圍裙稱呼星巴克的咖啡師們,後者的圍裙上,繡有Coffee Master字樣,代表著這名咖啡師通過了內部的等級考試,考試的內容不僅僅是如何衝煮咖啡,咖啡師們還需要學習各種專業的咖啡知識,比如咖啡產地和風味,並且還能給客人講解。
  • 【創業學堂】你會買第二杯半價咖啡嗎
    問大家一個問題:你會購買第二杯半價的咖啡嗎?你的答案可能是會,也可能是不會;還可能你要加限定條件:兩個人的時候會,一個人就不會,因為我喝不了;也可能你說我根本就不喝咖啡,更談不上第二杯。這沒關係,就算不喝咖啡,你也可能在麥當勞裡會遇到第二杯半價的圓筒冰激凌。 很多店都有類似「第二杯半價」這樣的運營策略,卻很少有人去優化它。
  • 一杯星巴克的時間,這個工具居然幫我完成了5個小時的工作量
    Hello~各位小夥伴們小冰又來發文了,怎麼樣大家看到這篇文章的標題是不是瞬間就被吸引進來了小冰先給大家介紹一下這個標題用了哪些套路。
  • 悄悄打開咖啡的大門
    一杯咖啡,一段溫暖時光,這便是咖啡館的魔力,它悄悄的來到了這裡,它又悄悄的帶走我的心,咖啡的清香總是那麼饒人心弦
  • 兩杯白開水的把妹領導力
    進門之後就跟服務生說,說一會兒我會出現在哪個角落,當我出現在哪個角落的時候,麻煩你給我遞兩杯白開水給我,可以嗎?那個服務生說可以啊。然後他就進去尋找目標,一看三個女孩,女孩出現在夜店這種場合,通常都是成組的,不會一個人進去。第一件事情叫打開組合,先選準自己的目標。
  • 女面試官:沙漠裡有兩杯水,一杯馬尿,一杯人尿,你喝哪一杯?
    :「沙漠裡有兩杯水,一杯馬尿,一杯人尿,你喝哪一杯?面試圖片來源網絡第一位面試者是位女生,他聽完這個問題後雖然覺得有點噁心,但是也只好老老實實作了回答:「沙漠裡有兩杯水,一杯馬尿,一杯人尿,你喝哪一杯?」
  • 星巴克創始人離職:你知道他曾經因為買不起一杯咖啡而被毒打嗎
    現年64歲的霍華德·舒爾茨向全世界星巴克咖啡愛好者宣布,他將離去。下一站,可能是政治領域,可能的話,他或許將參加2020年美國總統競選。跨界參加總統競選,這個夢想,在別人眼裡看來是完全不可能實現的。然而,對舒爾茨來說,一切的不可能都是可能的開始。就像當年,你根本想不到,這個全世界最大的咖啡店的創始人有過連一杯咖啡都買不起的經歷。
  • 用一杯茶的儀式感 在法國創業
    如果你曾頻繁出沒於寫字樓或是穿梭在不同城市入住於各大酒店的商旅人士,一次性茶包對你來說一定不陌生。相
  • 這些賣咖啡的文案,看得我文案之魂都燃燒了
    隨著時間的沉澱,「我不在咖啡館,就在去咖啡館的路上」依舊值得回味。「你喝咖啡嗎?你愛喝咖啡嗎?你喝咖啡是為了它的名字?先別忙著回答我這個問題仔細想想然後你會有答案」一句簡單的話,將舌吻與情話聯繫在了一起。
  • 了解SCA咖啡課程體系
    最近有小夥伴問我關於SCA咖啡師認證證書的事情,今天的話我們就來詳細的了解一下。
  • 如何給顧客描述咖啡中的風味
    作為一名專業的咖啡從業人員,我們的職責不止是衝泡咖啡,還包括幫助客人找到最適合且最滿意的咖啡,向顧客推薦合適的咖啡,是一名優秀咖啡師最難也是最重要的技能。我們要如何以他們能夠理解的方式描述咖啡的風味?將專業的評鑑用一種大家都能理解的方式幫助引導他們去感受我們的每一杯咖啡中的風味描述,和進行一個簡單的互動來更加深刻的感覺,使客人在品嘗手中咖啡的同時也能夠有一個好的體驗。
  • 咖啡的記憶
    loli:大概是在兩年前開始對咖啡改觀,當時在科技公司做文員,每天上班都會經過一個咖啡工作室,他們每天都在烘焙豆子。散發出的香氣,每天每天都在影響我,只不過那時候沒敢推開玻璃門進去。現在我所在的咖啡店,就是當時工作室的品牌門店(Gee coffee)。可能一直以來我都秉承著"興趣是最好的老師"這句話,即使是職業也應該選擇自己喜歡的。
  • 咖啡救不了打工人
    題外話:永遠不會忘記很多年前,在國貿上班的時候,拿著一袋散裝鴨貨走進電梯,被人手一杯星巴克的白領們用眼角圍觀的場景