為什麼寫文章還做生物信息學分析?
這個問題並不複雜,例如在果蠅中篩選了一個基因能抑制細胞凋亡,除了在果蠅身上抑止的機制能得到啟發,你也一定想看看在人裡面有沒有同源基因,想知道的是應該是究竟是哪一個或者哪一群基因在某個生物學過程中起到了重要的作用。
果蠅細胞凋亡機制
而要得到這樣一個可信的結論,那就要序列,就要BLAST。
生物信息學主要是對DNA和胺基酸序列中所含有的信息進行分析。可以對多個序列進行比對,分析他們的相似度,可以對基因結構進行預測可以對蛋白質的一級二級三級結構進行預測。
如果你知道一個基因的CDS區,就可以對它進行稀有密碼的分析,幫助選擇適合的表達載體。
順便說一下文章中比較套路的熱圖。
熱圖( heatmap )是生物學文章裡(尤其是RNA-seq相關論文)經常出現的圖片。熱圖的用途一般有兩個:
1 )直觀呈現多樣本多個基因的全局表達量變化;
2)呈現多樣本或多基因表達量的聚類關係。
基因功能分析用 GO(基因本體論) 和 KEGG 這一套,簡單地羅列數據就 OK 了,因此也經常被詬病套路化嚴重。
熱圖一般使用顏色(例如紅綠的深淺)來展示多個樣本多個基因的表達量高低,既直觀又美觀,同時可以對樣本聚類或者對基因聚類, 這兩者統稱為聚類分析。
聚類分析在生物信息中用的比較多,雖然反應在文章裡其實沒有單獨的圖表,導致大家對它的感受不深,但是在生物學上,聚類用於推導植物動物和微生物的分類,以及對基因進行分類,已經成為聚類分析中的一個前沿分支學科。
差異代謝產物聚類分析
如果有同學是做一些育種等方向的研究,或者具有SAS和SPSS的使用經驗,應該對聚類還是比較熟悉的,在一些對生物環境,生物個體等的統計分析中,聚類也是常用的方法。
回到為什麼做生信分析這個問題上,很多時候,我們學生信都抱著發文章會更容易的目的。比如,我們想找一個好點子,關於性狀,疾病相關的關鍵分子,正常就需要設計實驗,做大量的分子篩選的工作。
而利用別人已發表的數據,篩選出一些有價值的分子(mRNA,miRNA,lncRNA,circRNA,lncRNA),之後在自己的小樣本中驗證一下,就能在樣本不多,經費較少的情況下發一篇SCI文章,可謂是既經濟又快捷。
但是別忘了初心:做生物信息學分析為了通過嚴謹的科學方法得到一些可靠的結論。
如果文章對你有幫助的話,歡迎關注我們了解更多資訊~
珍美思醫學研究院
微信公眾號:珍美思
微信:ncbiomed8014