很簡單啊,修改回來啊!!!
幫同學處理一下他從公司拿到的差異分析結果,當然,給我的是Excel表格,老規矩,導出csv然後讀入R,然後準備順手畫個火山圖,PCA圖,熱圖,做個GO/KEGG富集分析。下意識的看了看數據結構,然後順手按照基因名排序了一下,哈哈哈~
這是一個大坑。
就因為這個還有兩篇文章;
也有人在論壇上面發問,高達2K的閱讀量: https://www.biostars.org/p/211861/
Some gene names start with APR/MARC/SEPT* etc default converted into date format.
我們生信技能樹論壇也有人分享過: Excel-坑你的基因名沒商量!
隨意篡改20%的遺傳學論文!
可就在今年8月份,三位科學家在《Genome Biology》期刊上發表論文,稱他們發現20%的遺傳學論文包含了Excel軟體導致的基因名轉換錯誤。他們對論文進行的掃描顯示,科學文獻中的基因名錯誤十分普遍,在默認設置下Excel軟體會將基因的名字轉換成日期或浮點數。
舉例來說,基因名字SEPT2和MARCH1會被分別轉換成2-Sep和1-Mar;標識符2310009E1被轉換成浮點數2.31E+13。
但是,如果你會編程的話,事情就很簡單咯,一句話搞定!
a$Gene.Symbol=unlist(lapply(as.character(a$gene_assignment),function(x){trimws(strsplit(x,'//')[[1]][2])}))
編輯:jimmy
點擊下面的閱讀原文,上面的連結都是可以跳轉的!
如果你對上面的圖表完全無法理解,那麼你可能需要下面的課程:
不點讚也不打賞,為什麼呢?