魚羊 發自 凹非寺
量子位 報導 | 公眾號 QbitAI
在Excel裡輸入證件號的時候,你是否有過數字秒變科學計數法的抓狂經歷?
讓人萬萬沒想到的是,Excel類似這樣的功能,竟然在過去一年裡,導致27種人類基因被重新命名。
因為這些基因符號,總被Excel誤讀為日期。
比如一個名為MARCH1(Membrane Associated Ring-CH Type Finger 1)的基因,當你將其輸入到Excel中……
2016年的一項研究就指出,由於Excel在默認設置狀態下,會將基因名稱轉換為日期和浮點數,大約有五分之一的公開遺傳數據都存在錯誤的基因名稱轉換。
據The Verge報導,英國Quadram研究所的系統生物學家Dezső Módos就表示:
這真的非常非常煩人。
比起等待Excel的更新,要改變這惱人的現狀,科學家們覺得還是重命名基因簡單一些。
人類基因的命名主要包括基因名稱和基因符號等內容,絕大多數基因的命名,由國際人類基因命名委員會(HGNC)完成。
本周,HGNC發布了有關基因命名的新指南,其中包括「影響數據處理和檢索的符號」。
HGNC表示,從現在起,在命名人類基因及其表達的蛋白質時,將採用Excel默認格式下也不會被錯誤轉換的方式。
比如,把SEPT1修改為SEPTIN1,MARCH1修改為MARCHF1。
HGNC也將存儲舊符號和名稱的記錄,以避免將來造成混亂。
據The Verge報導,HGNC表示,到目前為止,大約有27個基因名稱已經按照這個規則進行了更改。
重新命名基因,自然會帶來一些麻煩,比如影響到以前發表的相關研究的檢索。
不過,HGNC的工作人員Elspeth Bruford表示,儘管基因重命名並不是輕而易舉的決定,但也並不罕見。
比如,許多可以讀作名詞的基因符號已經被重新命名,以避免搜索的時候出現混亂,CARS改為CARS1,WARS改為WARS1就是這樣的例子。
這樣的消息一出,立即引發了國內外網友的熱議。
有網友表示,這顯然應該讓微軟改啊,不只是基因符號的輸入遇到了這種問題,平常輸入項目編號什麼的,也會被自動轉成日期……
也有網友指出,雖然可以事先將Excel中的單元格設置為文本格式,但在實際工作中,經常遇到的情況是:專業軟體導出txt/csv文件,再用Excel打開,某些基因名就被自動轉成了日期。
更麻煩的是,一旦被自動轉換,再去改成文本格式是無法恢復到原來的文本的,這就會導致大量數據的丟失。
並且,目前沒有任何辦法關掉Excel默認設置下的自動格式轉換。
對此,Elspeth Bruford認為,這畢竟是Excel軟體的有限用例,「Excel的其他廣大用戶正在廣泛使用這樣的功能,對於微軟來說,幾乎沒有什麼動力去對這些功能開刀」,所以,還是改基因名字更簡單些。
那麼,你怎麼看呢?
— 完 —
量子位 QbitAI · 頭條號籤約
關注我們,第一時間獲知前沿科技動態