為了避免基因名被Excel自動糾正,遺傳學界更改了命名規則

2021-02-25 煎蛋

人類的遺傳物質中存在大量的基因片段。為了研究它們,就需要先區分它們。所以科學家編制了一整套基因命名規則。每個基因都有一個名稱和字母數字代碼。畢竟只有遵循同一套術語體系,科學才有互相交流的可能。

另一方面,Excel是電子表格界中的大哥大,雖然它本身並非專門為科研開發,但早已是科學工作者難以捨棄的工具。

現在問題來了。

隨著被標記命名的基因越來越多,那些字符串有時看起來像是某種有意義語段的錯誤拼寫。而Excel的自動格式匹配和拼寫檢查功能會把它們自動改成「正確的」形式。

例如,當用戶在Excel中輸入名為MARCH1的基因編號時,Excel會將其轉換為日期:3月1日。

這是極其令人沮喪的,甚至是危險的和有破壞性的善意,科學家必須手動恢復。同時,稍有疏忽,就會造成數據錯誤。2016年的一項研究檢查了3597篇已發表論文共享的遺傳數據,發現大約五分之一受到了Excel拼寫糾錯功能的影響。

「簡直煩死個人。」英國Quadram研究所的系統生物學家Dezső Módos告訴The Verge。莫多斯(Módos)的工作涉及分析新近測序的遺傳數據,他說Excel的問題一直存在,這僅僅是因為該軟體通常是科學家處理數值數據時的首選。他說:「它是一種被廣泛使用的工具,嗨,如果您搞不了理論物理,又想做科學工作,那麼您就離不開這玩意。」

沒有簡單的解決方法。Excel沒有提供關閉此自動格式審查的選項,唯一避免這種情況的方法是更改各個列的數據類型。即使這樣,一旦有其他人直接打開同一電子表格,錯誤將再次發生。

所以,本周,HGNC發布了有關基因命名的新指南,包括「影響數據處理和檢索的符號」。從現在開始,人類的基因及其表達的蛋白質將用Excel的自動格式命名。這意味著符號MARCH1現在已變為MARCHF1,而SEPT1已變為SEPTIN1,依此類推。HGNC將保留舊符號和名稱的記錄,以方便將來索引。

HGNC的協調員Elspeth Bruford告訴媒體,到目前為止,大約修改了27個基因名,但是正式指南直到本周才宣布。「我們諮詢了各個研究領域的學者,討論了擬議的更新,並且還通知了研究人員。」

公告發布之後,科研社區反響十分熱烈。據說有遺傳學家喜極而涕。有匿名用戶宣稱要開香檳慶祝,因為這是今年最偉大的新聞!

當然,也有用戶表達了不滿:為啥是我們遺傳學家做出改變,難道不是應該讓微軟修改Excel的設置嗎?

Bruford解釋說:「考慮到微軟的行事風格,很難想像他們會為了遺傳學研究的方便,特意升級Excel。畢竟這隻涉及很小一部分用戶的需求。」

她甚至安撫道:「大家不要為了這點小事不開心。想一想,微軟本身不過是歷史長河中的一朵浪花,轉瞬即逝。但遺傳科學將永世長存,直到文明的盡頭!大家看開一點,這種讓步算不了什麼。」

相關焦點

  • 為了避免Excel誤轉換,科學家修改了人體基因名稱
    當然這也不是普通人的煩惱,研究人體基因的科學家也為這個問題而頭疼。人體基因組中有成千上萬的基因:螺旋的雙鏈DNA和RNA一起表達了每個人都獨一無二的所有特徵和特性。為了方便研究,每個基因都有一個名稱和字母數字代碼(稱為符號,比如ATCG)。由於Microsoft Excel誤識,在過去的一年左右的時間裡,約有27種人類基因被重命名。
  • 27個人類基因被重新命名,只因Excel總把它們自動糾正成日期
    27種人類基因已因Excel被重新命名比起等待Excel的更新,要改變這惱人的現狀,科學家們覺得還是重命名基因簡單一些。人類基因的命名主要包括基因名稱和基因符號等內容,絕大多數基因的命名,由國際人類基因命名委員會(HGNC)完成。本周,HGNC發布了有關基因命名的新指南,其中包括「影響數據處理和檢索的符號」。
  • 27個人類基因被重新命名,只因Excel總把它們自動糾正成日期
    27種人類基因已因Excel被重新命名比起等待Excel的更新,要改變這惱人的現狀,科學家們覺得還是重命名基因簡單一些。人類基因的命名主要包括基因名稱和基因符號等內容,絕大多數基因的命名,由國際人類基因命名委員會(HGNC)完成。
  • 科學家重命名人類基因,以防止Excel將其誤讀為日期
    Excel不提供關閉此自動格式設置的選項,避免這種情況的唯一方法是更改單個列的數據類型。即使這樣,科學家也可能會修復自己的數據,但是一旦其他人在Excel中打開同一電子表格而沒有思考,錯誤將再次被引入。 但是,已經以負責標準化基因名稱的科學機構,HUGO基因命名委員會或HGNC的形式獲得了幫助。
  • 微軟Excel 改寫了人類基因的……
    根據The Verge報導,在過去一年左右的時間裡,約有27種人類基因被重新命名,而原因也許你會覺得荒唐,因為Microsoft避免這種情況的唯一方法是更改儲存格的數據格式。但是,科學家可能可以修正自己的數據,一旦其他人在Excel 中打開同一表格而卻忘記修改,那麼錯誤將再次發生。歸根究柢,因為Excel 不提供關閉此自動格式設置的選項。所幸,負責標準化基因名稱的科學機構-HUGO基因命名委員會(簡稱HGNC)於本周發布基因命名的新指南。
  • 基因的命名
    最近科學家對重命名了多個人類基因,以避免被 Excel 自動糾正。這的確是將好事,我以前就受到過困擾,比如這次被改的SEPT1基因,我就遇到過好幾次,由於處理數據過程中一般都會vcf文件,結果只要用excel打開,就自動變更成了9月1號,這不是玩我嗎,現在改為 SEPTIN1,很合適。
  • 因為Excel的「bug」,科學家們不得不給27種基因改了名
    但是在最近一年左右的時間裡,有約 27 種人類基因被重新命名,Excel 正是這一系列行為的「肇事者」,它會將這些基因名稱誤讀為日期格式,並直接修改成了默認格式。 這種事情並不新鮮,我們每個人或多或少都遇到過類似情況。
  • excel數字結構解析:日期和時間的自動識別規則
    不知道大家有沒有發現這麼一個現象,在excel中輸入一下不太完整的日期或時間,依然能被excel自動識別出來。比如在excel中輸入「19-12-1」,excel會自動顯示「2019/12/1」。那在excel中,識別日期和時間的規則還有哪些呢?我們一起來看看吧!時間和日期與我們的生活息息相關,比如記錄我們上班的考勤,還有統計公司業績的財務報表,都跟日期和時間有著密不可分的關係。
  • 如何命名和書寫基因——最新國際人類基因命名和書寫規則
    在作者來稿中,我們發現很多作者對於基金和蛋白質等生物分子的命名和書寫比較混亂,不符合學術論文的撰寫規則。實際上,國際早就有專門機構負責制定了統一的規則和指南。這裡我們推薦一篇《中國醫學科學院學報》發表的一篇論文「如何命名和書寫基因——最新國際人類基因命名和書寫規則」供各位作者學習參考,作者初稿準備的越規範、越認真,發表過程會越順利,周期會越短,對個人的科研能力和寫作水平都是一次鍛鍊和提升。
  • 如何讓excel自動填充顏色?使用條件格式即可輕鬆搞定
    這一章我們來學習下excel中的條件格式。什麼是條件格式呢,就是我們通過設置條件然後使滿足條件的結果更加直觀、突出的顯示出來,他的作用也非常的多,可以同來設置合同提醒,顯示重複值、突出的顯示某一個值等我們可以在開始功能組的樣式選項中找到條件格式,如下圖,我們可以看到他的選項還是比較多的,下面就來了解下它各個選項的作用吧1.突出顯示單元格規則突出顯示某一個單元格,我們可以設置大於,等於,小於一個值,然後給其填充一個顏色
  • 因為Excel,科學家們修改了27種人類基因的名稱
    但是在最近一年左右的時間裡,有約 27 種人類基因被重新命名,Excel 正是這一系列行為的「肇事者」,它會將這些基因名稱誤讀為日期格式,並直接修改成了默認格式。這種事情並不新鮮,我們每個人或多或少都遇到過類似情況。
  • 因為Excel,科學家們修改了27種人類基因的名稱
    並沒有一種簡單的解決方法能夠修復這類「Bug」,Excel 沒有關閉自動修改格式的開關,為了避免自動「轉型」,只能重設整列單元格數據類型。但是這種修復是一次性的,一旦其他人引用了相關數據,問題會再次出現。
  • 科學家重新命名人類基因 防止微軟Excel將其誤讀為日期
    人類基因組中有數以萬計的基因:DNA和RNA的微不足道的扭曲,它們結合在一起,表達了使我們每個人獨一無二的所有特徵和特性。每個基因都有一個名稱和字母數字代碼,即所謂的符號,科學家用它來協調研究。但在過去的一年多時間裡,大約有27個人類基因被重新命名,這都是因為微軟Excel一直把它們的符號誤讀為日期。這個問題並不像最初聽起來那麼意外。
  • --excel的學習
    如果你已經用excel很長時間了,那麼您一定聽過宏這個名稱,很多人都不知道宏是用來幹什麼的,今天我們就來了解一下excel中宏的作用與幫助,如果您經常在excel中重複一個任務,那就可以用宏來自動執行該任務了。
  • 颱風是怎樣命名的 颱風命名規則方法及命名一覽表(圖)
    颱風是怎樣命名的 颱風命名規則方法及命名一覽表  颱風是怎樣命名的?人們對颱風的命名始於20世紀初,據說,首次給颱風命名的是20世紀早期的一個澳大利亞預報員,他把熱帶氣旋取名為他不喜歡的政治人物,藉此,氣象員就可以公開地戲稱它。
  • excel抓取網頁數據,並實現自動刷新,再也不用傻傻的複製粘貼了
    Hello,大家好,今天跟大家分享下我如何快速獲取網頁中的表格,並且可以實現自動刷新數據,他的操作也非常的簡單,話不多說讓我們直接開始吧我們想要獲取網頁中2020年GDP預測排名這個數據,如下圖一、獲取數據首選我們需要新建一個工作薄,打開它,然後點數據功能組,點擊新建查詢,然後選擇從其它源,選擇自網站這樣的話就會彈出一個對話框,將想要提取數據的網址直接複製進去,然後點擊確定,點擊確定後excel會自動的連接計算數據當計算完成後會進入
  • 技巧不求人-151期——Excel如何同時計算加減乘除
    嗨,大家好,歡迎來到新一期的技巧不求人,上期我們介紹了Excel快速盤點的幾種技巧,今天繼續來分享excel經常會用到公式,比較常見的是加減乘除及混合運算。下面就為大家詳細介紹excel單元格如何同時計算加減乘除。
  • 給基因取一個溫暖的名字,HGNC教你給基因取名
    3 怎麼為你的新發現起個名序列變異命名法。例如:假定的雙順反子基因座可以使用不同的符號來表示不同的基因產物。通常情況下基因命名遵從如下規則:1. 每一個基因被命名為唯一符號,包括HGNC ID和描述性名稱。2. 基因符號只包含大寫拉丁字母和阿拉伯數字。3. 基因符號不應與常用的縮寫相同。4. 命名法不應包含任何物種名稱或使用「G」表示基因。
  • 今日看點:Windows系統或更改命名規則
    暫且不說性能,該系統或許一改微軟命名風格,換為Windows 365。不知是否意味著365天都在使用這個系統。閏年怎麼辦?    繼上周Windows系統未來發展規劃被曝光後,今日再有微軟Facebook帳號截圖顯示。
  • 第41981號小行星獲名「姚貝娜」 揭秘小行星命名由來
    1月16日,姚貝娜因患乳腺癌不治去世,據NASA公布的消息顯示,第41981號小行星已經被命名為「姚貝娜」(Yaobeina),這顆小行星由香港天文愛好者楊光宇在2000年12月28日發現。那麼,小行星命名規則及由來又是怎樣的呢?