【Excel 越改越難用?】科學家改不了 Excel 格式,只好重新命名 27 種人類基因

【我們為什麼挑選這篇文章】大家平常用 Excel 的時候肯定會有明明不是要輸入日期、金錢,卻硬被轉成格式輸入的困擾。前幾年一項研究指出約有五分之一的公開遺傳數據都存在著錯誤的基因名稱,背後原因竟和 Excel 格式設定有關,27 種基因因此被改名,Microsoft 有可能為此更改設定嗎? (責任編輯:賴佩萱)

本文經 AI 新媒體量子位(公眾號 ID:QbitAI)授權轉載,轉載請連繫出處

作者:量子位

在 Excel 裡輸入證件號的時候,你是否有過數字秒變科學計數法的抓狂經歷?

讓人萬萬沒想到的是,Excel 類似這樣的功能,竟然在過去一年裡,導致 27 種人類基因被重新命名,因為這些基因符號,總被 Excel 誤讀為日期。

基因符號常被 Excel 誤判為日期

比如一個名為 MARCH1(Membrane Associated Ring-CH Type Finger 1)的基因,當你將其輸入到 Excel 中。

2016 年的一項研究就指出,由於 Excel 在預設狀態下,會將基因名稱轉換為日期和浮點數,大約有五分之一的公開遺傳數據都存在錯誤的基因名稱轉換。

據 The Verge 報導,英國 Quadram 研究所的系統生物學家 Dezső Módos 就表示:這真的非常非常煩人。

27 種人類基因已因為 Excel 被重新命名

比起等待 Excel 的更新,要改變這惱人的現狀,科學家們覺得還是重命名基因簡單一些。

人類基因的命名主要包括基因名稱和基因符號等內容,絕大多數基因的命名,由國際人類基因命名委員會(HGNC)完成。本週,HGNC 發布了有關基因命名的新指南,其中包括「影響數據處理和檢索的符號」。

HGNC 表示,從現在起,在命名人類基因及其表達的蛋白質時,將採用 Excel 預設格式下也不會被錯誤轉換的方式。比如,把 SEPT1 修改為 SEPTIN1、MARCH1 修改為 MARCHF1。

HGNC 也將儲存舊符號和名稱的記錄,以避免將來造成混亂。

據 The Verge 報導,HGNC 表示,到目前為止,大約有 27 個基因名稱已經按照這個規則進行了更改。重新命名基因,自然會帶來一些麻煩,比如影響到以前發表的相關研究的檢索。不過,HGNC 的工作人員 Elspeth Bruford 表示,儘管基因重命名並不是輕而易舉的決定,但也並不罕見。

比如,許多可以讀作名詞的基因符號已經被重新命名,以避免搜索的時候出現混亂,CARS 改為 CARS1,WARS 改為 WARS1 就是這樣的例子。

微軟有可能因此修改函式嗎?

這樣的消息一出,立即引發了國內外網友的熱議。有網友表示,這顯然應該讓微軟改啊,不只是基因符號的輸入遇到了這種問題,平常輸入項目編號什麼的,也會被自動轉成日期。

也有網友指出,雖然可以事先將 Excel 中的單元格設置為文本格式,但在實際工作中,經常遇到的情況是: 專業軟體導出 txt/csv 文件,再用 Excel 打開,某些基因名還是會被自動轉成日期

更麻煩的是,一旦被自動轉換,再去改成文本格式是無法恢復成原來的文本,這就會導致大量數據的丟失。

並且,目前沒有任何辦法關掉 Excel 預設設置下的自動格式轉換。

對此,Elspeth Bruford 認為,這畢竟是 Excel 軟體的有限用例,「Excel 的其他廣大用戶正在廣泛使用這樣的功能,對於微軟來說​​,幾乎沒有什麼動力去對這些功能開刀」,所以,還是改基因名字更簡單些。

那麼,你怎麼看呢?

(本文經 AI 新媒體量子位 授權轉載,並同意 TechOrange 編寫導讀與修訂標題,原文標題為 〈27 個人類基因被重新命名,只因 Excel 總把它們自動糾正成日期 〉;首圖來源:pixabay。)

你可能會有興趣


科技報橘 LinkedIn 上線!

最新科技產業動態、技術新突破、專業職能技巧提升 ....... 鎖定 TO  LinkedIn 專業品牌,提升職能與產業 Know-how,躋身產業菁英之列 https://www.linkedin.com/showcase/techorange

點關鍵字看更多相關文章: