科學家用「蛋白質」儲存檔案!準確度高達 99.9%,也不用擔心被駭

【為什麼我們要挑選這篇文章】從古至今,人類儲存資料的方式一直在改變,從壁畫、竹簡、紙張一直到現今的電腦、雲端等,不過任何方式都會有相應的風險存在。

科學家們發明了一種新的儲存資料方法,他們利用比 DNA、RNA 更小的寡肽(兩個或多個結合在一起的肽)儲存數據,經檢驗,這種儲存方式的檢索準確率為 99.9%,也沒有被駭的風險,消耗能量比起雲端儲存更是低得多。

這能成為新形態的資料儲存方式嗎?(責任編輯:藍立晴)

我們怎麼儲存資料?

寫下來的紙張會被焚毀,電腦可能會被駭,DVD 可能會無法讀取。威脅無處不在,從簡單的一盆水到複雜的網路攻擊,都有可能讓我們的記錄化為烏有。

資訊爆炸,數據暴漲,可能未來連雲端也無法承載,而且它無法阻擋住所有駭客,還會持續消耗能量。據估計,2020 年,全球數位化檔案估計將達到 44 兆 GB,數位化海嘯馬上就要席捲而來,浪潮之下,我們應該如何面對海量資訊?

現在,有一種儲存資料的新方法可以穩定地儲存數百萬年的數據,並且不受到駭客的威脅。

它佔用的空間非常小,想像一下用一湯匙的蛋白質,就可以保存整個紐約市公共圖書館的資料,而一鍋蛋白質就可以容納所有地球往事。並且一旦編寫,就不會再消耗能量。所需要的只有一個化學家,一些易得的分子和需要儲存的資訊。

這是哈佛大學與西北大學合作開發的一個項目,研究結果已經在國際學術期刊 ACS Central Science 發表。該項目提出並實現了利用易獲得、低耗能、穩定且能超長時間保存的寡肽分子儲存數據(以二進制形式),數據檢索準確率超過 99%

從生物學到有機化學:數據儲存的靈感

利用生物儲存能力來儲存數據的想法早已有之,並且已經有了一定的進展。比如,目前我們已經可以通過合成DNA鏈來記錄資料,記錄的資廖可以從美食照片,烹飪教程一直到擼貓視頻。

但是雖然 DNA 與電腦晶片相比較小,但還是屬於大分子。並且,DNA 的合成需要大量重複的勞動。如果每條資料都需要從頭開始設計編譯,那麼大分子儲存可能會因為過於昂貴耗時而無法實現。

Brian Cafferty,該研發團隊的成員之一,也是論文的第一作者介紹說,於是他們的研究團隊從生物學轉向有機和分析化學尋求靈感,開發使用一種更小、更低分子量的分子來編碼資料的方法。

這種儲存方式只需一次合成就可以生成足夠的小分子,用以編碼多個影片,使這種方法無疑比基於 DNA 的方法更省力也更便宜。

用分子實現聽說讀寫畫

該團隊選擇的低分子量分子是寡肽(兩個或多個結合在一起的肽),這些肽常見而穩定,並且比 DNA、RNA 或蛋白質分子量都要小。

而且由於組成寡肽的氨基酸數量和類型不同,它們的分子質量是有差異的。當不同的寡肽分子混合在一起時,這種差異可以實現相互區分,不同質量的分子就像字母表中的不同字母一樣。

將這些「字母」組成單詞會有點複雜,該團隊將不同質量的寡肽儲存在 384 個不同的「微孔」中,然後將寡肽混合物放置在金屬板的表面上,就像將墨水印在書頁上一樣。如果想要讀取「寫下」的內容,可以通過質譜儀按質量對微孔中的分子進行分類,查看這個孔中存在哪些寡肽、不存在哪些寡肽,由此讀取內容。

圖片來源:Michael J. Fink

然後團隊使用二進制編碼將混亂的分子翻譯成字母和單詞。例如,字母「K」在ASCII(美國資料交換標準代碼)中被寫作 01001011,就可以通過使用八種不同質量的寡肽儲存「K」。

將微孔中存在的四種寡肽讀取為「1」,而缺失的四種讀取為「0」(如下表)。這些分子二進制代碼指向相應的字母;如果儲存的資訊是圖像,則指向相應的像素。

使用這種方法,八種寡肽的混合物可以儲存一個字節的信息; 32 種寡肽的混合物可以儲存四個字節,以此類推。

更快,更便捷,更安全

到目前為止,Cafferty 和他的團隊已經用這種方法記錄、儲存並「閱讀」了物理學家Richard Feynman 的著名演講、Claude Shannon(他被稱為「現代資訊理論之父」)的相片和葛飾北齋的畫作《神奈川衝浪裡》。

經檢驗,這種儲存方式的檢索準確率為 99.9%平均「寫入」速度為每秒 8bits,「讀取」速度每秒 20 bits

雖然目前還比大多數數據儲存設備要慢,但隨著技術的繼續發展,速度肯定還會提升。例如,如果噴墨列印機可以以每秒 1,000 次的速率產生液滴,就能將更多資訊塞入更小的區域,或者再加以改進質譜儀,使之可以同時獲取更多信息。

未來,還可以通過引入不同類別的分子,提高儲存的穩定性和容量,並降低成本。實驗中使用寡肽是訂製的,因此價格較貴。但未來還可以考慮可以購​​買更便宜的分子(如烷硫醇),可望僅花 1 美分就可記錄 1 億 bit 的資料。

「目前,這種方法還不會取代現有的數據存儲方法,」Cafferty 說,「我們認為它是對現有技術的補充,非常適合長期存檔數據儲存。」Cafferty 團隊提出的分子儲存方法是一種穩定的、零耗能、抗腐蝕的儲存可選方案。

寡肽等分子具備復原能力,可以在數百年甚至數千年的時間內保持穩定性。在高溫和乾旱的情況下,這些分子可以在沒有光或氧的情況下存活下來。

而且,駭客無法像攻破雲儲存那樣竊取分子儲存的內容,分子儲存只能通過人工訪問。即使被發現藏匿的數據,小偷也需要擁有足夠的化學知識才能檢索代碼。

所以未來,即使所有的書都付之一炬,所有的電腦都被駭了,所有 DVD 都被毀壞,這些分子可能還會繼續存在,提醒未來的人類,我們曾經是多麼喜歡那些萌萌的貓咪影片。

原文傳送門
論文出處

(本文經 大數據文摘 授權轉載,並同意 TechOrange 編寫導讀與修訂標題,原文標題為 〈超越雲存儲,用一勺蛋白質保存整個圖書館〉 。首圖來源:維基百科。)

延伸閱讀

【DNA 當隨身碟】微軟用 DNA 儲存資料,並成功研發讀取資料的全自動系統
【老兵越戰越勇】60 年前的古早儲存科技「磁帶」,為何時至今日仍然屹立不搖?
【微軟砸錢買了人工 DNA】在微軟眼中,這可是 1024×1024 TB 的超級大硬碟