資料的集中儲存成本高、易成駭客目標!Github 的開放式系統會成為我們的未來嗎?

【為什麼我們要挑選這本書】現代人的網路資料就如同線上化身一般,隨著 Web3 的興起,「去中心化」也被認為是未來資訊流的可能走向。

去中心化真的會是未來資料儲存的策略嗎?我們該如何解讀資訊流的未來發展?下文出自《資料煉金術》,由大數據領域權威麥爾荀伯格(Viktor Mayer-Schönberger)及《經濟學人》特約撰稿人蘭姆格(Thomas Ramge)合力撰寫。他們將從兩個面向分析,我們為什麼需要開放資料?(責任編輯:莊彙翌)

規定要各方開放資料的方式,從制度與結構來說,有許多不同的選擇。這裡可以分成兩大關鍵議題來談。

第一,資料是集中儲存、再讓各方都向中央單位請求提供資料,還是讓資料持有者與請求者直接完成本地資料交換?

第二,資料存取是否附有其他要求(例如必須再取得他人的同意),又或者基本上就是對所有人開放?

對於習慣大權在握的政府來說,或許會比較想建立起整套資料共享基礎設施,再由自己來管理。這就像是建立一座巨大的資料穀倉,而能夠讓第三方來穀倉取得資料。 然而,並不是所有狂妄的美夢(包括上面的穀倉幻想)都能成真。

集中式管理如龐然巨獸,易成駭客目標

簡單來說,集中式的資料穀倉不切實際。很多資料都會不斷變動,會有新資料不斷加入,而舊資料也會不斷更改、刪除。資料一旦出現改變,即使根本還沒有人要求存取這些資料,也必須傳送到中央資料穀倉做出修正。

這樣一來,代表著需要不斷更新大量的資料,這並沒有任何直接的理由或好處;這樣做不但昂貴、難以為繼,更沒有必要。而且,如果企業以後不能決定自己想把資料儲存在哪,只能被迫存在中央資料穀倉裡,甚至還會造成更多更嚴重的問題。

此外,這樣一來也無法簡化程序,因為所有企業的所有資料都必須隨時儲存在中央資料穀倉,才能在每次收到資料請求時,進行隨機選取(第三方不能取得完整資料,只能取得部分樣本)。

而且,中央資料穀倉也會讓資料安全風險提高,因為對於全世界的駭客來說,這會是極具吸引力的目標,只要能夠成功入侵,就是整個國家的巨大資料寶庫任君享用。

 TO 推薦閱讀:企業資安不容百密一疏!如何串連資料保護與資訊安全,杜絕駭客攻擊、啟動全面防護策略?

相對於中央資料穀倉,另一種模式是在資料請求者與資料持有者之間,直接進行去中心化的資料傳輸。這種做法是讓各家企業繼續管理自己的資料,不但比較實用,也比較便宜。只有在確實收到請求的時候,才需要進行資料傳輸,而沒有事前傳輸到中央資料穀倉的需要,就能減低資料傳輸的經常開支費用。

這種去中心化的模式,也具備網路安全優勢,即使某個部分遭到入侵,受到的影響也有限,整體系統將更具韌性。

去中心化是集中式的改善方案?

討論集中儲存與去中心化儲存的優劣時,會有人指出:如果採用集中式資料穀倉,儲存的資料當然會經過加密,不用擔心駭客問題。另外也可以透過「資料受託人」(data fiduciary)的機制,監督資料的管理與存取。

然而,這兩種做法的幫助都有限,畢竟不論再怎麼加密,一座巨大而又珍貴的資料穀倉總是會引來風險。近年來,許多理應經過安全加密的資料庫都曾遭駭客入侵,對於那些認為這絕對安全的人來說,應該足以做為警訊。

至於培養新的「資料受託人」專業角色,無論是從技術或組織的客觀角度、或是從民眾個人的主觀角度,都無法解決安全風險問題。是要讓誰成為受託人?我們為什麼要相信他們?控制著大筆資料的「資料受託人」會不會變成是大型電信公司?又或是一群很懂法律、卻幾乎沒有科技專長的律師?

有些評論者認為,唯有政府(無論是國家、州、或是地方政府)能夠成為合適的資料受託人。但從許多國家政府的數位能力看來,即使姑且不論建置集中式資料穀倉的成本,仍然很難讓人有信心相信政府能夠挑起這樣一個重要的技術職務、讓資料穀倉運作順暢成功。

如果是去中心化的模式,資料是直接從持有者傳輸給請求者,這種方式更有彈性、更精簡、效率也更高——當然也就是更好的方式。此外,這種模式也不需要有任何的中介機制。

 TO 推薦閱讀:企業遭網路攻擊次數狂增 1000%!如何靠「雲端」與「零信任」打造最強資安之盾?

GitHub 的開放式系統會是資料存取權的未來?

資料存取權的第二項重大決定,則是究竟要採取開放式或閉鎖式;也就是說,是基本上人人都可參與?還是僅允許特定群體參與?

用技術術語來說,問題在於要打造一座封閉式的資料池、或是開放式的資料存取系統?例如 GitHub,這是全球最大的開放原始碼平臺,現在隸屬微軟旗下,幾乎是人人都能夠輕鬆使用,你可以從平臺下載原始碼,也可以把自己的程式上傳到 GitHub。這就是一個大致上採取開放式的系統

相對的,加州資料合作組織(California Data Collaborative)負責管理一座關於加州用水的資料池,這些資料都經過清理、標準化與加值強化,只有組織成員才可存取,而成員主要是加州當地的水務機構。

各地政府現在正為了這項決定而大傷腦筋。例如在 2020 年 2 月,歐盟執委會宣布將打造所謂的「資料空間」,提供給各種不同應用領域與經濟部門使用。如果這指的是有存取限制的資料池,就無法符合開放、去中心化的精神。(對於薩克瑟尼安來說,矽谷能在過去幾十年裡創下不斷創新的紀錄,這種精神功不可沒。)

正因如此,歐盟執委會主席馮德萊恩清楚指出:應採開放式的架構。

然而,無論在歐盟或許多其他情境下,一切仍懸而未決,不知道在這條放寬資料存取權的路上,最後會選擇怎樣的架構與機制;雖然就邏輯看來,似乎傾向選擇的是「開放、去中心化」的策略。

 TO 推薦閱讀:Web3 新創資安「才剛起步」!區塊鏈中隱含了哪些資安危機?

資安 企業 去中心化

(本文書摘內容出自《資料煉金術:開放資料存取權,重燃創新之火》,由 天下文化 授權轉載,並同意 TechOrange 編寫導讀與修訂標題。首圖來源:Unsplash)

AD