NVIDIA 開源 GPU 加速平台,數據分析速度相較 CPU 暴增 50 倍

【我們為什麼挑選這篇文章】NVIDIA 開源了新平台,可能會讓現在的資料運算方式迎來一波新革命,透過 NVIDIA 的新開源平台,可以讓過需要花上數十小時,數天的建模工程,縮短到幾分鐘,或是幾小時,將會大大加快 AI 的構建效率。(責任編輯:林子鈞)

本文經 AI 新媒體量子位(公眾號 ID:QbitAI)授權轉載,轉載請聯繫出處

作者:量子位/李根

如果你是數據工作者,到底對此是愛是恨?

因為這個名為 RAPIDS  的開源 GPU 加速平台出現,固有的數據工作,看起來將迎來變革。

有人歡迎,可能也有人討厭。

其中,該平台的「始作俑者」黃教主認為會遭恨。因為以前大家都想當數據科學家,由於數據科學家不是在喝咖啡,就是在喝咖啡的路上——畢竟光數據加載的過程就非常漫長。

但認為大家會愛的,也是黃仁勳。看看他一臉燦爛的笑容,就知道他為這項新發佈多麼得意。

50 倍加速

這個新平台,要從 10 月 10 日的 GTC 歐洲大會說起。

會上,黃教主針對數據工作曉之以情、動之以理、斥之以大義後,正式發佈針新的 GPU 加速平台:RAPIDS。

譯成中文,有「急流」之意,可能也是為顯示數據相關工作從此變天。

如何理解這個新的 GPU 加速平台?

英偉達給的三組關鍵詞:數據科學& 機器學習、軟件平台,以及開源。

而且很明確,RAPIDS 的誕生,就是希望幫助企業以「前所未有」的速度分析海量數據並進行精準的業務預測。

有多「前所未有」?英偉達給出的答案是 50 倍

拿來對比的,仍然是 CPU。

英偉達稱,最初的 RAPIDS 基準分析利用了 XGBoost 機器學習算法在 NVIDIA DGX-2TM 系統上進行訓練,結果表明,與僅有 CPU 的系統相比,其速度能加快 50 倍。

所以這能夠幫助數據科學家將典型訓練時間從數天減少到數小時,或者從數小時減少到數分鐘——具體取決於其數據集的規模。

並且 RAPIDS 不是光比不用,發佈之前,就已經經過一些企業真槍實彈檢驗。

比如 WalMart。其 CTO Jeremy King 就表示,GPU 加速平台及 RAPIDS 軟件極大改進了 WalMart 使用數據的方式,可以實現複雜模式大規模地運行,同時進行更加精準的預測。

此外,惠普、甲骨文、SAP、Cisco 等一眾數據大戶,也紛紛點了讚。

但英偉達強調,這不是私人定製式的服務。

開源

因為 RAPIDS,可以說從開源社區中來,到開源社區中去。

黃仁勳演講中介紹,RAPIDS 構建於 Apache Arrow、pandas 和 scikit-learn 等流行的開源項目之上,為最流行的 Python 數據科學工具鏈帶去 GPU 提速。

為了將更多的機器學習庫和功能引入 RAPIDS, NVIDIA 廣泛地與開源生態系統貢獻者展開合作 ,其中包括 Anaconda、BlazingDB、 Databricks、Quansight、scikit-learn、Ursa Labs 負責人兼 Apache Arrow 締造者 Wes McKinney,以及迅速增長的 Python 數據科學庫 pandas 等等。

此外,為了推動 RAPIDS 的廣泛應用,英偉達也努力將 RAPIDS 與 Apache Spark 進行整合,後者是分析及數據科學方面領先的開源框架。

所以現在,全套 RAPIDS 開源庫,前往 http://www.rapids.ai 就能獲得,且代碼經 Apache 許可公佈。容器化 RAPIDS 版本,也能在 NVIDIA GPU Cloud container registry 上獲取。

如果你是數據科學家,如果你希望數據準備和訓練加速,當前 GPU 給出了新選擇。

英偉達新蛋糕

或許你也會問 Why?英偉達這一步的目的何在?

那就會得到「歷史進程」的回答。

英偉達方面說,數據分析和機器學習是高性能計算市場中最大的細分市場,不過目前尚未實現加速,在圖形圖像領域的版圖構建完整後,GPU 不入數據誰入數據?

而且之前在解決深度學習算力的過程中,大數據和機器學習方面的呼聲,也在一日高過一日。

更何況,英偉達自己也承認,這會是一個利益巨大的細分市場。

他們援引分析預估,稱面向數據科學和機器學習的服務器市場每年價值約為 200 億美元(約 6000 億台幣),加上科 學分析和深度學習市場,高性能計算市場總價值大約為 360 億美元(約 7200 億台幣)。

又有誰能拒絕這樣的大蛋糕誘惑?

而且按照英偉達的方式,越是把軟件平台打磨好開源,吸引的用戶越多,GPU 的需求量也就會越多,英偉達賺得也會越多——進一步創新的資本和動力也會更強。

AI 時代裡站著把錢掙了,英偉達外,還有誰?

最後,再次送上傳送門:

全套 RAPIDS 開源庫

NVIDIA

NVIDIA 推新顯卡讓技嘉、微星電競市場重新升溫,不怕挖礦熱退!

NVIDIA 讓 AI 學會造人!隨便給幾條線,AI 都能製造出擬真度 100% 的假影片

NVIDIA 發佈搭載「圖靈架構」新顯卡,專為光影追蹤設計最高要價 30 萬台幣

(本文經 AI 新媒體 量子位 授權轉載,並同意 TechOrange 編寫導讀與修訂標題,原文標題為 〈英偉達新開源 GPU 加速平台:主打數據科學和機器學習,50 倍於 CPU〉。)

點關鍵字看更多相關文章: