AI 晶片爭霸戰:深度學習領域中 NVIDIA、AMD、Intel 誰才是真正的老大?

【我們為什麼挑選這篇文章】三大廠你支持哪一個?儘管現在檯面上的王者是 NVIDIA,不過緊追在後面的 Intel 與 AMD 都有其優勢所在,Nvidia 的阿基里斯腱也十分明確,讀完本篇文章,了解三大廠在 AI 晶片領域的此消彼長吧!(責任編輯:陳君毅)

隨著 NVDIA Titan V 的發布,我們邁入了深度學習硬件發展的動盪期。

NVIDIA 能否在 2018 年保住深度學習硬件首要供應商的地位還未可知,AMD 和 Intel Nervana 都仍有機會上位。

所以對於想買硬件的消費者,最精明的選擇就是等上 3 至 9 個月,到這種不確定的狀態過去之後再決定。

深度學習芯片領域的競爭從未停止過

NVIDIA 決定在競爭初現端倪之前,先將自己的壟斷地位變現。通過這種方式,他們希望在未來 1-2 年內確保行業領先,所以他們的 Titan V 的售價高達 3000 美元(約 15 萬元台幣)!

雖然 Titan V 的深度學習專用核心 Tensor Core 有著獨特的性能,但性價比實在太糟,使其市場吸引力不足,只是現階段除此之外又沒有別的選擇,所以至少當前就有什麼用什麼吧。

AMD 的硬件水平已經趕超 NVIDIA 了 ,而且他們計劃再開發出相匹配的深度學習軟件。如果這一步實現的話,其性價比會輕鬆超越 NVIDIA,並在此領域成為新的標杆。而屆時 NVIDIA 就會憑藉著雄厚的資金實力來拼市場,所以我們或許會在未來看到非常便宜的 NVIDIA 產品。

注意這種情況是建立在 AMD 推出高質量軟件的基礎上——如果 AMD 跳票,則喪失了搶走桂冠的機會,而 NVIDIA 的產品將仍停留在高價位。

市場上還有另一位新晉競爭者:Intel Nervana 的神經網絡處理器(NNP)。憑藉著幾種迎合 CUDA 開發者需求的獨特性能,它表現得還比較有競爭力。NNP 處理器可以解決優化深度學習的 CUDA 內核中絕大多數的問題,這款芯片才真正稱得上第一枚深度學習芯片。

通常意義上, 對於單一芯片之間的排名,我們會按照 Nervana > AMD > NVIDIA 的順序來排 ,因為 NVIDIA 的芯片不得不在遊戲、深度學習和高性能運算中維持平衡,AMD 也需要同時考慮遊戲和深度學習,只有 Nervana 可以聚焦於深度學習,這是一個巨大的優勢,使得他們的芯片較其他兩家少了很多無用的結構設計。

然而,獲勝者往往不是取決於純粹的性能或者性價比,而是要綜合考慮 性價比 + 周邊生態 + 深度學習框架

讓我們來仔細了解一下這三家公司產品的優劣,看看它們到底處於什麼位置。

Intel Nervana 的神經網絡處理器(NNP)

Intel Nervana NNP:專為 AI 而生。
Intel Nervana NNP:專為 AI 而生。

Nervana 芯片的獨特之處在於它為計算擴展出大空間的緩存(類似 CUDA 共享內存),相當於 GPU 的 10 倍,而單個計算單元的緩存是 GPU 的 50 倍。有了這種設計,其運算速度會提升至少一個量級,就可以在緩存內完成算法與模型計算並輕鬆地訓練 TB 字節的數據(如一個帶有 200 個單元的多層 LSTM)。

得益於 Flexpoint 這個特殊的數據類型,Nervana 的芯片能夠在緩存/RAM 內存儲更多的數據併計算得更快。 所有這些創新都意味著其比當前 NVIDIA 的 GPU 提速了 10 倍 。這已經獲得了初創公司以及一些大公司的關注。但是,所有這些的前提是他們能克服主要的問題:周邊生態以及軟件。

普通的用戶和研究人員幾乎完全依賴於芯片周邊的生態系統。如果沒有了這些,我們將無法使用緩存內的算法以及好的軟件框架,從而無法更好的利用芯片。

所有人都希望使用可靠過硬的深度學習框架,而 Nervana 的深度學習框架 Neon 是否給力是值得懷疑的。軟件使用優先於硬件支持,如果 Nervana 僅僅出品良好的芯片而不在軟件以及周邊生態系統上發力的話,他們將輸掉這場競爭。

軟件以及生態系統與價格緊​​密相關。如果 Nervana 家的 NNP 價格定得太高,學生根本負擔不起。雖然行業內的各種企業客戶為硬件公司支付了絕大部分的收入,但僅憑產業化的應用是無法構建繁榮的生態環境的,學生群體才是促使硬件周邊生態環境繁榮的主要驅動者。

只有當廣大學生們可以支付得起之後,才會有眾多配套軟件得以湧現。任何超過 3000 美金的產品想都不要想;超過 2000 美金而且對學生有額外折扣的產品還湊合,沒準會讓人用用,一個 2000 美金的 NNP 還是會有一些接受度的;而如果產品低於 1500 美金,Nervana 在 2-3 年內將會成為市場的主導者。

如果把價錢定在 1000 美金左右,那另兩家競爭者將會非常痛苦,而配套的軟件就會如雨後春筍,不再是個問題。

如果 NNP 的價格低於 2500 美金,我是肯定會買的。它的性能比 GPU 好太多,我可以用它來做好多原來無法在 NVIDIA 產品上實現的事。但如果它超過了 2500 美元,這是我能承受的上限,我看還是把錢省下來吧,雖然好的硬件非常重要,但我還需要錢來幹別的呢。

對於一般的消費者來說,價格不是他們考慮的唯一因素,他們還會考慮到產品的相對應的周邊生態。

如果 Intel 沒有快速的將盡可能多的資源投入到該產品的周邊生態並打造一個可靠的軟件組成,那麼 NNP (The Neural Network Processor) 的發展就會停滯不前並且最終消亡。不幸的是,Intel 曾經因為對周邊生態的管理不善而犯過這樣的錯誤。如果發生了,這將非常讓人失望,因為我真的很希望 Nervana 獲得成功。

總體來說, 如果 Nervana 開發的 NNP 可以把價格控制在 2000 美金以下,並且在這個產品發布之後的短短幾個月內快速生成一個強大的周邊生態和軟件開發環境,那麼這款產品將會擊敗它的同類競爭者而勝出。如果 NNP 的價格稍高同時周邊生態略差,那它依然還是個不錯的產品,只是就性價比和方便程度來說,它不能完勝它的競爭者們。當它的價格高於 4000 美金或是不具備一個基本的產品周邊生態的話,NNP 甚至會完敗。

對於高於 2000 美金的 NNP 來說,如果希望它能對於一般學生有很好的新引力,那麼該產品需要對學生有著相當程度的折扣才可以。

AMD:便宜又強大,軟件方面還需努力

AMD 的顯卡非常的棒。Vega Frontier Edition 系列明顯的要優於 NVIDIA 的相應產品,通過一項類似於對 Volta 和 Pascal 所做的無偏差標準測試,在使用液態冷卻的前提下,Vega Frontier 的性能要持平甚至優於 Titan V 。值得注意的是,Vega 是基於傳統的圖形處理芯片架構,而 Titan V 是全新的。這樣,在 2018 第三季度即將發布的新一代 AMD 架構,將會有更加出彩的表現。

AMD 希望僅僅通過把 32-bit 浮點數運算的圖形處理芯片換成 16-bit,從而在深度學習硬件開發上取得成功。這是一個既簡單又有效的策略。這樣設計的 GPU,雖然對於高性能計算沒有什麼用處,但是對於遊戲玩家以及深度學習社群來說,這樣的改變會獲得更穩定的表現,同時由於 16-bit 浮點數運算顯卡的運算非常直接,芯片的開發成本也會相應降低。

當然,如果單純依靠性能指標來說,這樣的改變不可能優於 Nervana 的 NNP,但是就性價比來說,市場上所有的產品都無出其右。你可以僅僅花費 700 美元(約 2.1 萬台幣)就買到一款液態冷卻的 Vega Frontier 顯卡,而它的性能比起 3000 美金的 Titan V 僅僅差了一點而已。

然而最大的問題是軟件。即使你擁有了這麼強大的 AMD GPU,你卻很難使用它——因為目前沒有一款主流的軟件框架能夠很好支持 AMD GPU。

AMD 自身也處於這個發展過渡期,關於軟件的發展過渡期。目前來看,他們打算放棄 OpenCL 而轉向 HIP。但是他們現在官方依然支持 OpenCL 這種方法。

如果他們想推動 HIP 而且在未來九個月內投放一些很好的深度學習軟件於市場(不僅僅是用來計算卷積和矩陣相乘的軟件包而是一個完整的深度學習框架,比如說 HIP 可以支持 PyTorch),那麼,他們在 2018 第三季度即將發布的新一代 GPU 會獲得巨大的潛力並且擊敗所有競爭者。

總體來說,如果 AMD 能夠把它在軟件方面所有棘手的問題處理好,那麼毫無疑問它會成為深度學習硬件領域的主導力量。

NVIDIA:地位堅固的硬件界大佬

NVIDIA 的江湖大佬地位毋庸置疑。他們擁有最棒的軟件系統,最好的工具,他們的硬件很棒並且產品具備一個龐大,強壯並且完整的生態圈。

NVIDIA 的主要問題在於他們需要服務於多種使用者:高性能計算需求者、深度學習從業者、還有遊戲玩家。這對於他們的硬件是一個巨大的壓力。設計這些客戶定制的圖形處理芯片是非常昂貴的,因此 NVIDIA 的策略是設計一款多用途,適合所有框架的芯片,這項任務幾乎很難完成。因此 Titan V 只是一個很中庸的產品。

伴隨競爭者的出現,NVIDIA 有兩種選擇。(1)不停的壓低價格,直到拖垮對手,或者是(2)開發出屬於自己的專有深度學習圖形處理芯片。

NVIDIA 擁有足夠的資源去打價格戰,並且它也擁有足夠數量的專家去執行第二套方案。然而,設計新型的芯片需要一定的時間,NVIDIA 有可能在此間失去王者的寶座。所以,我們很有可能看到它會同時執行兩套方案:打價格戰拖垮推手,從而為自己設計出專屬的深度學習芯片贏得時間。

總體來說,NVIDIA 的王座受到了一定的威脅,但是它有足夠的經驗和資源去擊敗出現的競爭對手。我們很有可能在未來看到一個便宜的 NVIDIA 顯卡和專為深度學習打造的產品。不過如果 NVIDIA 不去降價打價格戰的話,它是可能(暫時地)失去王者的地位的。

深度學習硬件的混戰意味著目前不是一個投資該領域的最好時機,但是這也同時意味著更便宜的 NVIDIA 卡,可用性更高的 AMD 卡,以及超快的 Nervana 卡會很快出現。這是一個激動人心的時代,我們消費者將會從這樣的競爭當中獲得巨大的利益。但是目前,我們必須耐心等待。

——

(本文經合作夥伴 大數據文摘 授權轉載,並同意 TechOrange 編寫導讀與修訂標題,原文標題為 〈深度學習的硬件之爭關鍵年:NVIDIA,AMD,Intel 鹿死誰手?〉。)

更多關於晶片的文章

Intel 最會賺錢的 CEO 歐德寧離世:他最後悔的事情,就是沒有答應為 iPhone 做晶片
NVIDIA CES 大發威:最強 Xavier 車載晶片,讓「真正的無人車」降臨
一次搞懂 Google 的 AI 晶片佈局:從研發 TPU 、收購 HTC 到挖角蘋果王牌晶片設計師


【2018 年 TechOrange 招募新血,引領台灣正向改變】
如果你平常關注人工智慧、fintech、區塊鏈、創新創業、數位行銷、技術開源、資安、物聯網、經營管理、科技小物等,加入《TO》跟我們一起關注社會、產業創新!

TechOrange 社群編輯、實習生持續徵才中
意者請提供履歷自傳以及文字作品,寄至 jobs@fusionmedium.com
來信主旨:【應徵】TechOrange _填上應徵職稱_:您的大名

點關鍵字看更多相關文章: