【闢謠】AI 圈子白擔心了!NVIDIA 顯卡還是可以跑深度學習

 NVIDIA ,這回真的被「冤枉」了

【我們為什麼挑選這篇文章】上星期,TO 報導了關於 NVIDIA 疑似要禁止大眾使用旗下顯卡,進行深度運算的消息。

而如今更進一步的消息傳來,這一切很可能都是場誤會:NVIDIA 確實改了規定,但並非限制大家不准跑深度運算、或是鼓勵挖礦,真正的目的其實是為了限制雲端服務提供商!

那,當初消息是怎麼被傳成大家都不准跑深度運算,NVIDIA 又為何要限制雲端服務商呢?看完這篇分析,大家就會瞭解了。(責任編輯:林厚勳)

這幾天,圍繞著英偉達的一份使用禁令,國內的人工智慧和科技圈展開了極其熱烈的「討論」,但隨著昨天英偉達公佈官方意見,這件事終於水落石出。

結論只有一個—— 英偉達這次真的被「冤枉」了。

重新審視 NVIDIA 新規,疑問究竟在哪裡?

首先我們先來重新「複習」一下新規,以及此次整個事件的爆發。

此次的新規定實際上來自於英偉達英文官網的 GeForce 驅動下載頁面,用戶在下載驅動之前必須勾選相應的許可協議(與安裝軟體之前必須勾選的那種相似)。這也意味著—— 所有使用 GeForce 驅動軟體的用戶,默認實際上是都同意了本許可協議。

 NVIDIA ,這回真的被「冤枉」了

爭議性的內容出現在「授權許可」部分中的「限制」項中,具體說法為「數據中心並不被許可使用該軟體,除非數據中心在進行區塊鏈運算。

這一內容最早被德國科技雜誌 golem.de 發現並即時報導,隨即被用戶「booooomba」發上 Reddit 論壇,但在新聞的描述中卻悄然發生了改變——「The new NVIDIA EULA prohibits Deep Learning applications to be run on GeForce GPUs.(新的 NVIDIA EULA 禁止在 GeForce GPU 上運行深度學習應用程式。)」

究竟為什麼「booooomba」會選擇這個角度來詮釋新規,我們不得而知,但這份新規的確帶來了以下幾個疑問:

  • 這項規定中所指的「數據中心」究竟是指什麼?
  • 為什麼區塊鏈運算會被排除在外?
  • 「限制」條款中其他三項都是常見的產品權利,為什麼會在第四條出現一條如此具體的規定?

接下來,雷鋒網就這三個主要疑問做進一步的解析。

關鍵疑問 1:究竟 NVIDIA 想限制什麼?

昨天, NVIDIA 官方給雷鋒網的回覆中,可以明確得知一點 —— 此次新規定針對的對象並不是普通的 GeForce 顯卡用戶,而是大型數據中心。 而在擁有這些大型數據中心的,往往是各大雲端服務提供商。

將GTX1080Ti放進伺服器。
將 GTX1080Ti 放進伺服器。

NVIDIA 官方聲明中是這樣說的:「不鼓勵用戶在嚴苛的大規模企業環境中不恰當的使用我們的 GeForce 和 TITAN 產品」。同時 NVIDIA 還強調:「研究人員通常會將 GeForce 和 TITAN 產品用於非商業用途或其他不以數據中心規模運作的研究用途。 NVIDIA 無意禁止這些用途。」

通過這兩條闡述,我們不難看出其中的兩個、需要同時滿足的關鍵界定標準: 是否商業用途、數據中心規模 。將這兩個條件結合起來,我們能得到的就是目前正在向用戶提供「GPU 雲端計算」服務的大中型雲端服務提供商們。

關鍵疑問 2:為什麼要「放」區塊鏈一馬?

在很多之前的報導中,很多媒體都或多或少加入了一種「描述」:「NVIDIA 這次限制了數據中心,卻放過了比特幣挖礦!」,有的友媒甚至在標題上大大的寫著「英偉達新禁令:不能隨便用 GeForce 顯卡跑深度學習(挖礦可以)」,但事實真的是如此嗎?

首先需要澄清的第一點是, NVIDIA 從來就不支持 GeForce 系列產品用來挖礦。 今年年中, NVIDIA 就曾在某顯卡品牌活動上直接表示:「NVIDIA 不鼓勵 GeForce 遊戲顯卡挖礦,不鼓勵用戶這麼做,要挖礦請使用專門的挖礦顯卡型號」。

 NVIDIA ,這回真的被「冤枉」了

雖然截至目前這句話仍未寫在任何規定當中,但 NVIDIA 在今年年中拿出的專用挖礦 GPU 就是最好的證明。今年 NVIDIA 推出的挖礦專用顯卡代號「P106-100」,在消費級市場的 GeForce GTX1060 顯卡「修改」而來,但不僅沒有硬體圖像輸出接口,就連 Dirext 功能(微軟的顯示 API 軟體,目前 Windows 上的各類遊戲都需要此軟體才能運作)也在物理層面上被閹割掉。

如此大費周章的目的只有一個 —— 儘可能保護消費級市場。

在比特幣曾經輝煌的 2013-2014 年,AMD 的 HD7000 系列也曾發生過長時間的斷貨現象。但隨著 2014、2015 年比特幣大幅降溫,越來越多曾經用於挖礦的 AMD 顯卡「重返」消費級市場,這一批經過挖礦「虐待」的產品極大地衝擊了 AMD 的消費級產品市場,所帶來的售後問題更是讓 AMD 叫苦不迭。

 NVIDIA ,這回真的被「冤枉」了

對於顯卡挖礦潮這件事, NVIDIA 實際上一直有著警戒之心,今年早些時候由 ICO 帶動的「挖礦潮」興起時,國內很多 NVIDIA 顯卡 OEM 廠商在產品包裝外部專門貼上表示:「如果本產品被用於挖礦,我們將保留拒絕保修和維護的權利。」

從 AMD 的前車之鑑、到 OEM 廠商生命、再到專門礦卡 P106-100 的推出, NVIDIA 躲挖礦還躲不及呢,怎麼可能對它表示支持的態度呢?

P106 礦卡的驅動實際上由GeForce 驅動修改而來。
P106 礦卡的驅動實際上由 GeForce 驅動修改而來。

問題來了,為什麼這次的規定中還會對區塊鏈運算放一馬呢?在一位顯卡行業專業人士最終告訴了雷鋒網其中的奧秘果—— 不是 NVIDIA 支持區塊鏈,而是 GeForce 驅動實際上「間接」也用在挖礦專用顯卡上。

至於為什麼不專門弄一個系列的驅動嘛, NVIDIA 沒那個功夫,也不想花那個功夫。

關鍵問題 3: NVIDIA 為什麼要如此「突出」這項規定?

雖然說驅動的用戶協議通常大家都會點同意,但 NVIDIA 將其與眾多的產品最基礎規定放在一起,可見這項規定的重要性。為什麼 NVIDIA 要如此「突出」這項規定?直接原因除了 NVIDIA 官方在聲明中提到的產品適用性擔憂之外,更重要的是 NVIDIA 對於明晰消費市場、企業市場區分的渴望。

必須提前著重說明的是,這跟錢有關,但並不是簡單的錢的問題。

因為在整個半導體產品市場,這種情況也是普遍存在的,從 NVIDIA 的競爭對手 AMD,到 CPU 老大英特爾,實際上都有著自己的市場區隔。當然根源還是消費級市場和企業級市場的差異。

消費級市場用戶的用途往往比較簡單,同時對於產品的需求也比較集中。例如 GPU,你只要圖形性能好和運行穩定就可以了。但 對於企業來說,只提供硬體是遠遠不夠的,你還需要給他們開發各種軟硬體接口,你需要對各種應用場景進行適配,你需要提供各種企業級服務,甚至是工程師到現場進行技術協助。這些羊毛自然應該出在羊身上,也就造成了價格差距。

 NVIDIA 針對不同 GPU 加速應用推出的解決方案。
NVIDIA 針對不同 GPU 加速應用推出的解決方案。

如何分別對消費級市場、企業級市場這「兩群羊」分別進行合理的收費,最終成為了半導體行業企業都必須面對的一個問題。而對能夠產生商業收益、同時又需要更多產品服務的雲服務商收更多錢,這本身就是「合乎常理」的。

從另外一個角度來說,「消費級產品比企業級更便宜」甚至可以理解為「NVIDIA 合理地收取企業級市場費用,進而降低消費級市場的成本」。這不僅是公司整體策略的取捨,更是市場競爭法則最終選擇出來的結果。

附加說明:消費級產品真的不適用於企業級市場麼?

正如上面所說,消費級市場和企業級市場「天差地別」,其中一個最好的說明就是兩者的使用環境差距:消費級市場 GPU 通常安裝在機箱內,需要自己完成整個散熱過程,同時使用時長較短、使用頻次較低。企業級市場,GPU 通常都被「塞」進伺服器機架中,通常只裝備散熱器而依靠外部力量(風、液體)來完成散熱過程,使用時長非常長、使用頻次非常高、穩定性要求永遠優先。

這也讓兩個市場的產品在各方面差異性巨大,例如外形。以同樣使用 GP102 核心(具體型號不同)及關鍵處理器參數十分接近的的 GeForce GTX1080Ti 和 Tesla P40 為例。前者和後者的外形是完全不一樣的:

GTX 1080Ti,圖片來自:太平洋網絡。
GTX 1080Ti,圖片來自:太平洋網絡。

GTX1080Ti 自帶渦輪風扇,同時顯卡散熱器尾部並不可以流通空氣,這種散熱方式在消費級 PC 市場的使用環境中非常高效。而 Tesla P40 則採用了無風扇、頭尾貫通的設計。可以數張緊密地排在服務器中,同時不影響散熱效果。

除了外觀上的不同外, NVIDIA 實際還會花一些潛在的功夫。雖然 GPU 生產過程中用著相同的材料和工藝,但最終的成品往往還有一些細微差距。例如有些 GPU 能夠在較低的電壓下工作、有的 GPU 擁有更高的超頻性能等等,這些細微的差距再加上 NVIDIA 在產品參數上的區別調校,最終形成了服務器產品的冗餘性。

主流雲端服務商用的就是企業級產品

在結合眾多因素考慮之後,相信你或許已經有了自己的判斷,至少在雷鋒網看來:這次新規只是 NVIDIA 對於自身產品業務的一次明晰,而「不幸」中招的企業,都是之前「不按雲端服務行業規矩」的公司。

 NVIDIA ,這回真的被「冤枉」了

雷鋒網就此還專門採訪了國內的雲服務巨頭阿里雲和騰訊雲,其中阿里雲表示不予置評。但根據雷鋒網查詢,阿里雲實際上一直與 NVIDIA 保持著密切的合作, NVIDIA 最新的 Tesla V100 系列 GPU 也已經到了阿里雲手中,正在部署之中。

騰訊雲給出的回應則更加直接:「用 GeForce GPU 打造企業級 IaaS(基礎設施即服務)服務,然後來售賣這種做法,我們並不推薦。從企業級用戶的需求來看,他們更看重穩定性。Telsa 系列穩定性,能效比的確有優勢。

在詢問道 NVIDIA 與其合作的價值時,騰訊雲工程師表示:「 NVIDIA 對我們硬體上的支援是非常迅速的。騰訊雲在此基礎上,通過深度開發,推出了多款產品滿足用戶的需求。

有趣的是,亞馬遜 AWS 今年 10 月就已經引入了 NVIDIA 的 8 路 Tesla V100 GPU 加速器,並且作為全新的雲端服務提供給終端用戶。

這樣看來,雖然用 GeForce 在帳面上更划算,但這樣去打造企業級服務的雲服務商,其實只是行業「異類」。

寫在最後:吃水也要餵一口打井人

作為並行計算、乃至人工智慧時代的主要「動力源」, NVIDIA 的數款 GPU 利用自身不斷提升的性能在帶動著整個行業前進。而且 NVIDIA 做的並不僅僅是打造產品這一項,開發軟硬體接口、提供應用解決方案、孵化創業公司、舉辦技術峰會等等。

與其黑 NVIDIA「壟斷」,倒不如說 NVIDIA 自身技術不斷的「躍進」,造就了其產品和服務中的巨大優勢。但 因為一個企業在技術和市場方面發展快而去限制它,防止它「壟斷」,是否又違背了技術發展和市場發展的本意,或者說那才是真正的「濫用」權利呢?

吃水,除了自己喝,還請餵一口打井人。

─ ─

(本文經合作夥伴 雷鋒網 授權轉載,並同意 TechOrange 編寫導讀與修訂標題,原文標題為 〈 NVIDIA ,這回真的被「冤枉」了 〉。)

更多與 NVIDIA 相關的消息

為何 Tesla 自己開發 AI 晶片,難道合作夥伴 NVIDIA 真的不給力嗎?
2 年不到股價翻 6 倍!NVIDIA 的「崛起奇蹟」帶動台灣供應鏈起飛
死對頭 Intel 與 AMD 再度攜手合作,不知道 NVIDIA 怎麼想?


傳統機房的計算能力和儲存空間
跟不上數位業務即戰力與創新能力

新時代的 IT 機房如何無痛升級?
才能提升運算效率、降低維護成本支出?

點關鍵字看更多相關文章: