【號稱地表最強】華為新 AI 晶片「昇騰 910」,效能超越 NVIDIA 晶片 2 倍

華為

【為什麼我們要挑選這篇文章】在高度依賴網路的時代下,運算力就是競爭力。華為再次推出新款 AI 晶片,輪值董事長徐直軍更直言「昇騰 910 作為運算力最強的 AI 處理器當之無愧」。他的話真不真?華為還有推出哪些爆炸性產品?讀完本文一次了解。(責任編輯:陳伯安)

「《科技報橘》徵才中!跟我們一起定位台灣產業創新力 >> 詳細職缺訊息 
快將你的履歷自傳寄至 [email protected]

繼發佈鴻蒙系統之後,華為再一次展示了其前沿 AI 領域的技術能力。

8 月 23 日,採用華為自研達文西架構的 AI 處理器昇騰 910(Ascend 910)宣佈商用,與其一同面世的還有配套的全棧全場景 AI 運算框架 MindSpore。

實測結果顯示,昇騰 910 的半精度(FP16)運算力達到 256 Tera-FLOPS,整數精度(NT8)運算力達到 512 Tera-OPS,且晶片最大功耗僅為 310W,比此前設計規格的 350W 更低。

用華為輪值董事長徐直軍的話來說,昇騰 910 作為運算力最強的 AI 處理器當之無愧。

華為輪值董事長徐直軍

機器運算力每 3.5 個月翻一倍,比摩爾定律還快

昇騰 910 屬於 Ascend-max 系列,是華為首款採用達文西架構的 AI 晶片,基於 7nm 增強版 EUV 工藝,其 AI 核集成了 3D 立方體運算引擎,可以在短時間完成 4096 的乘加運算。

其實它的相關技術規格在去年 10 月的華為全聯接大會上就已公佈,當時的半精度(FP16)256 TFLOPS 運算力,相比輝達(NVIDIA)的 V100 GPU 的 125 Tera FLOPS 還要高一倍。因此格外受外界關注。

目前華為已將昇騰 910 應用於實際的 AI 訓練任務裡。其中,在典型的 ResNet-50 網路訓練中,昇騰 910 與 MindSpore 相配合,與現有主流訓練單卡配合 TensorFlow 相比,性能提升近 2 倍。且每秒訓練的圖片數量從 965 張提升至 1802 張。

可以看到的是,隨著數據和應用場景的不斷增多,人工智慧領域對於晶片的運算力要求隨之增加。來自第三方數據分析機構 OpenAI 近期數據表明,2012 年以來, 人們對運算力的需求增長六年超過 30 萬倍,平均每 3.5 個月翻一倍,已經遠超摩爾定律的發展速度 ——摩爾定律是每 18 個月翻一倍。

圖片來自  OpenAI

人工智慧領域有三要素:數據、演算法和運算力。數據為晶片處理的對象,演算法即運算的邊界,而運算力則直接決定了運算效率。對於華為來說,晶片是它們的硬實力,運算力即它在 AI 領域的競爭力。

除了超高的運算力之外,昇騰 910 還擁有高集成度和高速互連的特性。它集成了 CPU、DVPP 和任務管理器,因此它能獨立完成 AI 訓練流程。同時昇騰 910 集成了 HCCS、PCIe 和 RoCE 三種高速接口。其中最新的 PCle 吞吐量相比上一代翻了一倍。這些特性共同組成了運算力最強的昇騰 910 處理器。

至於昇騰 910 的價格問題,徐直軍並未直接透露,而是笑道:「具體定價還未定,但肯定比輝達和 Google 低。」

直擊 TensorFlow、PyTorch 達不到的「支援全棧全場景」

目前行業中已有 TensorFlow、Caffe 和 PyTorch 等主流 AI 框架,但它們都不支持全場景。這也是華為推出全棧全場景 AI 運算框架 MindSpore 的重要原因。

在去年華為全聯接大會上,華為提出:AI 框架不僅應該開發態友好、運行態高效,還要能適應每一個場景。

而此次徐直軍表示:能否大大降低 AI 應用開發的門檻,能否實現 AI 將無處不在,能否在任何場景下確保用戶隱私得到尊重和保護,這些都與 AI 運算框架息息相關。

因此 MindSpore 框架有著針對性的提升:

不同運行環境下,MindSpore 框架架構可大可小 ,適應全場景不同資源預算獨立部署;框架通過協同經過處理後的、不帶有隱私信息的梯度、模型信息,而非數據本身,在保證用戶隱私數據保護的前提下跨場景協同;將模型保護 Built-in 到 AI 框架中,模型安全可信。

光有全場景的框架還不夠,徐直軍宣佈要把 MindSpore 在 2020 年 Q1 開源,像英偉達一樣建立自己的生態。

核心程式碼數量降低 20%,效率提升 50%

「生態很重要,MindSpore 框架的重點就是要建造和其他框架一樣有生命力的生態。」徐直軍在發佈會現場表示。

AI 生態離不開開發者,為了讓吸引並幫助開發者一同促進 AI 產業生態的發展。MindSpore 還實現了一個創新:AI 演算法即程式碼,降低開發者的門檻,可以顯著減少模型開發時間。

以一個 NLP(自然語言處理)典型網絡為例,相比其他框架, 用 MindSpore 可降低核心程式碼整體量 20%,效率整體提升 50% 以上

此外,徐直軍表示華為擁有其它優勢,如華為在智慧行終端上的 HiAI 引擎,可幫助開發者來開發基於終端產品的 AI 應用和服務;並且華為所擁有的運算力優勢,與運算框架所實現的能力是其它框架無法比擬的。

接受採訪時,徐直軍還提到,MindSpore 不僅支持昇騰處理器,它也支持 GPU、CPU 等其它處理器。

在 MindSpore 的背後,是華為 AI 全棧戰略的野心。即從端到邊緣再到雲,先有了底層的硬體,再有一套深度學習的框架,最後到上層應用使能。

去年華為發佈了 AI 全棧戰略,而今天徐直軍宣佈全棧全場景 AI 解決方案已經完成了構建。這標誌著華為 AI 戰略進入了新階段。

「5G 只是小兒科,人工智慧才是大產業,才是華為發展的戰略要地」

儘管華為 AI 戰略剛發佈一年,但當時發佈的另一款高效運算低功耗 AI 處理器昇騰 310 早已商用,並在多場景下得到了廣泛的應用。

華為雲為昇騰 310 提供了圖像分析類服務、OCR 服務、影片智慧分析服務等雲端服務。對外提供 API 達 50 多個,日均調用量超一億次,預計年底日均調用量超 3 億次。超過 100 多個客戶使用昇騰 310 開發定制 AI 演算法。

此外,華為還陸續發佈了 Atlas 系列產品,被應用於安全防衛、金融、醫療、汽車等行業,有攝影機、無人機、機器人、MDC(Mobile Data Center)等產品形態。目前已在智慧交通、智慧電力等數十個行業裡有落地解決方案。

昇騰 310 產品的應用,對於接下來昇騰晶片家族產品有著重要參考意義,而昇騰 910 僅僅是一個開始。

徐直軍表示,面向未來,華為將持續投資,繼續推進全棧全場景的 AI 解決方案,針對不同的場景,如邊緣運算、自動駕駛車載運算、訓練等場景,推出更多 AI 晶片。包括昇騰 320、昇騰 920 等晶片。

值得一提的是,面向終端的昇騰 Tiny 系列會在即將發佈的麒麟 990 上應用。

眼下 5G 雖然廣受關注,但 AI 產業對於人類社會的發展意義更加重大。最近任正非簽發的一封 Email 裡,他表示 5G 只是小兒科,人工智慧才是大產業,才是華為發展的戰略要地。

(本文經合作夥伴 大數據文摘 授權轉載,並同意 TechOrange 編寫導讀與修訂標題,原文標題為 〈地表算力最强 AI 芯片,华为发布的昇腾 910 跟 Google 和英伟达有一拼 〉,首圖來源:Flickr, CC Licensed。)

你一定還想讀

性能完勝高通驍龍系列!華為 7 奈米晶片「麒麟 810」首次亮相

史上最大半導體晶片誕生!擁有 1.2 兆電晶體和 40 萬核心,比最大的 GPU 還大 56.7 倍

華為最新晶片麒麟 810 完勝高通驍龍,背後是台積電 7 奈米製程慘電三星


前瞻半導體未來十年趨勢

5G、AI 會是台灣半導體製程、材料創新的關鍵推手?

馬上報名 11/8《2019 未來科技展 》半導體製造場次

搶佔製造技術先機

點關鍵字看更多相關文章: