史上最大半導體晶片誕生!擁有 1.2 兆電晶體和 40 萬核心,比最大的 GPU 還大 56.7 倍

左圖為 Cerebras 晶片,右圖為目前最大的 GPU。圖片來源:Cerebras Systems twitter

【為什麼我們要挑選這篇文章】深度學習需要龐大的運算能力,但現有晶片的運算速度是 AI 的發展瓶頸。Cerebras 研發擁有 1.2 兆電晶體的晶片,堪稱是世界上的半導體晶片,比目前最大的 GPU 還大 56.7 倍。

Cerebras 開發該晶片的目的,就是要提升 AI 的運算效能;除了龐大的電晶體數之外,它的計算內核也經過優化,可自行過濾無意義的 0 計算,提升運算速度。這款專為 AI 設計的晶片,將在硬體的層面上,大力支持 AI 的發展。(責任編輯:郭家宏)

「《科技報橘》徵才中!跟我們一起定位台灣產業創新力 >> 詳細職缺訊息
快將你的履歷自傳寄至 [email protected]

之前文摘菌(本文作者)報導了一家印度新創公司打著 AI 的旗號,幹的卻是人工的活,還拿到了 2950 萬美元(約新台幣 9 億)的融資。

TO 相關文章連結:【大騙局】《華爾街日報》拆穿 Engineer.ai 假面具!AI 服務背後全是「印度工程師」

但是大部分 AI 公司拿到融資還是真正去做 AI 的,例如這家名叫 Cerebras 的公司,在 2016 年也獲得 2500 萬美元(約新台幣 7.8 億)的投資,用於開發深度學習硬體設備。

如今,研究終於出了成果。據 ventruebeat 報導,Cerebras 推出了擁有 1.2 兆電晶體的史上最大半導體晶片。

看來投資人可以鬆口氣了。

1.2 兆個電晶體,建構史上最大半導體晶片

1971 年,英特爾首款 4004 處理器擁有 2,300 個電晶體,最近的 Advanced Micro Devices 處理器擁有 320 億個電晶體。而這款史上最大的晶片 Cerebras Wafer Scale Engine 擁有 1.2 兆個電晶體。

大多數晶片是在 12 英吋矽晶片上建構晶片集合,並在晶片工廠中批量處理。但 Cerebras Systems 晶片是在單個晶圓上互連的單晶片,這些互連設計使其全部保持高速運行的狀態,因此 1.2 兆個電晶體全部一起工作。

透過這種方式,Cerebras Wafer Scale Engine 是有史以來最大的處理器,它專門設計用於處理人工智慧應用程式。該公司本週正在加州帕羅奧圖的史丹佛大學舉行的 Hot Chips 會議上討論這項設計。

此前三星已經製造了一個很大的快閃晶片,即 eUFS,擁有 2 兆個晶體管。但 Cerebras 晶片專為流程加工而設計,擁有 400,000 個內核,42,225 平方毫米。它比最大的 Nvidia GPU 大 56.7 倍。

WSE 還包含 3,000 倍的高速片上記憶體和 10,000 倍的記憶體頻寬。

40 萬個 AI 優化核心,可自行過濾無意義的 0 計算

WSE 包含 400,000 個 AI 優化的計算內核(compute cores)。被稱為 SLAC(Sparse Linear Algebra Cores),計算內核靈活,支持編程,並針對支持所有神經網路運算的稀疏線性代數進行了優化。SLAC 的可編程性,確保內核可以在日新月異的機器學習領域中運行所有神經網路演算法。

稀疏線性代數相關介紹: 面對即將失效的摩爾定律,科學家用「稀疏學習演算法」打破深度學習的算力極限!

由於稀疏線性代數內核針對神經網路運算進行了優化,因此它們可實現業界最佳資源利用率——通常是圖形處理單元的三倍或四倍。此外,WSE 內核包括 Cerebras 發明的稀疏性收集技術,以及加速稀疏工作負載(包括 0 的工作負載)的計算性能,如深度學習。

0 在深度學習計算中很普遍。通常,要相乘的向量和矩陣中的大多數元素都是 0。然而,乘以零是浪費資源,功率和時間的行為。

因為 GPU 和 CPU 是密集的執行引擎——引擎的設計是永不遇到 0——它們即使在遇到 0 時也會進行計算。當 50% 到 98% 的數據為零時,例如深度學習中的情況,大多數乘法都沒有意義。而 Cerebras 稀疏線性代數內核不會乘以零,所有零數據都會被過濾,直接在硬體中跳過,因此可以釋放資源完成其他有用的工作。

記憶體緊密相連,提升運算速度與降低延遲

記憶體是電腦體系結構的關鍵部分。更接近計算的記憶體意味著計算速度更快、更低的延遲和更好的數據移動效率。高性能深度學習需要大量計算,並且頻繁訪問數據。這需要運算記憶體和隨機存取記憶體(RAM)之間的緊密接近,這在 GPU 中並非如此。

Cerebras Wafer Scale Engine 則包含更多記憶體,具有比迄今為止任何晶片都有更多的 native memory,並且在一個週期內,可以透過其記憶體訪問 18 GB 的片上內存。WSE 上的記憶體,native memory 集合可提供每秒 9 PB 的記憶體頻寬——比領先的 GPU 多 3,000 倍的片上內存和 10,000 倍的記憶體頻寬。

低延遲,高頻寬的通訊結構

Swarm 通訊結構是 WSE 上使用的處理器間通訊結構,它以傳統通訊技術的功耗的一小部分,實現突破性頻寬和低延遲。Swarm 提供低延遲,高頻寬的 2D 網格,可連接 WSE 上的所有 400,000 個核,每秒頻寬為 100 petabits。Swarm 支持單字活動消息,可以直接透過接收記憶體來處理。

路由、可靠的通訊和同步在硬體中處理。消息會自動啟動每個到達消息的應用程式處理程式 Swarm,為每個神經網路提供獨特的優化通訊路徑。軟體根據正在運行的特定用戶定義的神經網路結構,配置透過 400,000 個記憶體的最佳通訊路徑以連接處理器。

一個 Cerebras WSE 的總頻寬為每秒 100 petabits,不需要例如 TCP/IP 和 MPI 之類的通訊協議。並且該架構中的通訊能量成本遠低於 1 焦耳每比特,這比 GPU 低近兩個數量級。通過結合大的頻寬和極低的延遲,Swarm 通訊結構使 Cerebras WSE 能夠比任何當前可用的解決方案進行更快地學習。

更大的晶片有望解決 AI 的發展瓶頸:訓練時間長

承擔計算任務的晶片尺寸在 AI 應用中非常重要,因為更大的晶片可以更快地處理資訊,在更短的時間內得出結果。訓練時間的減少,可以使研究人員能夠進行更多測試,使用更多數據並解決新的問題。Google、Facebook、OpenAI、騰訊、百度都認為,今天人工智慧的基本限制,是訓練模型需要很長時間。因此,訓練時間是整個 AI 行業進步的主要瓶頸。

當然,一般晶片製造商不會生產這麼大的晶片是有原因的。在單個晶圓片上,製造過程中通常會出現一些雜質。如果一個雜質可以導致晶片的故障,那麼晶圓片上的多個雜質就會擊穿幾片晶片。從而導致實際的效益只是實際工作的晶片的一部分。如果晶圓片上只有一個晶片,那麼它含有雜質的可能性是 100%,雜質會使晶片失效。但是 Cerebras 晶片是設計成冗餘的,所以一個雜質不會使整個晶片失效。

「而設計的人工智慧工作,Cerebras WSE 包含基本的創新,解決了幾十年以來限制晶片尺寸的技術挑戰,如 cross-reticle 的連接性、產量、功率輸出和包裝,」Cerebras 的創始人兼 CEO Feldman 在一份聲明中說,「每一個架構決策都是為了優化人工智慧工作的性能,其結果是,Cerebras WSE 在功耗和空間很小的情況下,根據工作負載提供了現有解決方案數百或數千倍的性能。」

Linley Group 首席分析師 Linley Gwennap 在一份聲明中表示:「Cerebras 在晶片規模的技術上取得了巨大進步,在一塊矽片上實現的處理性能超出想像。為了實現這一壯舉,該公司已經解決了困擾該行業數十年的一系列工程挑戰,包括實現高速模對模通訊、解決製造缺陷、封裝如此大的晶片、提供高密度電源和冷卻。透過將不同學科的頂尖工程師聚集在一起,Cerebras 創造了新技術,並在短短幾年內交付了一個產品,這是一個令人印象深刻的成就。」

Cerebras:推動深度學習的電腦系統公司

Cerebras 是一家致力於加速深度學習的電腦系統公司,其聯合創始人兼執行長 Andrew Feldman 是一位致力於推動電腦領域的企業家。

在加入 Cerebras 之前,他是 SeaMicro 的聯合創始人兼首席執行官,SeaMicro 是節能、高頻寬微服務器的先驅。SeaMicro 於 2012 年被 AMD 以 3.57 億美元(約新台幣 110 億)收購。在 SeaMicro 之前,Andrew 曾擔任 Force10 Networks 的產品管理、行銷和 BD 副總裁,後來以 8 億美元(約新台幣 248 億)的價格出售給戴爾電腦公司。在加入 Force10 Networks 之前,Andrew 在 RiverStone Networks 擔任行銷和企業發展副總裁,從公司成立到 2001 年首次公開上市,Andrew Feldman 擁有史丹佛大學的 MBA 學位。

網友在 twitter 上的評論也是眾說紛壇,有提問此晶片是否是加速器的獨立晶片,還有關於保持散熱、穩定方面的疑問。但多數網友持樂觀的態度,認為這是令人印象深刻的第一個晶片,在朝正確的方向邁進!

原文報導 傳送門

(本文經合作夥伴 大數據文摘 授權轉載,並同意 TechOrange 編寫導讀與修訂標題,原文標題為 〈1.2 万亿晶体管,史上最大半导体芯片诞生,比最大的 GPU 大 56.7 倍 〉。首圖來源:Cerebras Systems twitter

更多關於半導體晶片的消息

【深度分析】AMD 將靠新 CPU「逆襲」英特爾?7nm 晶片之戰山雨欲來
這台「自駕腳踏車」裝了全球首款異構類腦晶片,AI 跨出了超越人類智慧的第一步!
「滑」手機開始走入歷史?Google Pixel 4 能夠「隔空操作」,秘密全在這塊 Soli 晶片


我們正在找夥伴!

2019 年我們的團隊正在大舉擴張,需要你的加入跟我們一起找出台灣創新原動力! 我們正在徵 《採訪社群編輯》、《助理編輯》,詳細職缺與應徵辦法 請點我

點關鍵字看更多相關文章: