一次看懂 AI 晶片發展史:從 Intel CPU 的興衰,到微軟 FPGA、Google TPU 的崛起

 

【我們為什麼挑選這篇文章】大多數人談到 GPU 就會聯想到 NVIDIA,但是微軟的 FPGA、Google 的 TPU 又是什麼?Intel 又有何佈局?

這篇文章是編譯紐約時報的 AI 晶片發展歷程 完整報導 ,讓我們迅速了解這些年 Intel、NVIDIA、微軟、Google 為了 AI 晶片發展「做」了哪些事? (責任編輯:劉庭瑋)

最近人們希望電腦能做的事情越來越多。電腦要跟人對話,要能認出人臉,也要能認出路邊的小花,再過不久還要給人類開車。所有這些人工智能都需要極高的計算能力,即便當下最先進的電腦也沒法隨隨便便完成。

為了能夠滿足高速增長的計算需求,一些科技巨頭們現在正從生物學中尋找靈感。他們正在重新思考電腦的本質,然後 建造更像人類大腦的機器:神經系統裡要有一個中央腦幹,然後把聽、說這樣的具體任務交給周圍的大腦皮層去做 。他們希望電腦也能這樣。

在連續幾年的緩步發展以後,計算機終於又開始進化了,換上了新樣子的計算機會產生廣泛而持久的影響。它們能夠大大提高人工智慧系統的運行速度,也許未來某一天「機器人可以統治世界」的夢想也可以成真。這種轉換也會削弱晶片巨頭 Intel 的地位。從提供網路服務的數據中心、手裡的 iPhone 到 VR 頭盔和無人機,所有科技產品的核心都是半導體晶片。隨著新型晶片的時代來臨,目前年產值三千億美元的半導體工業很可能會完全變了個樣子。

CPU 的時代完結

現任 Google 母公司 Alphabet 董事的 John Hennessy 曾任史丹佛大學校長,1990 年代他出版寫過一本計算機設計的權威著作。「這是一場巨大的變革,」他說,「現在的這一套做法馬上就要過時了,大家都想重新開發一套系統架構。」

現有的計算機架構也有過自己的好日子。在過去的接近五十年裡,計算機的設計者們都圍繞著一塊單獨的、全能的晶片設計整個系統。這個全能的晶片就是 CPU,台式電腦、筆記本電腦裡都有,往往來自 Intel ;手機裡有時候也有 Intel 的 CPU。Intel 也是全球最大的半導體生廠商之一。

更複雜的系統在計算機工程師中間變得流行起來。以前可能所有的任務都要傳到 Intel CPU 中完成,現在的計算機則會把任務分成許多的小塊,然後把它們交給外圍的專用晶片完成,這些晶片結構比 CPU 簡單、耗電也要更少。

從 Google 數據中心變化看 AI 晶片發展

Google 的大型數據中心裡的變化是對全行業未來走向的一個預兆。Google 大多數的服務器裡都還有一個 CPU,但是現在有數不清的定制化晶片和它們共同工作,為語音識別等人工智慧應用提供運算支持。

實實在在的需求推動了 Google 的這一變化。多年以來,Google 都有著全世界最大的計算機網絡,簡直像是一個數據中心和線纜組成的帝國,從加州一直擴張到芬蘭和新加坡。然而,對這位 Google 的研究員來說,這樣的網絡還是太小了。

Jeff Dean 和 Google 為人工智能應用開發的 TPU

Jeff Dean 是 Google 最出名、最受人尊敬的工程師之一。2011 年他開始帶領團隊探索「神經網絡」的想法。 這種想法的核心是讓計算機算法自己學習任務,然後可以用在很多的場合中,比如識別手機用戶的語音輸入,又或者是照片中的人臉。只花了幾個月的時間,Jeff Dean 和他的團隊就開發出了一個基於神經網絡語音識別系統 ,它識別對話的準確率要比 Google 那時已有的系統高得多。但接下來也有一個麻煩,全世界運行 Google 的安卓系統的智能手機已經超過了 10 億部,假設這些手機用戶們每天只用 3 分鐘語音識別,根據 Jeff Dean 的計算, Google 也需要把現有的數據中心容量翻一倍才能支持得了。

監控著 Google「數據中心帝國」運行的是計算機科學家 Urs Hölzle,在一次開會的時候 Jeff Dean 就對他說:「我們需要再建立一個 Google」,後來有參會者回憶道。但這個想法實現不了,Jeff Dean 就提出了一個替代方案:自己造一種專門運行這種人工智能的晶片。

AI 晶片應用趨勢

Google 數據中心裡的這個苗頭已經擴散到了其它科技巨頭的身上。在未來幾年裡,Google、蘋果、三星等公司都會製造帶有專用的 AI 晶片的手機。 微軟設計的這種晶片打算專門用在 AR 頭盔上,然後 Google、豐田等一大群造自動駕駛汽車的廠商也會需要類似的晶片。

這種研發專用晶片和新計算機架構的熱潮,在美國國防部研究機構 DARPA 的前項目管理人員 Gill Pratt 看來可謂是人工智慧界的「寒武紀生物大爆發」,他本人現在正在豐田從事無人車的研究。他已經感覺到 ,把不同的計算分散給數量眾多的小面積、低功耗晶片的運行方式,會讓機器更像人腦,這也讓能源的利用效率提高了不少。「 在生物的大腦中,能源效率至關重要」,在近期的一次採訪中,身處豐田在矽谷的新研究中心的 Gill 這樣說。

失效的摩爾定律?

矽基的計算機晶片有很多種。有的晶片可以存儲數據,有的晶片可以完成玩具和電視機中的基本任務;也有的晶片可以運行計算機上的各種運算,它們大到能構造全球變暖模型的超級計算機用的晶片,小到個人計算機、服務器和手機上用的。

多年以來,計算機和類似的設備都是以 CPU 為核心運行的,CPU 也是設備成本的大頭。這一切都似乎不需要做什麼改變。根據 Intel 聯合創始人戈登·摩爾提出的著名的摩爾定律,計算機晶片中晶體管數量每兩年左右就會翻一番,幾十年來計算機性能的提升就是按照摩爾定律一路穩定地發展了過來。而根據 IBM 研究員 Robert Dennard 提出的 Dennard 縮放定律,晶片性能提升的同時,它們消耗的能源卻幾乎維持不變。所以在以往的日子裡一切都還好。

然而到了 2010 年,讓晶體管數量再翻一倍花的時間比摩爾定律預測的更長了,Dennard 縮放定律也失效了,因為晶片設計人員們遇到了來自材質物理特性本身的限制。 結果就是,如果想要更高的計算能力,只靠升級 CPU 已經不能解決問題了,需要增加更多的計算機、消耗更多的空間和電力。

語音和語言團隊負責人黃學東(左)和計算架構組的 Doug Burger 都是微軟的專用芯片開發團隊成員

微軟的專用晶片探索之路:FPGA

業界和學術界的研究者們都在想辦法延長摩爾定律的生命力,探索全新的晶片材料和晶片設計方法。但是微軟研究員 Doug Burger 有了另一種想法:除了 整個業界從 1960 年代以來都倚仗的 CPU 的穩步進化之外,為什麼不試著探索專用晶片之路呢?

當時微軟才剛剛開始用機器學習改進必應搜尋,透過分析用戶的使用方式改善搜尋結果。雖然那時候的算法對硬體的要求比後來風靡的神經網絡低得多,但是晶片已經有點跟不上了。

Doug Burger 和他的團隊做了很多不同的嘗試,最終決定用了這種叫做「FPGA」(現場可編程矩陣門陣列)的晶片,它們可以在工作過程中重新編程,適應新的任務。微軟的 Windows 需要運行在 Intel 的 CPU 上,但是 CPU 是不能重新編程的,一旦造出來,能做什麼就固定了。有了 FPGA,微軟就可以改變晶片工作的方式。 他們可以先對晶片編程,讓它在特定的機器學習算法中表現非常好;然後可以重新編程,讓它適合做邏輯運算。 同一個晶片可以有截然不同的表現。

大概 2015 年前後,微軟開始應用這類晶片。到現在,幾乎每一台微軟的數據中心新增的服務器中都帶有一塊 FPGA 晶片,它們幫助呈現必應搜尋的結果,以及支持著微軟的雲計算服務 Azure。

神經網絡的發展,打造 NVIDIA GPU 霸主地位

2016 年秋天,另一組微軟的研究員們做了和 Jeff Dean 的團隊同樣的工作,構建了一個比人類的平均水平還要高一點點的語音識別系統,也是透過神經網絡。

這個項目的負責人就是黃學東,他是來自中國的語音識別專家。在介紹這項工作的論文發表之後沒多久,他就約了他的好朋友、NVIDIA CEO 黃仁勳在 Palo Alto 吃了個飯。他們開了一瓶香檳慶祝。

黃學東和他的微軟同事們就是靠著數量眾多的 NVIDIA GPU 訓練出他們的語音識別系統的。沒有繼續使用 Intel 的 CPU。如果沒有做這樣的轉換,他們很可能完成不了這項突破。「我們花了差不多一年的時間達到了人類的水平」,黃學東說。「如果沒有新計算架構的幫助,我們可能至少要花 5 年。」

基於神經網絡的系統可以很大程度上自己學習,所以它們進化得比傳統方法設計的系統快得多 。以往的系統需要工程師們寫下無數行代碼,仔仔細細描述系統應該如何如何做。基於神經網絡的系統就不需要這樣。

不過神經網絡的問題就是,它需要無數次的試錯。 要構建一個單詞識別達到人類水平的系統,研究者們需要花費很多時間反複訓練它,對算法做精細的調節,以及不斷優化訓練數據。這個過程裡需要嘗試成百上千算個不同的算法,每個算法又需要運行上萬、上億次。這需要龐大的計算能力,如果微軟這樣的公司用一般的通用晶片來做這樣的計算,這個過程花的時間就太久了,晶片可能支持不了這樣高的負載,用掉的電也太多了。

所以,幾個網路巨頭都已經借助 NVIDIA 的 GPU 訓練自己的神經網絡。GPU 本來的設計只是為了用在遊戲圖形渲染中的,專用的設計讓它們保持了 CPU 近似水平的功耗,但是在神經網絡訓練中的計算速度要比 CPU 高很多。現在 GPU 就和 CPU 聯手負責計算機中的運算。

NVIDIA 藉著這個機會大舉擴張,向美國以及全世界的科技公司銷售了大量的 GPU,中國公司的購買數量尤為驚人。NVIDIA 季度營收中數據中心業務的部分,在過去的一年中翻了 3 倍,超過了 4 億美元。

「有點像是網路剛興起的那時候就走對了路」,黃仁勳在最近的一個採訪中說。換句話說,科技界的局勢正在快速改變,NVIDIA 正處在這場改變的中心。

科技巨頭紛紛創造專用晶片

GPU 是各個公司訓練神經網絡的重要基石,不過這也只是整個過程中的一部分。當神經網絡訓練完畢以後就可以開始執行任務,這時候需要的計算能力又有所不同。

比如,在訓練好一個語音識別算法以後,微軟會把它作為一個線上服務提供出來,然後它就可以開始識別人們講給自己手機的指令。GPU 在這種時候就沒有那麼高效了。所以很多公司現在都開始製造專門用於執行所學到的東西的晶片。

Google 造了自己的專用晶片:TPU。NVIDIA 也在製造類似的晶片。微軟在繼續對 FPGA  晶片重新編程來讓它們更適合運行神經網絡 ,這些晶片來自 Intel 收購的 Altera。

其它的公司也在後面追趕。專做智能手機用的 ARM 晶片的高通,以及數量客觀的初創公司都在研發 AI 晶片,希望能在這個快速成長的市場中分一杯羹。根據科技調研公司 IDC 預計,到 2021 年,帶有替代計算晶片的服務器將達到 68 億美元的銷售額,大致是整個服務器市場的十分之一。

Bart Sano 表示目前 TPU 也只是谷歌整個網絡運營裡的一小部分

Doug Burger 透露,在微軟全球的服務器網絡中,替代計算晶片只佔了所有運營中很小的一部分。Google 的網絡軟硬體研發工程副總裁 Bart Sano 表示 Google 的數據中心也是類似的狀況。

Intel 的掙扎:是跟進市場轉變,還是舊市場賺飽賺滿、日漸衰弱?

Intel 實驗室的主管 Mike Mayberry 已經向著替代計算晶片開始發起努力。可能是因為 Intel 佔據著數據中心市場 90% 的市場份額,從而也是傳統晶片的最大的銷售商。他說,如果對 CPU 做一些適當的修改,它們也可以應對新的任務而無需其它幫助。

不過 這個矽片的新浪潮擴散得很快,Intel 的市場地位也越來越糾結。它一方面否認市場正在發生變化,但是又或多或少地轉換著自己的業務避免掉隊。2 年前,英特爾花費了高達 167 億美元收購了 Altera,這家公司造的就是微軟使用的 FPGA。這是 Intel 歷史上最大的收購。去年,Intel 又收購了一家開發專門用於神經網絡的公司 Nervana,據說又花了超過 4 億美元。如今,在 Nervana 團隊的領導下,Intel 也在開發一款專門用於神經網絡訓練和執行的晶片。

矽谷風投公司紅杉資本的合夥人 Bill Coughran 在過去的接近 10 年中為 Google 的互聯網基礎設施出謀劃策,他的工作內容基本針對的就是 Intel。他表示,「他們都有大公司病,他們需要想清楚如何踏入這片新的、成長中的領域,而且還不損害他們的傳統業務。

當 Intel 內部高管們討論摩爾定律失效的狀況時,他們內部的混亂連公司外的人都看得到。在近期一次紐約時報的採訪中,Nervana 創始人、現在已是 Intel 高管的 Naveen Rao 表示,Intel 其實可以讓摩爾定律「再堅持幾年」。從官方口徑上講,Intel 的姿態是傳統晶片的改善在未來 10 年都還可以順利地進行下去。

Intel 實驗室的主管 Mike Mayberry 則表示加一兩塊晶片不是什麼新鮮事了,他說以前的電腦裡就有單獨的晶片來處理聲音之類的事情。

AI 晶片百家爭鳴

不過現在的趨勢要比以前大多了,而且從新的層面上改變著這個市場。Intel 面前的競爭對手不僅有 NVIDIA 和高通的這樣的晶片製造商,還有 Google 和微軟這樣一直以來都相當「軟」的公司。 Google 已經在設計第二代的 TPU 芯片了。根據 Google 的說法,今年晚些時候,任何 Google 雲計算服務的客戶或者開發者都可以在新的 TPU 晶片上面運行他們自己的軟體。

雖然目前這些事情都還只發生在消費者視野之外的大型數據中心裡,但是這對整個 IT 工業體系產生廣泛的影響恐怕只是時間問題。 人們最期待的是,隨著新型移動晶片的到來,手持設備也可以獨立完成更多、更複雜的任務,不再需要把任務交給幾百公里外的數據中心,無論是智慧型手機無需網路也能識別語音指令,還是無人駕駛汽車可以用現在無法企及的速度和精度識別周邊的世界。

換句話說,無人駕駛汽車少不了攝像頭和雷達,但是同樣少不了一顆好的大腦。

(本文經合作夥伴  雷鋒網    授權轉載,並同意 TechOrange 編寫導讀與修訂標題,原文標題為 〈 計算芯片革命來臨?英偉達谷歌入局緊逼英特爾 〉。)

延伸閱讀

【終結導航鳥事情】博通超強 GPS 晶片:誤差從 5 公尺降至 30 公分,開車不再錯過岔路口
iPhone X 真正亮點:由台積電獨家生產的晶片 A11 Bionic,跑分數據狂虐安卓手機
全球 AI 晶片爭霸戰來了!Nvidia、Intel、Google、IBM、微軟 AI 晶片特色一次報你知
AI 教父黃仁勳拋出價值 30 億美元的「怪獸級晶片」Tesla V100,NVIDIA 股價直接上漲 17%
快過 GPU 30 倍!Google 做了個 AI 專用的超狂晶片「TPU」
【一個張忠謀賺贏郭董+馬雲】台積電市值飆 5.9 兆新高峰!接美國防部 AI 晶片大單

點關鍵字看更多相關文章: