Google 研發晶片設計 AI,6 小時就能做出一款晶片!

chip

【為什麼我們要挑選這篇文章】在晶片產業鏈中,設計是附加價值最高的環節之一,然而專業的晶片設計師難以培養,人才大多集中在 AMD、NVIDIA 等大廠。近日 Google 研發一款 AI,只花 6 小時就能設計出晶片,而且在功耗、性能等方面都與人類設計的晶片相當,但人類設計師需要花數個月的時間才能設計出同等級的晶片。如果這款 AI 投入商用,人類晶片設計師會失業嗎?(責任編輯:郭家宏)

本文經 新智元(公眾號 ID:AI_era)授權轉載,轉載請連繫出處
作者:新智元

有了 AI 設計晶片,我再也不相信「摩爾定律」了!

近日,由 Jeff Dean 領銜的 Google 大腦團隊以及史丹佛大學的科學家們,在一項研究中證明:

「一種基於深度強化學習(DL)的晶片佈局規劃方法,能夠生成可行的晶片設計方案。」

AI 能設計晶片,這還不夠震撼。

只用不到 6 小時的時間設計出晶片才驚人!

Google 用 AI,6 小時就能設計一款晶片

為了訓練 AI 幹活兒,Google 研究員可真花了不少心思。

與棋盤遊戲,如象棋或圍棋的解決方案相比較,晶片佈局問題更為複雜。

在不到 6 小時的時間內,Google 研究人員利用「基於深度強化學習的晶片佈局規劃方法」生成晶片平面圖,且所有關鍵指標(包括功耗、性能和晶片面積等參數)都優於或與人類專家的設計圖效果相當。

要知道,我們人類工程師往往需要「數月的努力」才能達到如此效果。

人類設計的微晶片平面圖與機器學習系統設計

具體是什麼方法呢?

在 nature 的介紹中,Google 研究人員將晶片佈局規劃方法當做一個「學習問題」。

潛在問題設計高維 contextual bandits problem,結合 Google 此前的研究,研究人員選擇將其重新制定為一個順序馬可夫決策過程(MDP),這樣就能更容易包含以下幾個約束條件:

(1)狀態編碼關於部分放置的資訊,包括 netlist(鄰接矩陣)、節點特徵(寬度、高度、類型)、邊緣特徵(連接數)、當前節點(宏)以及 netlist 圖的元數據(路由分配、匯流排數、宏和標準單元簇)。

(2)動作是所有可能的位置(晶片畫布的網格單元),當前宏可以放置在不違反任何硬約束的密度或阻塞。

(3)給定一個狀態和一個動作,「狀態轉換」定義下一個狀態的概率分佈。

(4)獎勵:除最後一個動作外,所有動作的獎勵為 0,其中獎勵是代理線長、擁塞和密度的負加權,如下所述。

研究人員訓練一個由神經網絡建模的策略(一個 RL 代理),透過重複的事件(狀態、動作和獎勵的順序),學會採取將「累積獎勵最大化」的動作(見 Fig. 1)。該項目使用鄰近策略優化(PPO)來更新策略網絡的參數,給定每個放置的累積獎勵。

透過訓練一個智慧體,用累計獎勵最大化,讓 AI 優化晶片佈局的能力持續增強。

在每個訓練疊代中,RL 代理一次放置一個宏(動作、狀態和獎勵分別由 ai、 si 和 ri 表示)。一旦所有的宏被放置,標準單元格被放置使用一個力定向的方法。中間獎勵為零。每次疊代結束時的獎勵計算為近似線長、阻塞和密度的線性組合,並作為反饋給代理以優化下一次疊代的參數。

研究人員將目標函數定義如下:

如前所述,針對晶片佈局規劃問題開發領域自適應策略極具挑戰性,因為這個問題類似於一個具有不同棋子、棋盤和贏條件的博弈,並且具有巨大的狀態動作空間。

為了應對這個挑戰,研究人員首先集中學習狀態空間的豐富表示。

Google 研究人員表示,我們的直覺是,能夠處理晶片放置的一般任務的策略,也應該能夠在推理時將與新的未見晶片相關的狀態編碼為有意義的信號。

因此,研究人員訓練了一個「神經網絡架構」,能夠預測新的 netlist 位置的獎勵,最終目標是使用這個架構作為策略的編碼層。

為了訓練這個有監督的模型,就需要一個大型的晶片放置數據集以及相應的獎勵標籤。

因此,研究人員建立了一個包含 10,000 個晶片位置的數據集,其中輸入是與給定位置相關聯的狀態,標籤是該位置的獎勵。

為了準確地預測獎勵標籤並將其推廣到未知數據,研究人員提出了一種基於邊的圖形神經網絡結構,稱之為 Edge-GNN(Edge-Based Graph Neural Network)。

在 Edge-GNN 中,研究人員透過連接每個節點的特徵(包括節點類型、寬度、高度、 x 和 y 坐標以及它與其他節點的連通性)來建立每個節點的初始表示。

然後再疊代執行以下更新:(1)每個邊透過應用一個完全連通的網絡連接它連接的兩個節點更新其表示,(2)每個節點透過傳遞所有的平均進出邊到另一個完全連通的網絡更新其表示。節點和邊的更新如下面方程所示。

Edge-GNN 的作用是嵌入 netlist,提取有關節點類型和連通性的資訊到一個低維向量表示,可用於下游任務。基於邊緣的神經結構對泛化的影響如 Fig. 2 所示。

研究人員首先選擇了 5 個不同的晶片淨網表,並用 AI 演算法為每個網表建立 2,000 個不同的佈局位置。

該系統花了 48 個小時在「NVIDIA Volta 顯卡」和 10 個 CPU 上「預訓練」,每個 CPU 都有 2 GB 的 RAM。

左邊,策略正在從頭開始訓練,右邊,一個預訓練的策略正在為這個晶片進行微調。每個矩形代表一個單獨的宏放置。

在一項測試中,研究人員將他們的系統建議與手動基線——Google TPU 物理設計團隊建立的上一代 TPU 晶片設計——進行比較。

結果顯示,系統和人類專家均生成符合時間和阻塞要求的可行位置,而 AI 系統在面積、功率和電線長度方面優於或媲美手動佈局,同時滿足設計標準所需的時間要少得多。

AI 使用的秘密武器:TPU

最新的「微調技術」將用來設計即將推出的,以前未宣佈的 Google 張量處理單元(TPU)的生成。

也就是未來的第五代晶片 TPU v5。

不久前的 Google IO 大會上,Google 推出了最新的 AI 定製第四代晶片 TPU v4 ,速度是 v3 的兩倍。

v4 的性能相比前一代提升了 10 倍多,專門用於加速人工智慧。

一個 TPU pod 的運算能力達到了每秒百億億次浮點運算的級別,相當於一千萬台筆記本電腦之和。

以前要想獲得 1 個 exaflop(每秒 10 的 18 次方浮點運算)的算力,通常需要建立一個定製的超級電腦。

TPU 是 Google 的第一批定製晶片之一,當包括微軟在內的其他公司決定為其機器學習服務採用更靈活的 FPGA 時,Google 很早就在這些定製晶片上下了賭注。

雖然 Google 團隊的系統被用於設計下一代 Google TPU,但研究人員認為,它可以應用於晶片設計以外的有影響力的放置規劃問題,包括城市規劃、疫苗測試分發和大腦皮層映射等一系列應用。

晶片設計也能「遷移學習」?還可大幅縮短訓練時間。

如果能利用先前的設計經驗,實現遷移學習,將大大縮短訓練時間和成本。

如果在晶片設計中使用「預訓練」策略能否產生更好的結果?

後續實驗中,研究人員使用預訓練策略生成的放置位置品質,與從頭訓練策略網絡生成的放置位置品質進行比較。

從無到有的訓練與不同時間量的微調

訓練的數據集由 TPU Block 和開源 Ariane RISC-V CPU 組成。在每一個實驗中,都對除目標塊外的所有塊預先訓練策略。

研究人員使用 Zero-Shot 在不到 1 秒鐘的時間內就生成了放置位置。如果根據特定設計的細節,對預訓練的策略網絡進行 2 – 12 個小時的微調。

結果發現,從零開始訓練的策略需要更長的時間才能收斂,即使在 24 小時之後,結果(由獎勵函數評估)也比微調策略在 12 小時內達到的效果差。

這說明預訓練所學到的權重和專家的設計經驗起了很關鍵的作用——為新的看不見的塊生成更高品質的放置方案。

最終結果顯示,經過預訓練的策略網絡在微調過程開始時就獲得了較低的佈置成本,並且比從頭開始訓練的策略網絡要快 30 個小時以上。

Ariane RISC-V CPU30 從零開始訓練與從預先訓練的策略網絡開始訓練的收斂圖

接下來,研究人員在三個不同的訓練數據集上對策略網絡進行了預訓練(小數據集是中型數據集的一個子集,而中型數據集是大型數據集的一個子集)。

然後在相同的測試塊上微調預訓練的策略網絡,並對比不同訓練時間下的成本。隨著數據集的增大,生成的佈置品質和在測試塊上收斂的時間都會提高。

訓練前數據集大小的影響

「我們的方法和人類專家都能產生可行的佈局,而且符合晶片的時序和阻塞設計標準。我們在 WNS、面積,功率和線長方面也優於或相當於人類專家的設計。但是,我們端到端的學習方法耗時僅 6 個小時,而手動佈置需要一個緩慢的疊代優化過程,還需要專家干預,導致整個週期可能持續數週」。

訓練 AI 成本較低,晶片設計師會失業嗎?

21 世紀最貴的是什麼?人工。最便宜的是什麼?人工智慧。

晶片研發週期長、成本高,重度依賴設計。優秀的晶片設計師非常稀缺,基本都被幾家老牌晶片大廠壟斷,後起之秀很難在短期內挖到足夠的資深設計師。

從零培養一個人類設計師很難,利用已有的數據從零訓練一個 AI 設計師相比就簡單多了。況且,AI 不要工錢,不貪福利,不會罷工,永不疲憊。更重要的是,它隨叫隨到。

讀者朋友們,你看好 AI 設計晶片嗎?你認為如果 AI 連晶片都能設計,是否會威脅到晶片從業人員的工作崗位呢?是否意味著未來將可能出現 AI 製造 AI?歡迎討論。

參考資料

Nature》、《Venture Beat

(本文經 新智元 授權轉載,並同意 TechOrange 編寫導讀與修訂標題,原文標題為 〈TPU 新秘密武器!谷歌 Jeff Dean 团队推「AI 造芯」,自主设计芯片仅需 6 小时 〉;首圖來源:Pixabay CC Licensed。)

延伸閱讀

製造業在 AI 革命如何創新淘金?NVIDIA 解密導入 AI 3 大關鍵與 1 個重要挑戰
你給需求文件,AI 花數分鐘就可幫你開發一款安卓 App!Text2App 是什麼神猛黑科技?
【2021 Computex】美光重磅演講:AI 創新的核心,會在記憶體與運算架構!


點關鍵字看更多相關文章: