circuit board

隨著製程技術進步,晶片內的電晶體密度提升,設計複雜度也增加。雖然電子元件運算錯誤在所難免,但製程技術的進步卻也提升錯誤的不可預測性。AI 能提供預測準確度的解決方案。近日,科羅拉多大學波德分校的工程師推進 AI 的預測能力,並將研究發表在《npj Computational Materials》期刊上。

研究論文傳送門

先進製程將晶片逼近極限,導致失效難以預測

雖然晶片在絕大多數的情況下是可靠的,但晶片運算錯誤並不罕見,只不過產業界也開發工具來識別、處理這類錯誤。然而根據 Google 工程師 Peter Hochschild 近期發表的,名為《Cores that don’t count》的論文,隨著電晶體的縮小並逼近 CMOS 的極限,再加上晶片架構的複雜性不斷增加,導致現有的工具無法識別晶片的錯誤運算。

Facebook 也在今年 2 月發表一篇名為《Silent Data Corruption at Scale》的論文,指出晶片問題造成數據損壞,而且在數據中心觀察到的次數比以往更多。

為了處理晶片的錯誤問題,產業界正積極研究更先進的預測工具,例如嘗試導入 AI ,透過晶片結構來預測可能的錯誤。這是羅拉多大學波德分校的工程師進行的研究。

TO 相關文章
CPU 不可靠了?Google:晶片愈做愈小,反而讓 CPU 運算錯誤難以預測

AI 能夠從原子尺度組件,預測電子元件可能發生的錯誤

在研究中,研究團隊繪製由原子組成的小型組件的物理圖,然後使用機器學習,來預測由這些組件建構而成的更大結構的物理特性。這很像是從一塊樂高來預測拼湊出來的城堡的強度。透過該技術,能夠從原子尺度的組件,來預測電子元件可能出現的錯誤,協助人們打造更可靠的電子設備。

研究團隊領導人 Sanghamitra Neogi 表示,該研究可以協助產業界在打造設備之前,就預測它會如何工作,而不是要過上好幾年,才會知道設備失效的原因。

Neogi 舉例,現在的電子設備都有缺陷,導致熱量在某些地方聚集,造成效率降低。這很像是在崎嶇的道路上騎腳踏車,速度會被路上的坑洞拖慢。在過去,工程師會使用模型或電腦模擬,但很難預測缺陷可能會出現的地方,因為模型僅能處理約 100 個原子的系統,但實際設備卻有數十億以上的原子。Neogi 說道,AI 能協助工程師提前確認電子元件設計的薄弱環節,設計出更可靠的產品。

話雖如此,該 AI 仍有很長的一段路要發展,才能夠預測手機等設備的潛在缺陷。但目前 Neogi 團隊的工具已證明是有效的,若能成功應用於更大尺度的晶片,將有望解決晶片缺陷難以預測的問題。

參考資料

TechXplore》、《npj Computational Materials》、《Sigops》、《arXiv

(本文提供合作夥伴轉載。首圖來源:flickr CC Licensed

延伸閱讀

CPU 不可靠了?Google:晶片愈做愈小,反而讓 CPU 運算錯誤難以預測
史上最節能 AI 單晶片系統,用「太陽能電池」就可執行邊緣運算!
Google 研發晶片設計 AI,6 小時就能做出一款晶片!