美國科學家在玻璃置入「神經網路」,只要照光就可以執行圖像辨識運算!

【為什麼我們要挑選這篇文章】隨著人工智慧技術的進步,對電腦的運算能力要求也愈來愈高;然而你有想過,玻璃居然可以執行神經網路的運算?(責任編輯:郭家宏)

「《科技報橘》徵才中!跟我們一起定位台灣產業創新力 >> 詳細職缺訊息
快將你的履歷自傳寄至 [email protected]

你有沒有想過,把神經網路從電腦「搬」進一片玻璃中?

透過神經網路進行圖像辨識、智慧推薦已經非常普遍。最近幾年,計算能力和並行處理的提升,使其成為一種非常實用的技術。然而,在核心層面,它仍然是一台電腦,和其他的電腦程式並無差別。並且,其對電力的要求也越來越高。

以識別手寫數字為例,這是一個非常經典的深度學習入門課題:你需要經過層層神經網路的前向傳播以及以梯度下降,為原理支撐的 BP 演算法調整每層神經元的權重、偏差,來完成最終的識別效果,中間的計算量和參數交換複雜程度可想而知。

美國科學家研發特殊玻璃面板,可以進行神經網路的運算

長久以來,研究者們一直在探索一種更快、更節能的方法來實現神經網路的複雜計算。

近日,來自威斯康辛大學、麻省理工學院和哥倫比亞大學的研究人員發佈了一種最新的神經網路,採用一種特殊的玻璃面板,用線性材料和非線性材料模擬網路裡的單元,經過訓練,也可以完成普通神經網路的工作。

最有趣的是,這種特殊玻璃面板幾乎不需要電力,只需要有光照即可工作。目前,研究團隊已經用它完成了識別灰度手寫數字的任務,準確率達到了 79%。

這種特殊的玻璃含有精確控制的夾雜物,例如氣孔或諸如石墨烯或其他材料的雜質。當光線照射到玻璃上時,會發生複雜的波紋圖案,並且在玻璃上的十個區域之一,光線會變得更強烈。每個區域對應一個數字。

例如,以下是兩個在玻璃上識別手寫數字「2」的例子:

研究團隊稱他們設計了非常嚴格的規則來製作相關實驗設備,並且將在儘可能「可大規模生產」的前提下,進一步改進材料提升識別比重。該團隊還計劃以 3D 形式建立網路。

論文 傳送門

跟文摘菌(本文作者)一起詳細看看,這一神奇的玻璃神經網路是如何運作的。

透過 ANN 與光學神經計算,玻璃學會辨識數字

Artificial neural networks(ANN)人工神經網路已經廣泛應用在深度學習領域,但同時需要電腦不斷增強的計算能力,這促使人們努力尋找更快,更節能的替代計算方法,一個典型的方法是 optical neural computing 光學神經計算。這種模擬計算方法,具有最小的能量消耗,更重要的是,其內在的並行性可以大大加快計算速度。

大多數光學神經計算遵循神經網路的架構,使用分層前饋網絡,如圖下圖(a)所示,自由空間繞射或整合波導被用來分層、激發神經元之間的連接,與 ANN 中的數位信號類似,光信號在前向方向上通過光網路一次。

AI 的關鍵技術「神經網路」,科學家成功把它塞到玻璃中了!

8/10(六)【TechOrange 科技報橘 2019 年度論壇】CONNECT to the Future,帶你看見 2030 年的科技趨勢
雙人早鳥 6 折優惠票全面開賣!

那麼什麼充當 BP 演算法的反饋呢?

正是光的反射提供了反饋機制,從而產生了豐富的波動物理學。在這裡,透過光學反射表明,有可能超越分層前饋網路的範例,以連續和無層的方式實現人工神經計算。

下圖(b)顯示了提出的奈米光子神經介質 nanophotonic neural medium(NNM)。光信號從左側進入,輸出是介質右側的能量分佈。計算由例如二氧化矽的主體材料執行,有許多內含物,夾雜物可以是氣孔,或具有與主介質的折射率不同的任何其他材料,這些夾雜物在向前和向後方向上都強烈地散射光。

為什麼要有夾雜物呢?在光學神經運算中充當什麼角色?

夾雜物的位置和形狀相當於神經網路中的權重參數,它們的大小通常是亞波長。非線性操作可以透過由染料半導體,或石墨烯可飽和吸收體製成的夾雜物來實現,其中它們執行分佈式非線性激發。這些非線性設計考慮了整流線性單元(ReLU),它們允許強度高於閾值的信號通過並阻止強度低於該閾值的信號。

為了更好地說明這種行為,圖(d)顯示了這種非線性材料的實現, 波長為 λ 的光的輸出強度,厚度為 λ/ 2,透過設計這種非線性材料, 實現入射波強度的非線性函數, 將該材料用作非線性激發,如淺藍色所示。

下圖是運行中的 NNM,其中訓練二維(2D)介質以識別灰度手寫數字。該數據集包含 5000 個不同的圖像,其中代表性的圖像如圖(a)所示,每次,由 20 × 20 像素表示的一個圖像被轉換為向量,然後被編碼為入射在左側的輸入光的空間強度。

在 NNM 內部,奈米結構產生強干擾,並且根據圖像所代表的數字,將光引導至 10 個輸出位置中的一個,其中具有最高能量光強的位置對應的類別被判定為最終結果。圖(b)所示由兩個不同的手寫數字「2」建立的過程,由於手寫數字的形狀不同,由這兩個圖象產生的 field patterns 是完全不同的,可以看到圖(b)中的黃色的光的形狀略有不同,但兩者在輸出處的相同區域顯示很高的光強度,正確地完成手寫數字的識別。

同樣,圖(c)顯示的是識別兩個不同形狀手寫數字「8」的情況,在十個區域的另外一個位置產生很強的光強,這裡,透過使用有限差分頻域(FDFD)方法求解非線性波動方程來模擬場。NNM 的大小是 80λ 到 20λ,其中 λ 是用來攜帶和處理資訊的光的波長。

對於由 1000 個圖像組成的測試集,平均識別準確度達到 79% 以上,報告的準確性有限是因為研究者在製造問題的優化過程中,設置了嚴格限制。這些約束使得介質保持密集,否則它將由稀疏的空氣和二氧化矽部分組成。通過放寬這些要求或使用更大的介質尺寸,可以進一步提高最終的測試精度。

從實驗室到業界還有多遠?

聽起來這個玻璃中的神經網路似乎還是個實驗室的雛形,但是,在查閲相關資料的過程中,文摘菌驚喜地發現,早在 2015 年,就有一家法國的新創公司,在用這種光學的方式實現神經網路。

這家叫做 LightOn 的公司有一個有趣的 slogan:用光改變計算的未來,希望透過光學儀器模擬計算設備,進而提升計算速度、尺寸和功率效率收集自然物理過程。並且推出了一款光學處理單元(OPU)的硬體協處理器。它旨在提升機器學習中一些計算密集度最高的任務。OPU 可以插入標準服務器或工作站,並透過一個簡單的工具箱訪問,該工具箱可以在熟悉的程式環境中無縫整合,已通過 LightOn Cloud 向選定用戶提供全面的 OPU 原型。

在使用案例部分,文摘菌還發現了這家公司的一些實際應用已經超過了識別手寫數字,包括圖片和影像識別、推薦系統、NLP 等相關係統都有涉及。

LightOn 官網

雖然相關數據距離目前的業內使用還有一定距離,但是,對於追求運算能力和能效的運算領域來說,也許真的能為這個領域帶來一些不一樣的東西。

原文報導 傳送門

(本文經合作夥伴 大數據文摘 授權轉載,並同意 TechOrange 編寫導讀與修訂標題,原文標題為 〈神经网络也有玻璃心?玻璃中掺入杂质模仿神经元,完成数字识别,几乎不用电力!〉。首圖來源:Max Pixel CC Licensed)

更多關於神經網路的消息

【工程師精選乾貨】100 行 Python,神經網路輕鬆搞定
擁有 17,000 顆星的 GitHub 大神開課!90 分鐘傳授,如何只用 JavaScript 建構神經網路
殺死深度學習的真正兇手!「組合爆炸」為什麼會讓神經網絡寸步難行?


我們正在找夥伴!

2019 年我們的團隊正在大舉擴張,需要你的加入跟我們一起找出台灣創新原動力! 我們正在徵 《採訪社群編輯》、《助理編輯》,詳細職缺與應徵辦法 請點我

點關鍵字看更多相關文章: