MIT 用「群」訓練, AI 只練了 300 次就學會玩疊疊樂!

疊疊樂機器人。圖片來源:MIT 新聞稿

AI 已經能做很多事情,例如下圍棋、打牌、打新海爭霸,而且表現比人類好。現在, AI 又多了一項新技能:玩疊疊樂。

疊疊樂 AI 機器人,學會判斷「觸覺」

麻省理工學院(MIT)的科學家研發一款疊疊樂 AI 機器人。這款機器人有攝影機和力量感測器,可以感知疊疊樂的平衡狀態,並有兩根「手指」,用於推、抽、抓取,以及放置積木。

不同於圍棋和星海爭霸等純粹智慧的遊戲,疊疊樂還包含了「觸覺」的判斷,玩家需要感知抽積木時的疊疊樂平衡狀態,才能夠抽出正確的積木,放到正確的位置,避免疊疊樂倒塌。因此對 AI 來說,具備玩疊疊樂的能力,等於具備觸覺感知、物理模型建構,以及精細操作的能力,這些是 AlphaGo 等 AI 所沒有的技能。

用「群」的概念,提升 AI 學習效率

不同於傳統用大量數據訓練 AI 的方式,科學家用「群(cluster)」的方式,讓機器人大約玩了 300 次,就學會了疊疊樂。機器人將類似的感測結果和疊疊樂的平衡狀態分組,例如將不好移動的積木的感測數據分為一組,將容易移動的積木的感測數據分為一組,將疊疊樂倒塌前的行為數據分為一組,機器人就藉由這些分組數據開發模型,預測每個動作之下,疊疊樂會如何被影響。

該研究的主導者 Nima Fazeli 表示,這種訓練 AI 的方式是模仿人類的學習方式,它能提升 AI 的學習效率。人類學習玩疊疊樂時,會分辨好推和不好推的積木,而不是將所有的積木一視同仁,全部都「推推看」,這就是分群的概念,比試推全部的積木還要省時間。

雖然從影片上來看,機器人的表現和人類相當,但是機器人沒有情緒壓力,手不會抖,或許當疊疊樂疊到了「危險」的程度,機器人的表現就會超越人類玩家。

科學家表示,這款機器人的感測技術,可以應用在工業生產上,特別是那種需要精確感測的生產流程,例如手機組裝。或許幾年之後,這種 AI 不只是用來玩樂高,還可以用來蓋真的摩天大樓。

參考資料來源:
1.《Engadget》:〈Mastering Jenga taught this robot real-world physics
2.《MIT News》:〈MIT robot combines vision and touch to learn the game of Jenga
(本文提供合作夥伴轉載。首圖來源:MIT News

更多 AI 發展趨勢與應用

深度學習將要終結?美國教授從 1.6 萬篇論文中看到的 AI 趨勢
人類連「星海爭霸 II」都守不住了!DeepMind AI 新作 Alphastar 10:1 血洗職業玩家
用 AI 預防兩天後的魚塭災難,他的養殖技術強到 Discovery 來台特別專訪


別讓企業管理盲點,變成對手超車機會

你擔心競品抄襲公司專利機密嗎?

做檢測、找出公司的管理盲點,杜絕對手超車的可能性 >>> 進入檢測,再抽獎

點關鍵字看更多相關文章: