【我們為什麼挑選這篇文章】今年 AI 的發展是一個突飛猛進,我們看到了各方面的突破,無論是圖形辨識、邏輯思考,下棋作詩,AI 似乎已經超越人類了。
真的是這樣嗎?如果我們把 AI 裝到機器人身上,就會發現它目前距離人類還是有段差別,要如何讓 AI 在操作機器人時可以更加「人類」,進而超越也就成了一個議題。
如今,來自 MIT 的研究或許為這個議題找到新的出路:先讓 AI 學學物理吧。(責任編輯:林厚勳)
本文經 AI 新媒體量子位(公眾號 ID:QbitAI)授權轉載,轉載請聯繫出處
機器能自行理解我們這個物理世界的基本規則麼?答案是能。
多年以來,麻省理工學院(MIT)的研究人員一直在尋求解釋和複製人類智慧,而他們最近的研究成果,是如何讓 AI 智慧體擁有認知世界的基本能力。
即:學會分辨不同的對象,以及推斷它們如何受到物理作用力的影響。
這包括幾個方面。首先是看到圖片後,能腦補其中物體的三維形狀;其次是判斷物體的物理特性,例如質量和摩擦力等;然後是推斷隨著時間推移,這些它們會如何被物理作用力改變,比方會發生何種位移。
在這個方向上,MIT 博士生吳佳俊和團隊一起發表了四篇研究論文,這四篇論文入選了剛剛結束的 NIPS,而且有兩篇被選為 spotlight。
其中三篇論文談及如何從視覺和聽覺數據中,推斷出物體的物理結構。另外一篇,則是預測這些物體會會如何發生變化。
「總而言之,我們已經能夠讓機器像人類一樣,掌握越來越多對物理世界的基本理解」,吳佳俊的導師 Josh Tenenbaum 教授表示。
腦補
首先要解決的問題是,如何正確認知這個世界。
挑戰在於,如何構建一個神經網路模型,能夠基於給定的二維圖片,腦補出隱藏在視線之外的物體形狀,最終還原構建出一個三維圖像。
這需要模型能看透物體間的相互遮擋,濾除混雜期間的視覺紋理、反射和陰影,推斷看不見的地方究竟是什麼形狀等等。
顯然這是一個複雜的問題。參與這項研究的不止 MIT 學者,還有來自 DeepMind、上海科技大學、上海交通大學的各路高手。
這些研究基於MIT神經科學家大衛‧馬爾(David Marr)的理論。這位英年早逝的科學家認為,在解釋一個視覺場景時,大腦首先從觀察角度建立對象的2.5D草圖,然在在此基礎上,大腦繼續推斷出物體完整的三維形狀。
這不是一件易事。
吳佳俊和同事們為了訓練神經網絡,會首先建立一個三維場景模型,然後再生成一張二維圖片。整個過程就像拍攝動畫電影似的。一旦有了數據,就能讓AI開始自學如何基於二維圖片,腦補出三維場景。
還有更有意思的挑戰。
比方,聽聲腦補。在另一篇論文中,他們訓練了一個系統,通過物體被丟棄時發出的聲音,推斷物體的形狀、材質以及跌落的高度。
物理
神經網絡已經學會如何腦補一個三維世界,現在,是時候讓AI學習如何像人類一樣,掌握對真實世界物理作用力的直觀理解了。
研究人員一共交待了兩項任務。
其一,是估計撞球的運行速度,並據此預測檯球(們)發生撞擊後,後續的運動情況。其二,是分析堆疊的方塊靜態圖,並據此判斷這堆方塊是否會掉落,以及會落在何處?
吳佳俊為此開發了一種稱為場景 XML 的表示語言,可以定量描述視覺場景中物體的相對位置。神經網絡首先學習使用這個語言輸入數據,然後把這個描述提供給一個物理引擎,這個引擎負責基於物理作用力進行建模。
物理引擎最終完成檯球和方塊運動的預測之後,訊息被發送給圖形引擎,最終形成一張預測圖片。這張圖片會與真實場景的物理作用結果進行比較。
在測試中,MIT的研究超過了前人的成果。
「他們使用了物理工具來訓練生成模型」,南加州大學計算機科學助理教授Joseph Lim表示:「這個簡單而優雅的想法與最先進的深度學習技術結合,在與解釋物理世界相關的多項任務中展現了非常棒的結果」。
上述內容主要源自MIT News,原文地址:
http://news.mit.edu/2017/computer-systems-predict-objects-responses-physical-forces-1214
吳佳俊
上面提及的四篇論文中,吳佳俊都有參與,其中兩篇是作為第一作者。
前面已經提到,吳佳俊現在是 MIT 的博士生。他的導師是 Bill Freeman 教授 Josh Tenenbaum 教授。吳佳俊的研究方向主要為計算機視覺、機器學習和計算認知科學。
吳佳俊本科畢業於清華大學交叉信息研究院,導師為屠卓文教授。
2010 年 9 月,18 歲的吳佳俊通過全國訊息學奧林匹克競賽從上海華東師範大學第二附屬中學保送至清華大學。
就讀清華期間,吳佳俊一度成為話題人物。當時吳佳俊正參選2013年清華大學本科生特等獎學金,他的一份個人履歷引起了廣泛的關注。其中最受關注的一項成就是:頂級會議 CVPR 2014 審稿人。
此後,吳佳俊時常被被外界冠以超強履歷、新一代學神等形容詞。
相關論文
最後,如果你對上述提及的四篇論文感興趣,可以前方吳佳俊的個人主頁查看,地址:jiajunwu.com。
(本文經 量子位 授權轉載,並同意 TechOrange 編寫導讀與修訂標題,原文標題為 〈 AI學會理解物理力學,機器像人更進一步 | 清華學神在MIT新研究 〉。)
AI 最近都搞了些啥
YAMAHA 最新 AI 鋼琴家:與真人共同演奏,人類彈錯他還能迅速 cover
Google 研究室出品:運用 AI 圖像處理技術,把短片變成漫畫的神奇 App
史丹佛大學發表 AI Index 報告,一秒看懂 AI 與人類目前到底差多少!
不過半年 AlphaGo 已經像古董了:DeepMind 最新 AI,一天訓練就能稱霸東西方三種棋類!