【我們為什麼挑選這篇文章】我不知道為什麼,但是看人工智慧跳牆真的好紓壓(?

總而言之打爆世界上所有棋士的 AlphaGo,加上現在這個學走路的AI,DeepMind 正在用 AI 改變這個世界,我認為學走路這件事很關鍵,他可能可以運用在未來的運動學、醫療、選手訓練上面都可以有關鍵運用,這也可能會取代人類本來的工作。(責任編輯:林子鈞)

Deepmind 在今年早些時候「一戰成名」,在中國烏鎮圍棋峰會上, AlphaGo 戰勝了世界冠軍柯潔九段。在這之後,我們知道了 Deepmind 將會把 AlphaGo 的技術運用在疾病診斷等造福人類的領域。

所以,Deepmind 最近在做什麽「高大上」的事情呢?

……他們在教AI「跑酷」(下圖為動圖)。

最近,Deepmind放出了一段「搞笑視頻」。其中的火柴小人看似將以酷炫的動作翻越路上的障礙物,但不幸演繹了各類「花式摔跤」。在視頻中,還有四條腿的「螞蟻」和只有身子和腿的「走路器」。

Deepmind 表示,這些小人的動作都是 AI 進行控制的。在 AI 的幫助下,小人們能做出走路、跳躍等一系列動作,甚至能模仿行動不便的老人走路時的樣子(下圖為動圖)。

為什麽 Deepmind 的 AI 不去下圍棋了,而是開發了「跑酷」的新愛好呢?

在 Deepmind 發布的文章中,研究人員稱「跑酷」和圍棋在目的上顯著不同,而這一點就是他們希望 AI 能夠學習的。研究人員在文章中這麽解釋:

「在一些 AI 的問題中,比如玩 Atari 電腦遊戲和下圍棋,它們的目標非常容易定義——就是贏。但是你如何解釋一個後空翻的目標呢?或者一個跳躍動作?
在訓練自動化系統進行運動的時候,如何清楚地對它們解釋複雜動作,是一個經常遇到的問題。」
在實踐中,研究人員在火柴小人的必經之路上放入了「矮牆」、松動的「地磚」等障礙物。 AI 控制下的小人在一次次翻越障礙不成功後,它們也學會了如何「安全」跑到終點。

Deepmind 將這項技能形容為:

「我們的實驗對象能夠在不接受指令的情況下演化出複雜技能。這是一個能被用於訓練系統中不同模擬人體運動的技術。」
Deepmind 解釋稱,它們採用的是一種「反饋學習算法」(reinforcement learning algorithm)。這種算法能夠幫助未來的 AI 在不同環境中靈活、自然地運動。

在研究者們的眼中,人工智能控制下的靈活行為是人工智能擁有「運動智慧」的標志。在這一技術的助力下,計算機們很快就能勝任更覆雜的任務,甚至能變得和人類越來越像。

你走路的時候是這個樣子嗎?

Deepmind 對這項技術有不少的展望。研究者們在文章的最後寫道:

「未來,我們可以將這些技術運用在覆雜環境中,對更多的(機器)行為進行調控。」
對一大堆能夠模仿人類行為的機器進行調控?聽起來它們能做很多事情,比如說……組成一個《西部世界》一般的遊樂園。所以, Deepmind 今天還在花式摔跤的火柴小人,能變成明日《西部世界》裏心思縝密、運動靈活的機器人嗎?


延伸閱讀

都給 AI 做就好了啊!Google 投資人工智慧新項目,記者飯碗真的不保?

「薪資低到世界有名!」杜奕瑾破解 AI 神級人才不回台灣理由
【輸了你,贏了世界又如何】柯潔哽咽著說:我會繼續改變自己,而 AlphaGo 將會改變世界

(本文經合作夥伴 36 氪授權轉載,並同意 TechOrange 編寫導讀與修訂標題,原文標題為 〈Deepmind在訓練AI“花式摔跤”, 於是我們離“西部世界”又近了一步|潮科技〉 。)