Minecraft,AI,演算法

AI 也會玩麥塊(Minecraft)了!微軟 OpenAI team 近期發表了一個成果,他們讓 AI 觀看 7 萬小時 youtube 影片後,學會如何玩麥塊。過去, AI 可以造出精緻複雜的文句,可以產製不存在的人臉,或者一張看似合理卻不太合理的照片,如一個騎著馬的太空人但這些都還是比較簡單的輸入輸出演算,只要透過事先餵養大量資料,就可以學習而成。而開放世界的遊戲,包含複雜的操作指令,因此一直都是 AI 學習沒辦法突破的地方。

過去的 AI 只能透過簡單的指示學習新事物

之前 AI 的機器語言演算法,只能學習簡單指示且每個步驟都可以估算衡量的遊戲,像西洋棋這種益智遊戲。但現在 AI 可以像人類一樣使用鍵盤和滑鼠,學習玩遊戲。而且是透過觀看教學影片,學習非線性而且任意開故事線的遊戲,像這次的Minecraft。

TO 推薦閱讀:【內有影片】神人玩家在 Minecraft 打造出一台完整電腦!俄羅斯方塊、貪食蛇真的都能玩

機器語言演算法新進展,學習並執行多重的指令

微軟開發團隊 OpenAI team 說明,這次成功讓 AI 學習 Minecraft 基本技巧,例如砍樹、手作桌子,也可以操作遊戲角色游泳、打獵、煮飯等。

他們不僅可以完成基本的任務,還可以完成進階的任務,如製作木製工具、蓋基本的居住地,探索村莊等,甚至還可以合成一項人類需要花 20分鐘才合成製作的工具:鑽石鎬

AI 可以看影片學習玩遊戲,跟人一樣

影片對人類來說,可能是不錯的學習工具,但是對於 AI 來說不一定實用。因為影片只有示範人是怎麼做的,但是沒有解釋。影片的結構複雜,中間的機器語言演算法學習過程會非常耗費時間,因此餵大量的影片讓 AI 學習,在過去是很不實際的作法。

AI 並不能直接學習動作,而必須透過標註過的片段,才能進一步連結動作,因此開發團隊在長達 7 萬小時的影片上製作標註。這是超級浩大的工程,他們最後決定另外找團隊來執行紀錄和標註基本的 Minecraft 操作指令,而外包團隊使用標註好的 2000 小時影片來教第二組機器語言演算法 IDM 去標註上一部 7 萬小時的影片(團隊對外宣稱 IDM 的準確率高達 9成)。

一個小孩學習麥塊基礎,可能只需要一兩部影片就學會了,而今日的 AI 需要更多的東西來學習非常「簡單」的技巧。

TO 推薦閱讀:OpenAI 釋出免費 AI 你問我答 Playground!AI 會怎麼解電車難題?

本文開放合作夥伴轉載,參考資料:Singularityhub,首圖來源:Unsplash