【我們為什麼挑選這篇文章】上星期 DeepMind 開發的 AlphaStar 在星海爭霸 II 比賽中血洗職業玩家,引起電競圈和科技圈一陣譁然,不過 AI 贏過人類好像也已經不是什麼稀奇的事,畢竟他們的學習能力實在是快的驚人,而且過去比的都是給人類玩的遊戲,在遊戲設計上還是有某種規則;因此,最近 Unity 和 Google Cloud 合作研發了一款「專屬 AI 的遊戲」,透過完全隨機的關卡訓練 AI 學習力,這個遊戲怎麼玩?本文帶你親身體驗!(責任編輯:鄭惟馨)
本文經 AI 新媒體量子位(公眾號 ID:QbitAI)授權轉載,轉載請聯繫出處
作者:操作栗
會打游戲,對 AI 來說已經不算稀奇的技能了。
上星期五,DeepMind 星際 AI 橫掃人類職業選手的戰績曝光,世人已開始顫抖。
也許過不了多久,人類的游戲就沒有辦法繼續滿足 AI 的野心。那麼,這些前途無限的 AI 選手,也該有屬於自己的游戲了,而且是人類玩家不得入內的那種。
AI 的專屬遊戲:每一關都隨機生成,死了重玩也不一樣
最近,Unity 和谷歌雲合作開發了一個新的游戲,叫障礙之塔 (Obstacle Tower) 。
這個游戲就是為 AI,特別是強化學習 AI,定製的。玩家要在一座古舊的高塔里,突破前仆後繼的封鎖,一層一層往上爬。
每一層都是隨機生成的,沒有人知道下一關會是什麼樣子。就算死了再重來,關卡也不會和上次一樣。
遊戲實測:目標要攻到塔頂,100 層樓關關難過
團隊說這個游戲考驗了 AI 的多重技能,比如視覺、運動、複雜的規劃等等。
雖然,在下(原文作者)並不十分聰明,但依然勇敢嘗試了游戲。
玩家的形象,是一個紫色頭髮的妹子。
似乎沒有什麼來到這座古塔之前的記憶了,到了這裡,她能做的只有從第 0 層出發,追尋不存在的塔頂。
每找到一個黃色的箭頭,都可以向上走一層。
最初,她的時間只有 30 秒,用完即 GG。
不過,吃了水晶球,就可以延長 5 秒壽命。
綠色的門最友善,是可以直接通行的。
橙色的門就要鑰匙才能打開。
如果鑰匙在天花板上鈎不到,就要坐升降梯上去拿。
當然,如果鑰匙在地下,就坐向下的升降機。
從第 10 層開始,紫色的門也會出現。
只要把紫色的箱子,移到地上畫的目標位置,紫色門就打開了。
一不小心把箱子推到牆角怎麼辦?踩一下地上的紅色按鈕,箱子就會復位了。
那麼問題來了,只要時間沒到就不會死嗎?
並不是,一不小心墮入深淵,GG。所以,不要因為時間緊,就不顧生死地往前跑。
畢竟,一旦游戲結束,就要從零開始,不可以從死掉的那一關重新來過。
再從第 0 層開始,眼前就是新的關卡了。所以,也不要以為上一次安全的地方,這一次就一定安全。
在下乃宇宙第一操作渣,只把妹子送到 16 層,她便毫無預兆地墜塔而亡,如上圖。
在探索未知和運用已知之間,做出理智的權衡,對強化學習 AI 來說是非常關鍵的生存技能。
以及,沒有哪一關是從前見過的;就像沒有哪一天是從前過過的。這樣的游戲設置可以鍛煉 AI 的泛化能力。
如果,強化學習演算法有機會在現實世界裡執行任務,在那之前它也要學會面對陌生、不可控的環境。
300 萬獎金挑戰賽:你家的 AI 能上 100 層樓嗎?
Unity 不止發布了這個游戲而已,還發起了障礙之塔挑戰賽,獎金有 10 萬美元(約台幣 300 萬元)。
比賽分成兩個回合,2 月 11 日就要開始了:
第一回合 (2/11-3/31) :爬上 25 層。
第二回合 (4/15-5/24) :爬上 100 層。
6 月 14 日宣佈優勝選手,第一名會獲得 10,000 美元(約台幣 300 萬元)現金獎勵,另外還會獲得積分,可以在谷歌雲平臺上兌換服務。
有興趣的同學,記得參加喲。
游戲試玩傳送門:
https://github.com/Unity-Technologies/obstacle-tower-env
論文傳送門:
https://storage.googleapis.com/obstacle-tower-build/Obstacle_Tower_Paper_Final.pdf
接收比賽通知傳送門:
https://create.unity3d.com/obstacletower
—
(本文經原作者 量子位 授權轉載,並同意 TechOrange 編寫導讀與修訂標題,原文標題為〈不是男人也要上100層:Unity專為AI開發了游戲,還啟動了10萬美元挑戰賽〉。首圖來源:YouTube 截圖。)
延伸閱讀
DeepMind 打贏人類靠作弊?星海爭霸勝利的真相:滑鼠按得比人類快兩倍
人類連「星海爭霸 II」都守不住了!DeepMind AI 新作 Alphastar 10:1 血洗職業玩家
【AI 版國定殺戮日】DeepMind 將直播 AI 血洗人類玩家、稱霸《星海爭霸 II》!