電競下棋血洗國際玩家的 AI,怎麼反而不會「打牌」了?

【我們為什麼挑選這篇文章】電競成為 AI 發展的指標之一,從象棋、西洋棋到即時戰略遊戲,AI 機器人無往不利,卻因為缺乏人類的「認知能力」,反而不會打卡牌遊戲?未來如果修正了這個弱點,將有機會改善自動駕駛面對新狀況時的應變。(責任編輯:方禹涵)

「《科技報橘》徵才中!跟我們一起定位台灣產業創新力 >> 詳細職缺訊息
快將你的履歷自傳寄至 [email protected]

人工智慧(AI)已經稱霸了不少世界上最複雜的遊戲,擊敗了國際象棋、圍棋、甚至是《星際爭霸 II》等即時戰略電腦遊戲中的頂級玩家,但其弱點卻是一些看似簡單的遊戲:一些需要具備溝通和合作能力的遊戲。

這一情況可能即將發生改變。

人類的生活,溝通合作大於競爭

Google 母公司 Alphabet 的 Google 大腦項目和 DeepMind 的研究人員開發了曾在圍棋和《星際爭霸 II》中擊敗人類的 AI 程序,現在他們將目光投向了一款新遊戲:《Hanabi(花火)》,一種玩家互相合作的卡牌遊戲。這款遊戲根據玩家在比賽中的溝通情況來確定每個人是贏還是輸。

參與該項目的研究人員認為,弄清楚怎樣玩好《Hanabi》,這對於人工智慧來說可能是一個重大進步,並且有助於其在聊天和自動駕駛等應用場景中,與人類進行更加流暢的互動。

「在日常生活中,人們一般不會相互競爭,而更多的是進行溝通和合作,」牛津大學研究員 Jakob Foerster 說,他在 2 月份合作發表了一篇相關論文。他還說,「《Hanabi》是一個關於溝通和合作的遊戲,人工智慧目前還沒有深入這一遊戲領域」。

能看到大家的牌,除了自己的

《Hanabi》遊戲發明於 2010 年,由二到五個玩家參與,玩家需以正確的順序一起打出五種不同顏色的牌。遊戲特點為:所有玩家都可以看到對方的牌,但卻看不到自己的牌。

根據遊戲規則,玩家可以互相提示自己手裡的牌(但僅限於牌的顏色或數字),讓其他玩家可以推斷他們應該出什麼牌,但提示的次數是有限制的。

正是這種高效溝通的行為使《Hanabi》具備了一種科學魅力。例如,人類可以很自然地理解其他玩家的提示:哪張卡片是可出的?但是機器本質上無法理解這些提示。

Nolan Bard 是 DeepMind 項目的研究員,也是上述論文的合作作者。他認為「這些合作式的遊戲各不相同且難度很大,因為為了玩好遊戲,你需要與所有玩家進行協作,共同就某種遊戲方式達成一致。」

到目前為止 AI 程式已經可以在玩《Hanabi》花火遊戲時贏得很高分數,但只限於與其他類似的智能機器人一起玩。在不熟悉其他玩家的遊戲風格或者有「臨時」(從未一起玩過的)玩家的情況下,對 AI 程式的挑戰最大,也更接近真實情況。

AI 難以理解的人類「心理認知」:假設和推論

根據研究人員的說法,人類在不斷構建一種關於他人的「心理認知」,即假設其他人像我們一樣思考和行動,並以此為基礎預測其行為。例如,當有人站在街角時,路過的司機會認為她正在考慮過馬路。

研究人員認為,在人工智慧中植入這樣的認知能力,可以改善自動駕駛車輛在遇到新情況時的行為方式,使其能夠明白人們的行為背後意味著他們可能想做什麼。例如,AI 機器人可以學習並理解對話中的語境,以便推斷說話者的想法。

為了闡明人工智慧目前還缺乏這種能力,Bard 博士使用一台已經訓練好的計算機來玩石頭剪刀布遊戲。計算機出石頭、剪子和布的次數將相同,並預計有一半的機會會贏。

但是如果其人類對手每次都出同樣的手勢,那麼標準的算法就無法理解人類對手的想法,並據此轉變其策略。Bard 說,計算機要在玩了 10 回後才會意識到人類總是出石頭而它應該出布。

在其他遊戲方面,AI 程式在橋牌遊戲中已經取得了進展,但還不是玩得很好,部分原因在於人工智慧還需要溝通技能。許多卡牌類遊戲都存在類似的問題,機器很難分辨玩家行為背後所隱含的信息。

遊戲設計、AI 運用是人類智力的展現

位於舊金山的 OpenAI 是由諸多矽谷大亨聯合建立的 AI 非營利組織,其工程師 Jeff Wu 開發了一種 AI 機器人,用一種稱為「猜帽子」的策略來玩《Hanabi》。這種策略以複雜的方式向其他玩家給出提示,告訴這些玩家哪些牌可以打。

注:「猜帽子」這個名字取自一個流行的邏輯訓練,即一群人試圖猜測他們每個人頭頂帽子的顏色。

儘管 Wu 的機器人在玩《Hanabi》時分數很高,但他認為要使《Hanabi》機器人擁有可以和未知對手合作的認知能力仍然是一個巨大的挑戰。

「在玩猜帽子時,機器人沒有認知能力,它們心中只有自我以及其副本的概念,如果你只是自己跟自己玩,這是可以的,」Wu 說。「但如果你試圖開發一個真正具有心理認知能力的機器人,並且它可以明白其他人在思考和做什麼,那將是個大挑戰。」

DeepMind 的《Hanabi》研究小組創建了一個開源平台,人們可以在其上測試相關的 AI 程式和算法,但小組成員並不期待很快能找到解決方案。Foerster 博士說,如果只花了五年的時間就可以使 AI 具備能力和未知玩家進行遊戲,他覺得不靠譜。

儘管如此,紐約大學副教授 Julian Togelius 表示,像《Hanabi》這樣的遊戲是創新的沃土。「隨著其不斷發展,遊戲設計已經成為人類智力發展的持續反映,」他說。「如果存在某種形式的人工智慧場景,那麼就會有人適時地設計出一種能夠運用這種場景的遊戲。」

 

相關報導:
https://www.wsj.com/articles/why-the-card-game-hanabi-is-the-next-big-hurdle-for-artificial-intelligence-11553875351

(本文經合作夥伴 大數據文摘 授權轉載,並同意 TechOrange 編寫導讀與修訂標題,原文標題為 〈為什麼紙牌遊戲 Hanabi 是人工智能的下一個挑戰?〉)

延伸閱讀

DeepMind 打贏人類靠作弊?星海爭霸勝利的真相:滑鼠按得比人類快兩倍
【AI 版國定殺戮日】DeepMind 將直播 AI 血洗人類玩家、稱霸《星海爭霸 II》!
從圍棋、西洋棋、到 Dota2,人類喜歡跟 AI 單挑「遊戲」原因為何?


我們正在找夥伴!

2019 年我們的團隊正在大舉擴張,需要你的加入跟我們一起找出台灣創新原動力! 我們正在徵 《採訪社群編輯》、《助理編輯》,詳細職缺與應徵辦法 請點我

點關鍵字看更多相關文章: