揭秘「AlphaStar」演算法!看 AI 如何在《星海爭霸 2》血洗職業玩家

公司再度推出「AlphaStar」,在《星海爭霸 2》人機對抗賽中,以 10 勝 1 負擊敗知名的職業玩家。

【為什麼我們要挑選這篇文章】2014 年被 Google 收購的英國人工智慧公司——DeepMind ,三年前開發的 AlphaGo 贏了世界冠軍韓國職業棋士李世乭。

今年,公司再度推出「AlphaStar」,在《星海爭霸 2》人機對抗賽中,以 10 勝 1 負擊敗知名的職業玩家。AlphaStar 的訓練方式為何?讓我們繼續看下去。(責任編輯:施怡婷)

「《科技報橘》徵才中!跟我們一起定位台灣產業創新力 >> 詳細職缺訊息
快將你的履歷自傳寄至 [email protected]

歐洲的星際爭霸玩家們即日將有機會和 Deepmind AI 打場比賽了!

出戰的 AI 是由 DeepMind 和暴雪聯合培養的,經過了「特別的訓練方式」,在星際爭霸界 II 早有過赫赫戰績,連續在 10 場比賽中擊敗了人類職業選手。

其實,在今年年初的那次交鋒總共有 11 場比賽,只有全球直播現場交手那一次,由於比賽限制了 AI 的「視覺」能力,MaNa 幫人類贏了一場。

另外 10 場比賽,代表人類出戰的是職業選手 TLO 和 MaNa。兩位選手分別與 AlphaStar 打了五場。如果說與 TLO 對戰時 AlphaStar 還是萌新的話,那麼與 MaNa 的對戰則完全顯示出了其戰術的老辣。畢竟,兩個比賽才相隔 2 週,AI 自學成才的能力已經初步顯示了可以超越人類極限的潛力。

AI 已被多次證明可以超越人類,下一步 AI 發展將進入「強化分析」 階段,在 AI 越來越強大的未來裡,台灣人才如何自處呢?

8/10(六) 【科技報橘 2019 年度論壇】CONNECT 2030 What’s The Future,破解台灣 AI 小國大戰略的重要核心。

那次輸給 AI 後,不少《星海爭霸 2》的人類玩家都躍躍欲試,希望能親自挑戰 AI,但只有少數職業玩家有權與 AI 對抗。

直到今天,星海爭霸官方發推文表示,歐洲區《星海爭霸 2》的玩家,將有機會在限定時間內與 DeepMind 的 Alphastar 人工智慧對抗。

你的對手可能是 AI,而你毫不知情

作為正在進行的人工智慧研究的一部分,DeepMind 星際爭霸 II 代理商 AlphaStar 的實驗版本很快將在歐洲競爭激烈的平台上與人類玩家對抗。

在官方「戰書」中,Deepmind 表示,如果你希望有機會和 DeepMind 與 AlphaStar 打匹配,你可以點擊遊戲內部彈出窗口上的「選擇加入」按鈕進行選擇。你可以隨時使用 1v1 Versus 菜單上的「DeepMind opt-in」按鈕來改變你的選擇。

為了確保測試數據的真實,玩家不會被告知他們正在和阿爾法星人工智慧對抗。因為當玩家知道自己在對抗 AI 時,他們的反應可能會有所不同。玩家可能會參與社區中所謂的「奶酪策略」,而 AI 可能還沒有準備好。

從本質上講,「奶酪策略」是一種非常規的戰略,旨在讓對手措手不及。這些遊戲不會被納入 AlphaStar 的訓練中,系統只能從人類回放和自我對戰中學習。

AlphaStar 是如何訓練的?

DeepMind 也在今天的部落格中描述了 AlphaStar 的訓練方式。

AlphaStar 是由一個深度神經網路生成的,它接收來自原始遊戲界面的輸入數據,並輸出一系列指令,構成遊戲中的一個動作。

更具體地說,神經網路體系結構將 transformer 框架運用於模型單元(類似於關係深度強化學習),結合一個深度 LSTM 核心、一個帶有 pointer network 的自回歸策略前端和一個集中的值基線。這種先進的模型將有助於解決機器學習研究中涉及長期序列建模和大輸出空間(如翻譯、語言建模和視覺表示)的許多其他挑戰。

AlphaStar 還使用了一種新的多智能體學習算法。該神經網路最初是通過在 Blizzard 發布的匿名人類游戲中進行監督學習來訓練的。這使得 AlphaStar 能夠通過模仿學習星海爭霸上玩家所使用的基本微觀和宏觀策略。這個初級智能體在 95% 的遊戲中擊敗了內置的「精英」AI 關卡(相當於人類玩家的黃金級別)。

OMT:知己知彼,百戰百勝?

最後,其實就在上週,一個由澳洲開發人員、機器學習工程師和研究人員組成的團隊 StarAi 就基於星海爭霸的人機對抗開發了一個 機器學習課程 ,並且在線免費發布,只用瀏覽器就能學!不如先去了解一下你的對手,再來試試看勝算有多大呀!

(本文經合作夥伴 大數據文摘 授權轉載,並同意 TechOrange 編寫導讀與修訂標題,原文標題為 〈DeepMind 刚向星际争霸 II 的玩家们下了战书!你的对手可能是只 AI,而你毫不知情 〉。首圖來源:NVDIA 官網)

延伸閱讀

PyTorch 深度學習入門推薦!清楚的 PPT 講解,讓你 5 天就上手
【2019 年圖靈獎】最偉大人工智慧三巨頭:少了這些研究,深度學習就掰掰了
自己的數據自己標!南韓新創訓練 AI 自產深度學習數據集

點關鍵字看更多相關文章: