【為什麼我們要編譯這篇文章】OpenAI 進入 DOTA2 的錦標賽血洗專業玩家,在一陣歡聲鼓舞的慶典中,質疑的聲浪也日漸高漲。許多人認為 OpenAI 在比賽中存有不公平的地方,無論是一開始選角到遊戲的攻防戰,甚至到使用的資源都是熱烈討論的中心。OpenaAI 到底是不是贏的光明正大,這是非爭紛之地,你代表的意見是什麼?(責任編輯:陳伯安)
兩周前,AI 戰隊 OpenAI Five 還處在 DOTA2 擊敗人類的得意中;
兩周後,它就陷入了作弊疑雲。
美國媒體 Motherboard 指出了 OpenAI Five 在這場人機大戰中的幾個可疑之處。
OpenAI Five 只會 18 支角色,沒 Ban 角環節怎麼可以說贏的光明正大
不管是 DOTA、LOL 還是王者榮耀,MOBA 遊戲的玩家都知道,BP(ban pick)機制是保證遊戲公平的重要一環,其中也體現了玩家雙方團隊鬥智鬥勇的過程。
BP 發生在遊戲開始前的選英雄過程,雙方輪流禁掉部分英雄,然後再輪流選擇英雄。
禁掉哪位強勢英雄或者對方玩家擅長的英雄,選擇怎樣的英雄陣容,依據對方的陣容如何進行克制,是 BP 中玩家需要考慮的問題。
這個過程不禁考驗雙方對不同英雄的瞭解和熟練程度,更是一個耍心機的戰場,BP 是雙方團隊默契配合與策略博弈的一部分,也是 MOBA 遊戲的重要組成部分。

目前 DOTA2 中有 115 位英雄,然而,在 8 月 6 日早上(北京時間)的人機大戰中,由於 OpenAI Five 還沒有學會這麼多英雄,所以整場比賽只有 18 個英雄可供選擇。
這麼少的英雄數量若是還要 ban 英雄的話,那恐怕是沒得選了。所以雙方都只是象徵性的走流程,ban 掉了一些不在這 18 個英雄範圍內的英雄,就開始選英雄了。
BP 的策略關被 AI 省掉了,相當於給 AI 降低了難度。
AI 有種就放下你手中的電腦數據,用視覺判斷跟我打
在 AI 打遊戲這件事上,交互方式是最讓人關注的問題之一。
對於人腦而言,打遊戲時的輸入是視覺 & 聽覺信號,人類玩家需要用眼睛和耳朵這兩種「傳感器」來接受信號,傳送到大腦中,判斷遊戲中的情景,知道敵人離我有多遠、隊友能否來得及支援、雙方經濟狀況如何。
而對 AI 而言卻容易多了,在這場比賽中,OpenAI Five 可不長眼睛,而是直接靠 API 讀取遊戲中的數據。
這一點,在推特上引起了熱烈的討論。
有許多觀眾覺得,人類和 AI 打的根本不是一個比賽。
佐治亞理工學院 (Georgia Tech) 教授 Mark Riedl 說,雖然那個 API 的設計初衷,就是不讓 AI 擁有的信息多過人類能獲取的信息,但 AI 只有依靠視覺,才是和人類站在同一片戰場。
不過,使用因為使用 API 而擁有優勢,算不算作弊,依然有爭論,畢竟這是官方賽前發佈的消息。
但它確實不公平,因為這些數據帶給 AI 的是 100% 的精確性。
比如說,當人類需要確認攻擊能否打到敵人身上時,基本靠目測,如果低估了距離就會打不到敵人,如果高估了距離則容易受到敵人的攻擊。而接收 API 數據的 AI 則可以通過計算卡在最遠的距離上攻擊敵人,或是在最佳的站位上發起進攻,足以保證自己的損失最小。

這次人機大戰中的人類隊員、DOTA2 解說、半職業選手 Capitalist(Austin Walsh)就對此感到十分扎心:
「AI 清楚地知道每個英雄的位置,知道你擁有多少攻擊力,它確切地知道一條路上的三、四個英雄可以造成多大的傷害。並且,當你的走位出現問題時,它會立即開團。我從來沒這麼玩過,這簡直鵝妹子嚶(TO 編按:AMAZING)。」
反之,讓 AI 用視覺打遊戲,並不簡單。DeepMind 用 AI 打星際的主力 Oriol Vinyal,就讓 AI用視覺打過星際。用著 64×64 的輸入,AI 吃了大虧。
大概,在依靠視覺這一目標達成之前,不管 AI 解鎖多少英雄、多少物品,贏過多少頂級人類選手,也不能算是稱霸 DOTA 2。
人類在 Dota2 正式賽裡用特定滑鼠被禁賽,OpenAI 用意念就怎麼沒事?
輸出也同樣不公平。
人類要輸出操作信息,必須使用滑鼠和鍵盤,控制技能施放、控制走位全都依賴於鍵盤滑鼠。而 AI 則連手指都不需要動,一個指令就直接操作了,使用「意念」控制,簡直比人類用宏編程滑鼠玩遊戲還簡單。
宏編程滑鼠,就是上面這玩意,通常我們都叫它遊戲滑鼠,除了左鍵右鍵滾輪之外,還在中間、側面等位置加裝了許多按鍵,可以用宏來把這些新增的按鍵設計成不同的遊戲按鈕,一鍵完成許多複雜的操作,讓玩家操作起來更簡單。
不過,在正式 DOTA2 比賽中,使用宏編程滑鼠是違規的。今年 6 月,秘魯隊就因為一名隊員在資格賽中使用了宏編程滑鼠而被取消了 TI8 的比賽資格,秘魯隊不得不和 2479 萬美元(約台幣 7.4 億)的獎金池 say goodbye 了。所以,OpenAI Five 這種使用「意念」的操作模式也可以算作弊。
更何況,在隊友配合方面,AI 用的也是「意念」。
人類隊伍有 5 個人,需要用語言交流配合;而 OpenAI Five 的「團隊」活在同一塊 USB 里,它們之間壓根不用溝通,直接「心靈感應」就可以了,簡直不要太輕鬆。
OpenAI 團隊,說好的 200 毫秒去哪了?
另外,賽前 OpenAI 團隊表示,在人機對戰中會把 AI 的反應時間,下調到與人類相似的 200 毫秒,以求公平競爭。
可在賽後,由於 AI 贏得過於輕鬆,反應速度受到了觀眾的強烈質疑。
「肯定比 200 毫秒快」,這樣的聲音此起彼伏。

如果說,API 是一早就公佈了的信息,算不得作弊,那反應速度若有虛報,就是另一回事了。
然而,這個懷疑並沒有得到 OpenAI 的官方回應。
OpenAI 得花時間去學人類習以為常的技巧,就算有不公平也得說一句贏的漂亮
這場比賽是存在不公平的因素,但若強硬地表述為 AI 作弊,在許多人看來仍然有失偏頗。
比如,提出「AI 該靠視覺來跟人類同場競技」的 Mark Riedl 教授本人,就很排斥這個說法。
他覺得,OpenAI 並沒有隱藏 AI 的任何優勢。盡人皆知的事,很難用「作弊」來定義。
另外,Riedl 在深知這些的情況下,依然認為在 DOTA2 5v5 團戰中戰勝人類,是非常了不起的成就。
他看到,AI 游刃有餘,只要對手所處的位置不利,便可瞬間發動攻擊。於是,獲得了和現場觀眾一樣的美妙感受。
畢竟,神經網絡與人腦之間依然存在很大的差別,對人類來說自然而然的事,機器也要一點一點學起來。
這樣想來,雖然比賽是在嚴格控制的環境下進行的,AI 也算贏得漂亮。
OpenAI Five 即將出戰 TI8,頂級玩家與 AI 的鬥爭誰輸誰贏?
無論作弊的定義是否準確,人類都已經從被 AI 摩擦的恐懼里,感受到了 OpenAI Five 的強大。
所以,大家還是希望看到一場更加公平的比賽,不論是為人類正名也好,反向襯托 AI的實力也罷。
如果,上一場 5v5 沒有讓各位心服口服,OpenAI Five 不日將出戰 TI8。希望那時,頂級人類選手和 AI 之間的比賽,大家能看個過癮。
你猜,和 AI 打比賽的會是哪支隊?
(本文經合作夥伴 量子位 授權轉載,並同意 TechOrange 編寫導讀與修訂標題,原文標題為 〈DOTA 2血虐人类的OpenAI,原来靠的是作弊?〉。)
延伸閱讀
OpenAI 用《Dota 2》示範血虐人類:砍瓜切菜偷推塔,職業選手被當菜打
馬斯克 OpenAI 打 Dota 2:玩爆平民玩家後,世界賽專業電競手也是同樣下場?
人類玩家血流成河!最反 AI 的馬斯克,開發稱霸《Dota 2》的無敵 AI