Facebook 教 AI 談判:不僅學會了說謊,還發明了人類不懂的新語言

【我們為什麼挑選這篇文章】

大家有聽過賽局理論嗎?很常在談判和做決策時用到,透過數學和統計機率的計算,臆測對手的行為和想法,進而達到自己利益的最大化,有點像「如果他選 A 的話選 B 對我來說比較有利」、「但是他可能會知道我知道他要選 A 所以我選 B 所以他最後選 C」這樣一步步推導的過程。這次臉書對 AI 的訓練在我聽起來就有點像是賽局的應用:每一步都經過分析,為的是利益最大化。但是在現實生活中,談判不可能像 AI 或數學那樣啊,「人類」的存在本身就替各種理論和計算增加了許多變數,這也是人類跟 AI 不同卻有趣的地方!

(責任編輯:謝秉芸)

把 AI 和 AI 放在一起,似乎總能產生神奇的化學反應。

最近,Facebook 在實驗中 讓兩個 AI 聊天機器人互相對話,發現機器人竟逐漸發展出人類無法理解的獨特語言。

其實,Facebook 這個實驗的主要目的,是想讓機器學會談判。

實驗中,雙方選手語言通過談判「瓜分」一堆物品(比如兩本書、一個帽子和三個球),而每種物品對於不同選手的價值是不一樣的,也就是談回來的物品,對於兩位選手帶來的分值是不一樣的。

從人類的角度理解,這個分值就意味著,你有多想要這個物品。有趣的是, 研究人員設置的場景,就跟生活中一樣,存在訊息不對稱 ——你知道自己多在意這個東西,但是你不知道對方有多想要,所以,你必須從對話中推斷對方的想法。

遊戲介面

每一句話,都經過計算

Facebook 的 AI 團隊(簡稱 FAIR)還設置了其他的限制,讓其更接近現實中的談判場景,比如,要確保兩個選手不可能同時拿到最好的結果。生活中往往無法盡如人意,我們總是要學會妥協。

其次,如果放棄談判,或者談了 10 輪還沒談好,雙方都只能拿零分,也就是一拍兩散。因此,想要利益最大化,你必須擁有傑出的談判技能。

在訓練過程中,AI 學會減少說廢話和意思模糊的話,提高談判的效率。談判顯然不是一件如此簡單的事,而是一個關於語言和推理的藝術,既包括合作也包括對抗,選手必須學會適當的理解和表達,以達到自身目的。

FAIR 研發了一個對話推斷模型框架,模擬未說出的對話可能性,然後根據每種對話最後可能的得分,計算自己應該說什麼。

對話推測模

AI 學會了偽裝與欺騙

FAIR 團隊會讓 AI 跟人或者另一個 AI 一起玩遊戲,讓 AI 逐漸學習應該怎麼談判。經過一輪學習之後,研究團隊發現了以下現象:

人類比 AI 更難捉摸、也更任性 :新入局的選手在面對人類對手時,明顯談判耗費的對話時間更長,接受交易更慢。 人類與 AI 另一不同,人類有時候會拒絕繼續,直接一拍兩散,而實驗中的 AI 會一直談判,直到達成共識與結果。

從下面的表格中可以看出, 相比起人與 AI 談判,兩個 AI 談判達成一致的概率更高,而且結果也更接近最優解。

機機對戰與人機對戰的對比

AI 學會耍手段 :某些案例中,AI 選手會先假裝自己很想要某個物品,其實這個東東對他而言毫無價值。為什麼要這麼做?原來是為了之後假裝「妥協」,因為它發現了對方很想要,如此一來就能騙得對方放出一些更有價值的物品——人類平時的慣用伎倆,沒有人教 AI,但它自己學會了。

下面三個對話,分別展示了堅持要最大化分數的 AI、學會妥協的 AI 和學會假裝不在意的 AI。

AI 會說未見過的句子 :雖然神經網路傾向於訓練 AI 重複數據庫裡面的話語,但結果是,AI 自己學會組織和生成新的句子和說法

AI 發展出人類不能理解的新話

實驗還出現了更多讓實驗人員意想不到的情況,比如「不說人話」。

如前所及,Facebook 的文章提到,在強化學習期間,AI 選手會嘗試通過與另一個選手的對話來改進自己的參數,對手可能是一個人也可能是另一 AI。

除了這個模型之外,FAIR 還使用了一個監督訓練模型來訓練 AI 模仿人講話,這個模型是後來加入的,同時參數不能被修改。因為研究人員發現, 當兩個 AI 一起聊天,相互改進、升級自身參數的同時,會逐漸偏離人類日常交流的語言,發展出自己的語言。

有些人可能覺得,AI 居然發展出了人類理解不了的獨立語言,簡直細思極恐。要是以後 AI 在密謀什麼,人類都聽不懂怎麼辦?

細心一想,難道動物們說的話人類又能聽懂嗎?(當然,人類一直擁有一種自負,認為語言是人類獨有的能力。)既然 AI 那麼聰明,懂得見人說人話,見 AI 說 AI 話,未來說不定能學會跟動物溝通……

況且別忘了,只要工程師加入一個模型,就能「撥亂反正」,人類暫時還不需要那麼雞凍吧。Facebook 研究員在報告中很淡定地寫:

「未來的工作還有很多潛在可能,特別是讓機器理解更多推理策略,以及在不偏離人類語言的情況下提高表達的多樣性。」

 

(本文經合作夥伴 36 氪授權轉載,並同意 TechOrange 編寫導讀與修訂標題,原文標題為 〈AI 不僅學會了說謊,還發明了人類不能理解的新語言| 潮科技〉。)

延伸閱讀

完爆人類!微軟 AI 打破《Pac-Man》遊戲紀錄,創下歷史最高 999990 分
看完一堆病歷與 X 光後,AI 學會了一件挺殘忍的事情:預言死亡
AI 讓魯蛇更魯:會「談戀愛」機器人即將成真,想要會撒嬌的、傲嬌的、妹系的一次滿足
毫無懸念,今天柯潔輸了:只輸一目半,卻是人類棋手與 AI 難以拉近的差距

點關鍵字看更多相關文章: