最新棋靈王不是人,Google 人工智慧 5:0 完勝圍棋歐洲冠軍

《TO》導讀:人工智慧的發展已經成為接下來的科技界重要話題。Facebook CEO Mark Zuckerberg 先前已經宣布今年的個人挑戰就是建造一個家用 AI 管家。Mark Zuckerberg在貼文中提到,目前人工智慧學習程度還未顯著提升,必須要靠非常大量的訓練,才有辦法讓 AI 了解一個簡單的概念。因此,他希望突破這個關卡,打造一個具有人類常識的智慧系統。

另外一方面,Google 也同樣在進行類似計畫,人工智慧系統 Alpha Go 現在已經可以進化到打敗歐洲圍棋冠軍,讓對方直呼根本就是一個像人一樣的對手。

儘管人工智慧已經在很多方面打敗人類了,比如國際象棋,但是圍棋,一直被認為是人類仍然在機器面前能保持優勢的遊戲之一。

過去 20 多年來,科技家們一直在試著教會電腦下棋,在 1997 年,IBM 的深藍曾經打敗了國際象棋的世界冠軍 Garry Kasparov,這成為了人工智慧的一座里程碑事件。但是,圍棋比國際象棋還是要復雜得多,國際象棋中,平均每回合有 35 種可能,一盤棋可以有 80 回合;相比之下,圍棋每回合有 250 種可能,一盤棋可以長達 150 回合。可以想見,如果人工智慧打敗了人類最頂尖的圍棋選手,這將成為人工智慧發展的另外一座里程碑。

但現實是,在過去很長時間裡,最好的計算機連厲害點的業餘圍棋棋手都下不過。所以,去年,Facebook 就開始打造圍棋人工智慧,並且在過去 6 個月裡讓它可以用最快 0.1 秒的速度來落子。負責這項目的人,就坐在離扎克伯格 20 英尺遠的地方。

但是,Google 還是快一步。

最權威的科學期刊《自然》雜誌 ​​刊發了 Google 的圍棋人工智能「阿爾法 Go」(AlphaGo)的最新進展:它讓計算機在沒有任何讓子的情況下,以 5:0 完勝圍棋歐洲冠軍樊麾。

2

這場比賽實際上發生在去年十月,但是知道今天,它才在《自然》雜誌中披露出來。

阿爾法 Go 的研發者是 Google 位於倫敦的人工智能團隊DeepMind,它的負責人 Demis Hassabis 在接受英國《獨立報》採訪時說,

這是第一次,計算機在一塊全尺寸棋盤、沒有任何讓子的情況下,贏了職業圍棋選手。

這個比賽結果,意義相當重大。「圍棋有可能是人類玩的最複雜的棋盤類游戲。」Hassabis 說,「但是阿爾法 Go 還是贏了,它比我們預料的還要強大。」

「阿爾法 Go 自己學會了很多規律和走法。圍棋被認為是人工智能研究的頂峰,是聖杯。對我們來說,這是難以抗拒的挑戰。」

在下國際象棋的時候,計算機可以分析出每一個可能的步驟,從而進行最優選擇,但是,圍棋可能的步驟是國際象棋的 10 倍之多。這也正是圍棋人工智能的難點所在。

David Silver 是這項研究的第一作者,在他看來,阿爾法 Go 的關鍵不在於簡單粗暴的計算出可能步驟,而是近似於人類的「想像力」。這背後是名為一項名為「深度學習」的大殺器,它讓計算機不再是簡單地使用計算能力來統計所有數據,而是像人類一樣,訓練,然後學習。Silver 說,計算機「下圍棋需要的極複雜的直覺機制,這種機制以前我們認為只可能存在於人類大腦中。」

Google-Nature-chess-300x394

阿爾法 Go 用了多種「神經網路」並行,並且相互作用。其中,一個叫做「值網路」(value network),來衡量白字和黑子在棋盤上的位置,一個叫做「策略網路」(policy network),會不斷地學習此前人類和自己的落子,來選擇接下來怎麼下。

「人類在一年裡只能下 1000 盤棋,但是阿爾法 Go 可以在一天就下幾百萬盤。它有強大的處理能力,不斷獲得訓練,所以阿爾法 Go 可以到達人類遠遠達不到的境界。」

不僅僅比人類、比起其他機器人同類,阿爾法 Go 也更加強大。它和其他人工智慧下了 500 場圍棋,只輸了 1 場,甚至在給對手讓子的情況下,它也照贏不誤。而 Silver 說,它比其他人工智能更先進的地方,就在於可以自我學習。而且,這種機制不僅僅可以用在圍棋學習中,阿爾法 Go 還可以用來解決很多現實問題,比如處理氣候模型等。

「它就像人類一樣在學習著,不過需要更多練習。一個人類可以在幾局棋裡學到的東西,它必須通過幾百萬盤才能學到。」

然而那又有什麼關係呢?下幾百萬盤棋,對它來說也不過只用一天的時間而已。在去年十月這場比賽之前,最好的計算機連厲害點的業餘圍棋棋手都下不過,所以很多人預測,計算機要打敗真正的圍棋高手,至少還需要 5 到 10 年的時間,但是,這一天已經提前這麼久到來。

可能有人說,歐洲冠軍樊麾無法代表圍棋界世界最頂級的水平。但是在樊麾看來,

如果沒有人告訴我,可能我會認為和我下棋的是一個有點古怪但是非常厲害的對手,一個真正的人。

那好吧,另外一場更關鍵的較量也即將發生:Google 的「阿爾法 Go」和現在的圍棋世界冠軍李世石(Lee Sedol),將在今年三月正式進行比賽。在圍棋這個古老的、幾乎代表了人類智力巔峰的遊戲上,機器人和人類究竟誰更強大,答案很快就會揭曉。

李世石說他很期待在三月的時候和阿爾法圍棋較量。他說,

我聽說了 Google DeepMind 的人工智能出人意料地強大,而且正在變得越來越強,但是我很信心,至少這一次,我可以贏。

而 DeepMind 的負責人 Demis Hassabis 同樣說,

我們非常有信心。

(本文轉自Pingwest,未經授權不得轉載)

  • 延伸閱讀

電影「模仿遊戲」演繹圖靈一生,看社會歧視如何拖慢人工智慧發展
2016 臉書馬克新挑戰:不靠工程師團隊,花一年自己 code 出 AI 智慧管家
防止邪惡機器人出現,Elon Musk 拿出 1000 萬投資安全人工智慧