29 歲就做出近 20 年最重要 AI 突破,讓人類 CONNECT with AI 的男人 Ian Goodfellow

【我們為什麼挑選這篇文章】Ian Goodfellow 的貢獻,教會電腦擁有想像力,造就近年的 AI 革命和應用大場域,創造了傳統產業 AI 轉型的機遇,讓整個業界 CONNECT with AI 。(責任編輯:林子鈞)

台灣產業 AI 化
傳產轉型第一線
立即購票

通過使用兩個神經網絡的相互對抗,Ian Goodfellow 創造了一個強大的 AI 工具。而現在,他以及我們所有人都必須開始面對其所帶來的後果了。

2014 年的一晚,Ian Goodfellow 和一個剛剛畢業的博士生一起喝酒慶祝。在蒙特利爾一個酒吧,一些朋友希望他能幫忙看看手頭上一個棘手的項目:電腦如何自己生成圖片。

研究人員已經使用了神經網絡(模擬人腦的神經元網絡的一種算法),作為生成模型來創造合理的新數據。但結果往往不盡人意。計算機生成的人臉圖像通常不是模糊不清,就是缺耳少鼻。

Ian Goodfellow 朋友們提出的方案是對那些組成圖片的元素進行複雜的統計分析以幫助機器自己生成圖片。這需要進行大量的數據運算,Ian Goodfellow 告訴他們這根本行不通

邊喝啤酒邊思考問題時,他突然有了一個想法。 如果讓兩個神經網絡相互對抗會出現什麼結果呢? 他的朋友對此持懷疑態度。

當他回到家,他女朋友已經熟睡,他決定馬上實驗自己的想法。那天他一直寫代碼寫到凌晨,然後進行測試。第一次運行就成功了!

那天晚上他提出的方法現在叫做 GAN,即生成對抗網絡(generative adversarial network)

該方法已經在機器學習領域產生了巨大的影響,也讓他的創造者 Goodfellow 成為了人工智能界的重要人物。

CHRISTIE HEMM KLOK

在最近幾年,通過深度學習技術,AI 研究人員取得了令人矚目的進展。向深度學習系統輸入足夠的圖像,它就能進行學習,比如識別出一個將要過馬路的行人。 這一技術使得自動駕駛技術,Alexa、Siri 等會話技術支持的虛擬助手成為可能

這標誌著無監督學習的一大飛躍

雖然使用深度學習的人工智能工具們能夠學習如何識別事物,但它們並不擅長創造事物。 而 GANs 的目標就是賦予計算機類似於想像力的東西

要實現這一功能並不是簡單的讓它們能夠畫漂亮的圖片或者譜優美的歌曲,而是要 讓它們盡量少的依賴人類來告訴它們世界該是什麼樣子以及它們該怎麼工作

如今,AI 工程師通常需要明確告訴機器輸入的訓練數據是什麼,即一百萬張圖片中哪些圖片是過馬路的行人以及哪些不是。而這樣的過程不僅花費極大,需要大量人工參與,還限制了系統對於一些稍微偏離訓練集的數據的處理。

未來,電腦將會更好地消化原始數據, 在沒有明確命令的情況下,從原始數據中找出它們需要從中學習的東西

這將標誌著「無監督學習」的一大飛躍。無需離開車庫,自動駕駛汽車就可以自學如何處理不同的路況;無需四處走動,機器人就能夠預估到在一個忙碌的倉庫中可能遇到的障礙。

我們能夠想像和思考不同的場景,這是我們作為人的一部分。當未來技術方面的歷史學家回過頭來看時,可能會把 GAN 方法的提出看作是邁向創造具有類人意識機器的一大步。 臉書的人工智能首席科學家 Yann LeCun 將 GAN 稱之為『近 20 年來深度學習領域最棒的想法』

前百度大腦首席科學家吳恩達認為 GAN 代表著「一項重大而根本性的進步」,它鼓舞了全球越來越多的研究人員。

神奇的 GAN 和它廣泛的應用

Goodfellow 現在是位於加州山景城谷歌總部的谷歌大腦團隊中的一名研究員(大數據文摘之前報導過他在 谷歌做實習生的精彩故事)。當我最近在那裡見到他的時候,他似乎對於 AI 名人的身份感到驚訝,認為這有點「超現實」。

同樣讓人驚訝的是,他已經發現有人在用 GAN 達到不法目的,所以 他現在大部分的時間都花在對抗壞人,應對這些壞行為上

GANs 的魔力來自於兩個神經網絡的對抗(點擊查看大數據文摘總結的 GANs 奇思妙想榜單)。

它模仿一名圖片偽造者和一名藝術鑑定師之間想要打敗對方的交鋒過程。這兩個網絡都在同樣的數據集上訓練,第一個網絡稱作生成器,生成器用來生成仿造的輸出如圖片或者筆跡,仿造得越真實越好。

第二個網絡稱作判別器,將生成器生成的圖片與訓練集中真實的圖片進行比較,然後判斷哪些圖片是真實的哪些是假的。根據判定器的結果,生成器將更新參數,然後生成新的圖片。如此循環,直到判別器不再能判斷圖片的真偽。

一位使用真實名人照片進行培訓的 GAN,自己創造出了一系列想像中的明星。

在去年一個眾所周知的例子中,英偉達(一家投資重心在人工智能領域的芯片公司)的研究人員訓練了一個 GAN 模型,通過學習真實名人的圖像生成虛構名人的圖像。 不像其他的機器學習方法那樣需要成千上萬的訓練圖像,GANs 只需要幾百張圖片就能達到相當好的效果

GAN 的想像能力還很有限。譬如,一旦訓練了大量狗狗的圖片,GAN 模型就能夠生成一張相當真實的狗狗的圖片,差別可能只是狗狗身上的斑點有些許不同。但它不能生成一張全新動物的圖像。

原始訓練數據的質量對結果的影響仍然巨大。一個生動的例子是,GAN 模型開始生成一些帶有隨機字母的貓的圖片。這是因為訓練數據中包含了來自網路的貓表情包,所以機器認為這些表情包上的字母是貓的一部分。

華盛頓大學機器學習研究員 Pedro Domingos 說過,GANs 的性能並不穩定。如果鑑別器太容易被欺騙,那麼生成器輸出的圖像將看上去不太真實。而校準這兩個相互對抗的神經網絡也是很困難的,這就解釋了為什麼 GANs 有時會生成一些奇怪的東西,比如有兩個頭的動物。

然而,這些挑戰並沒有阻止研究人員。自從 Goodfellow 等人在 2014 年發表了關於他的發現的第一份報告之後,數百篇與 GAN 相關的論文陸續發表。GAN 的一名粉絲甚至還創建了一個名為「GAN zoo」的網頁,專門用於追蹤已經開發出來的不同版本的 GAN。

網頁鏈接(兩個網頁內容一致):

GAN 最明顯的即時應用是在涉及大量圖像的領域,比如視頻遊戲和時尚領域(例如讓遊戲角色看起來像是在雨中奔跑)。但展望未來,Goodfellow 認為 GANs 將會推動更大的進步。他說:「在科學和工程的很多領域都有一些東西需要優化。」例如藥物需要提高藥效以及電池需要提高效率等。「這將是下一個浪潮。」

在高能物理中,科學家們利用強大的超級電腦來模擬數百個亞原子粒子,在瑞士的 CERN 的大型強子對撞機這樣的機器中可能發生的相互作用。這類模擬需要大量的計算能力,非常緩慢。

耶魯大學和勞倫斯伯克利國家實驗室的研究人員開發了一種 GAN,在對現有的模擬數據進行訓練後,它學會了對特定粒子的行為做出精確的預測,而且速度快得多。

Goodfellow 創造的 GANs 可以用來想像各種各樣的事物,包括新的室內設計。

醫學研究是另一個有潛力的領域。由於有隱私方面的擔憂,研究人員有時無法獲得足夠多的真實患者數據(進行研究),例如分析為什麼某種藥物不起作用。賓夕法尼亞大學的凱西格林說,GANs 可以通過生成幾乎和真實情況一樣好的假記錄來幫助解決這個問題。這些數據可以得到更廣泛的分享,推進研究,而真正的記錄則受到嚴密保護。

Goodfellow vs Bad fellows 技術的黑暗面

然而,技術也有黑暗的一面。對於那些想要影響從股價到選舉等方方面面的人來說, 一台可以製造假新聞的機器簡直是一個完美的武器

人工智慧工具已經用來在色情片的身體上放上其他人的臉(戳這裡閱讀大數據文摘相關報導),以及用政客的聲音說出自己想說的話。雖不是 GANs 製造這個問題,但是 GANs 的存在將會讓事情變得更糟。

Hany Farid 在達特茅斯學院在學習數字取證,他正在研究用更好的方法來識別假視頻,比如由呼吸引起的面部顏色的輕微變化,而這些變化 GANs 很難準確地模仿。但他警告說,GANs 會反過來學習這些變化。Farid 說:「從根本上來說,我們處於弱勢地位。

這種貓捉老鼠的遊戲也會對網絡安全產生影響。研究者已經強調了「黑匣子」攻擊的危險性,GANs 被用於找出機器學習模型,因為許多安全程序都是用這些模型來識別惡意軟件的。

當搞清防禦模型算法的工作原理後,攻擊者就能避開防禦然後插入流氓代碼。同樣的方法也能用於逃避垃圾郵件過濾器等安全防禦措施。

Goodfellow 很清楚這一危險。他現在領導一個谷歌的團隊,專注於讓機器學習變得更加安全。他警告說,人工智能社區必須吸取以往創新浪潮的教訓:技術人員總是在事後才開始考慮安全和隱私問題。

當他們意識到風險的時候,壞人已經有明顯的領先優勢了。他說,「很明顯,我們已經錯過了起點,但希望在落後太多之前,我們能在安全問題上取得重大進展。」

儘管如此,他認為不存在一個純粹的技術手段可以解決造假問題。相反,他認為,技術依賴於各種社會因素而進步,比如通過演講和辯論課等,教會孩子們批判性思維。

「在演講和辯論中,你會和另一個學生競爭,你在考慮如何編造有利於自己甚至是誤導的說法,或者如何提出具有說服力的正確的主張。」他可能是對的,但他得出的「技術不能解決假新聞問題」的結論,並不是人們想要聽到的。」

原文連結

人工智慧,新時代

AI 新創服務的末日到了?Google 新 AI 平台,讓不懂技術的人也能玩轉人工智慧

AI 已經會寫 AI 啦: Google 人工智慧寫了一個圖形辨識軟體,效能還狂壓人類寫的軟體!

【附影片】日本 AI 全新應用:會自己移動曬太陽的盆栽,還能當你的心靈導師

(本文經合作夥伴 大數據文摘 授權轉載,並同意 TechOrange 編寫導讀與修訂標題,原文標題為 〈GAN 之父 Ian Goodfellow :那個賦予機器想像力的人類 〉。)


避免客服 chatbot 回答的牛頭不對馬嘴,該怎麼做?
精進線上客服力,來做 2019 年雲端技術調查 >> 點我測驗 <<

 

點關鍵字看更多相關文章: