史丹佛大學發表 AI Index 報告,一秒看懂 AI 與人類目前到底差多少!

史丹佛教授發佈首份AI Index報告,指引 AI工作者不再「flying blind」

【我們為什麼挑選這篇文章】日前,史丹佛大學計算機科學院教授,前 Google 首席科學家 Yoav Shoham 去中國做了場《人工智慧的過去、現在和未來》的報告,公開了一份他一年來主導的報告:AI Index

那什麼是 AI Index,這份報告又會對 AI 領域投下什麼震撼彈?本文帶你深入理解這份報告,讓你一手掌握當今 AI 發展趨勢!(責任編輯:林厚勳)

「AI Index」是什麼?

瞭解一個國家的經濟發展,我們要當然要看 GDP;但是想瞭解人工智慧的發展狀況時,我們看什麼呢?Yoav Shoham 教授想要說的就是:AI Index

這件事要從 2014 年說起,當時史丹佛大學決定啟動一個叫做「AI100」的項目,中文理解就是「人工智慧百年研究」。項目的首要目標簡單來說就是持續地去調查、總結人工智慧未來 100 年在學術研究、經濟、道德倫理、法律等方面的進展和對此的展望。

在去年 9 月份,「AI100」的 panel 小組推出了第一份《史丹佛人工智慧百年研究:2030 年的人工智慧與人類生活》的報告。

但是「AI 100」有一個缺點就是,它每五年才會推出一份報告,不能及時跟蹤 AI 的發展。於是在去年(2016 年)Yoav Shoham 退出了「AI100」的領導小組,並和 Ray、Erik、Jack 和 Kelven 等人開始領導、開發一項旨在及時跟蹤並反映人工智慧當前發展的現狀的一個指標體系—— AI Index。

如《AI index 2017 annual report》報告中所說:

AI 領域在迅猛地發展,即使是專家也很難理解和跟蹤整個領域的進展。沒有相關合理的數據來呈現 AI 技術的現狀,那麼我們去開會或者做一些 AI 相關的決策其實就像是在「flying blind」。

而現在,我們真的在「flying blind」!

(TO 編按:flying blind,蒙眼飛行之意。)

Yoav Shoham 教授希望能通過這個開放的、公益的、基於數據的 AI index 報告給各個領域的 AI 研究人員提供導航。這個報告有幾個特點,如下:

1、這是一個年報;

2、它所使用的所有數據都是公開的,且歡迎所有人提供新的數據;

3、This is just a beginning. Yoav 呼籲更多人加入,來共同改進 AI Index。

報告講了啥?

簡單來說,《AI Index》年報大致有兩塊:

1、數據章節:調查圖表,並簡要說明遺漏了哪些東西,以及附錄的獲取和處理數據的方法;

2、討論章節:前面的圖表 太冰冷,各位領域大牛(例如吳恩達)來場溫暖解讀。

數據章節

一、活動體量——該領域的「how much」

1、學術

AI Index從三個方面考量人工智慧研究的發展:論文數量、高校招生情況以及AI會議參會人數的變化。

(1)發表論文數量

史丹佛教授發佈首份AI Index報告,指引 AI工作者不再「flying blind」

可以看到,從 1996 年到現在,AI 相關的論文數量增長了近 9 倍!9倍是什麼概念呢?或許對比一下更有感覺——

史丹佛教授發佈首份AI Index報告,指引 AI工作者不再「flying blind」

對比從 1996 年到現在所有論文、CS 領域論文和 AI 領域論文,增長比例分別為 2 倍、6 倍和 9 倍。通過仔細地觀察圖標就會發現,CS 論文數量在 04 年到 09 年有一個很快速的增長,而 AI 領域論文數量也隨之開始急速增長,這說明 AI 的蓬勃發展是由 CS 其他領域的研究所驅動的。

(2)招生數量

限於數據的原因,AI Index只收集了史丹佛、伯克利、喬治亞大學、伊利諾伊大學香檳分校、華盛頓大學、卡內基‧梅隆大學的招生情況。

史丹佛教授發佈首份AI Index報告,指引 AI工作者不再「flying blind」

史丹佛大學從 1990 年開始招收 ML、AI 的學生,我們看到 ML 的招生人數在 2000 年前一直都非常少,單絲從 2006 年之後則開始迅速增長。

而招收學習 AI 的學生數在 90 年代經歷了一次漲幅之後跌落到了冰點。從 1996 年的冰點開始招生人數隻是緩慢增長,但是在2006年後招生人數也出現了迅猛增長,2017年的人數是 1996 年的 11 倍之多。(註:17 年下降是由於學校管理的問題)

史丹佛教授發佈首份AI Index報告,指引 AI工作者不再「flying blind」

對比一下在 AI 方向幾所高校的招生情況,可以看到伯克利在這方面似乎更有熱情一些,而其他幾所學校就稍微比較緩慢了一些。

史丹佛教授發佈首份AI Index報告,指引 AI工作者不再「flying blind」

在 ML 方面,史丹佛大學則較為活躍。另一個值得注意的是,CMU 從 12 年才開始有 ML 這門專業,卻發展迅速。

(3)參會人數

史丹佛教授發佈首份AI Index報告,指引 AI工作者不再「flying blind」

以上是在 2016 年參會人數超過一千人的大會。這種整體「碗底形」的數據表也說明人們的注意力逐漸由符號推理轉向了機器學習和深度學習,真所謂「三十年河東,三十年河西」。我們也知道今年的 NIPS 會議的參會人數高達 8000 多人。

史丹佛教授發佈首份AI Index報告,指引 AI工作者不再「flying blind」

這個則是在 2016 年參會人數小於一千人的小會。從這裡也可以看到儘管人們的注意力轉移了,但仍有一小群人在 AI 中穩步地推進符號推理方法的研究。總有一部分人的學術研究不是跟風的。

2、產業

(1)AI 相關的初創公司

史丹佛教授發佈首份AI Index報告,指引 AI工作者不再「flying blind」

在 21 世紀之前,AI 公司幾乎沒有。但是從 2000 年之後則迅速出現很多 AI 公司,尤其是在 2006 年之後,致力於發展 AI 系統的美國初創公司數量開始呈指數增長,2016 年的 AI 公司數量是 2000 年的 14 倍之多。

(2)AI 相關的基金

史丹佛教授發佈首份AI Index報告,指引 AI工作者不再「flying blind」

投向美國 AI 初創公司的資金從 2012 年之後才開始注意到人工智慧,並開始大量地投資。對比一下 2000 年,2016 年的總量是其 6 倍。

(3)職位空缺

以下數據主要來源於兩個網站 Indeed.com 和 Monster.com。

史丹佛教授發佈首份AI Index報告,指引 AI工作者不再「flying blind」

數據從 2013 年開始,我們可以看到在美國從 2013 年到現在要求有 AI 技能的工作增長了 4.5 倍。

史丹佛教授發佈首份AI Index報告,指引 AI工作者不再「flying blind」

不同國家的 AI 相關職位空缺增長情況也不一樣,可以看出加拿大和英國在這兩年增長非常迅速。不過雖然增長較快,但它們的絕對數量只有美國的 5% 和 27%。

史丹佛教授發佈首份AI Index報告,指引 AI工作者不再「flying blind」

在特定領域,可以看出有 ML 相關經驗的工作顯得更多,空缺量兩年時間增長了 近 10 K。而對深度學習有要求的工作在今年也成倍增長。

(4)機器人影響

史丹佛教授發佈首份AI Index報告,指引 AI工作者不再「flying blind」

北美和全球範圍內,工業機器人裝置的貨運數量在2009年之後增長了近200K。

史丹佛教授發佈首份AI Index報告,指引 AI工作者不再「flying blind」

北美和全球範圍內,工業機器人增長倍數。可以看出從 2009 年之後,工業機器人貨運數量急劇增長。

3、開源軟體——Github 項目統計

史丹佛教授發佈首份AI Index報告,指引 AI工作者不再「flying blind」

Github 上 tensorflowh(深度學習軟體包)和 Scikit-learn(機器學習軟體包)的 star 數(相當於喜歡或者收藏),深度學習的關注度似乎遠多於機器學習的關注度。

史丹佛教授發佈首份AI Index報告,指引 AI工作者不再「flying blind」

來張集體照,Tensorflow 簡直是「遙遙領先」。

4、公眾興趣——媒體報導情緒

史丹佛教授發佈首份AI Index報告,指引 AI工作者不再「flying blind」

包含「Artificial Intelligence」詞項的媒體文章數量:積極和消極。可以看出積極佔大部分,尤其是進入 2017 年以後。

二、技術表現——該領域的「how good」

1、視覺——物體檢測

史丹佛教授發佈首份AI Index報告,指引 AI工作者不再「flying blind」

大場景視覺識別挑戰(LSVRC)比賽中物體檢測的表現。可以看出,從 2010 年 28.5% 的誤差率迅速降低到 2017 年的 2.5%,甚至超過了人類的表現。

2、視覺——視覺問答

史丹佛教授發佈首份AI Index報告,指引 AI工作者不再「flying blind」

對一個圖片問題的開放式回答任務中 AI 系統的表現。嗯,離人類表現差的還遠。

3、自然語言處理——Parsing

史丹佛教授發佈首份AI Index報告,指引 AI工作者不再「flying blind」

AI 系統在檢測語句語法結構任務中的表現在近十年的時間裡似乎並沒有太多的改變。

4、機器翻譯

史丹佛教授發佈首份AI Index報告,指引 AI工作者不再「flying blind」

AI 系統在英-德之間新聞翻譯任務中的表現在 2015 年之後有一次大的提升。注意之所以會出現下降,是因為翻譯系統在不同的任務中會有不同的表現能力。

5、問答

史丹佛教授發佈首份AI Index報告,指引 AI工作者不再「flying blind」

AI 系統在從文件中給問題找答案任務中的表現也像翻譯系統一樣,在 2015 年有一次大的提升,但是隨後則較為緩慢。

6、語音識別

史丹佛教授發佈首份AI Index報告,指引 AI工作者不再「flying blind」

AI 系統在識別手機電話中語音任務中的表現在進入今年以後逐漸逼近甚至超越人類水平。

7、理論證明

史丹佛教授發佈首份AI Index報告,指引 AI工作者不再「flying blind」

自動定理證明的一大組定理證明問題的平均易處理性。(易處理性有下降是因為不同的 solver 可能只擅長特定的問題)

8、SAT Solving

史丹佛教授發佈首份AI Index報告,指引 AI工作者不再「flying blind」

在工業應用問題上 SAT(學術能力測驗)solver 解決問題的比率,從 2009 年已經能夠做好及格水平,但是近十年也並沒有較大的提升。

三、衍生測量——多方數據交叉比較

1、學術-工業

史丹佛教授發佈首份AI Index報告,指引 AI工作者不再「flying blind」

很明顯,數據顯示學術活動(論文發表和招生數量)驅動了工程的發展。在 2010 年,投資者開始注意到 AI 的發展,到 2013 年投資開始急劇增長。

2、AI 活力指數

史丹佛教授發佈首份AI Index報告,指引 AI工作者不再「flying blind」

AI 活力指數彙總了來自學術界和產業界的結果(論文出版,招生數量和投資),以量化 AI 作為一個領域的活力。為了計算 AI 活力指數,我們對以上三個因素求了平均。

這只是一個簡單的計算,Yoav 等人希望通過這個簡單的調查能夠引發人們對如何更準確地分析 AI 指數的指標產生興趣,並能夠探討出一個能夠經得住時間考驗的方案來。

四、朝向人類水平性能

把 AI 系統和人類對比,這幾乎是自然而然的事情。顯然在某些任務中,例如計算,電腦遠遠優於人類。但在處理複雜任務(例如問答、遊戲、醫學診斷等)時 AI 系統就比較難以評估了。

AI 系統往往是針對狹窄的背景設計的,所以它在某一個特定任務中可能會表現出卓越的性能;但是如果稍微地修改一下任務,AI 系統的性能可能就會大大降低。而人類則完全不同。

不過雖然拿人類和 AI 系統進行比較有點困難,但是在某些方面,這類比較還是非常有意思的。例如下面羅列的這些 milestones:

史丹佛教授發佈首份AI Index報告,指引 AI工作者不再「flying blind」

1980 年,黑白棋

在 20 世紀 80 年代,李開復和 Sanjoy Mahajan 開發了 BILL,這是一個用語玩「黑白棋」遊戲的貝葉斯學習系統。1989 年這個程序贏得了美國電腦玩家的全國錦標賽,並以 56-8 的成績擊敗了排名最高的美國選手 Brian Rose。在 1997 年,一個名為 Logistello 的程序在對陣黑白棋世界冠軍的比賽中六場全勝。

1995 年,跳棋

1952 年,亞瑟‧塞繆爾(Arthur Samuels)製作了一系列玩跳棋的程序,並通過自我學習進行改進。然而直到 1995 年,一個名為 Chinook 的跳棋程序才擊敗了世界冠軍。

1997 年,國際象棋

在 20 世紀 50 年代就有一些計算機科學家語言計算機將在 1967 年擊敗人類國際象棋冠軍。但直到 1997 年,IBM 的 DeepBlue 系統才擊敗了國際象棋冠軍加里‧卡斯帕羅夫(Gary Kasparov)。今天你可以在智慧型上運行的國際象棋與大師級的程序進行玩。

2011年,Jeopardy!

在 2011 年,IBM 的 Watson 超級電腦系統參加了熱門的智力競賽節目 Jeopardy!對抗前贏家 Brad Rutter 和 Ken Jennings。最終,Watson 贏得了 100 萬美元的第一名。

2015 年,Atari 遊戲

2015 年,Google DeepMind 的一個團隊使用強化學習系統來學習如何玩 49 個 Atari 遊戲。這個系統可以在大部分遊戲中達到人類級別的表現(例如突出重圍),儘管有些仍然顯得遙不可及(例如蒙特祖瑪的復仇)。

2016 年,ImageNet 中的對象檢測

在 2016 年 ImageNet 自動標註的誤差率從 2010 年的 28.5% 降到低於 3%,而人類的誤差則是 5%。

2016 年,圍棋

2016 年 3 月,Google DeepMind 團隊開發的 AlphaGo 系統擊敗了世界上最流弊的圍棋高手之一李世石,4-1。在 2017 年 3 月,DeepMind 發佈的 AlphaGo Master,又打敗世界排名第一的圍棋大師柯潔。在 2017 年 10 月份,《自然》期刊上發表了另一個新版本的 AlphaGo Zero,以 100-0 的比分完敗之前的 AlphaGo。

2017 年,皮膚癌分類

在 2017 年《Nature》上的一篇文章中,Esteva 等人描述了一個 AI 系統,他們用一組包含了 2094 中不同疾病的 129450 張臨床圖像的數據集訓練了這個系統,隨後將它與 21 位認證皮膚科專家的診斷性能進行比較,發現 AI 系統在對皮膚癌的分類上可以媲美於皮膚科專家。

2017 年,語音識別

2017 年,微軟和 IBM 分別實現了可以媲美於人類的語音識別能力。

2017 年,撲克

2017 年 1 月,來自 CMU 的一個名為 Libratus 的程序在一個有 12 萬長比賽的錦標賽中擊敗了四位頂級的人類玩家。

2017 年 2 月,來自 Alberta 大學的一個名為 DeepStack 程序在 3000+場遊戲中擊敗了 11 名專業選手。

2017 年,Ms.Pac – Man

微軟收購的深度學習團隊 Maluuba 開發了一個 AI 系統,在 Atari 2600 上學到了如何達到遊戲的最高分 999,900。

雷鋒網註:以上所有的數據都是公開的,報告中還提供了數據的具體收集方式。有興趣的朋友可以下載「AI Index」報告。

五、遺漏了什麼?

前面的內容覆蓋了很多,但很顯然並沒有包含 AI 的全部,這個報告還有很多有待改進的地方。

1、技術表現

這個報告有很多重要的技術領域並沒有覆蓋到,有些領域還沒有明確的標準化的基準(如對話系統、pllanning、機器人的連續控制)。在其他一些領域,則有可能是它們還沒有顯著的進步,例如常識推理,所以很難進行技術表現的評估。第三,有一些領域還沒來得及收集相關的數據(例如推薦系統、標準化測試)。

2、國際化

這份報告(的數據)目前主要還是以美國為中心,而我們知道中國在 AI 方面的研究和投資也是極為活躍的。之所以沒有覆蓋到中國,主要原因是 Yoav 等人還沒來得及拿到中國 AI 相關的數據。未來這一情況可能會得到改善。

3、多樣性和包容性

那些研究和開發人工智慧系統的人在塑造人工智慧對社會影響方面發揮著重要的作用。AI Index 報告中應該量化誰來參與到人工智慧的交流中,以及衡量誰有影響未來人工智慧研究和開發的權力。

4、政府和法人投資

本報告展示的風險投資數據僅僅關注美國,並且僅能代表人工智慧研發(R&D)投資總額的一小部分。政府和企業在 AI 研發上其實已經投入大量的資金,這些數據可能很難收集,要想進一步深入,可能需要一些高度協調的合作。

5、特定垂直領域的影響

報告還缺少 AI 在醫療保健、汽車、金融、教育等領域的影響的相關指標。這些領域可能是最重要也最難處理的,因為相關指標很難被識別和聚合,它們要求有對其領域有很深入瞭解的背景知識的人來做才好。所以 Yoav 等人也期待有這些領域的專家能夠與他們合作,共同完善報告的這部分內容。

此外,這份報告也沒有討論種族、性別等方面的調查。

6、社會影響

這份報告也沒有關於 AI 造成的社會風險有關的問題。在隨後的報告中,Yoav 等人希望能夠提供有助於 AI 安全性、AI 可預測性、AI 算法的公平性、AI 時代的隱私、AI 的道德影響以及其他主題的討論。

以上問題這麼多,主要原因還是:缺人、缺數據!所以 Yoav 等人迫切地希望有人能夠加入到他們,共同完善或者說改進 AI Index 這份報告,為 AI 社區的人提供 AI 發展準確、及時的直觀趨勢。

專家論壇

數據總是冰冷的且不完整的,它只能描繪過去,卻無法告訴人們現在和未來。AI Index 獨創性地在報告中加入一系列跨學術界、產業界、政府和媒體的 AI 專家的觀點,讓人們對 AI 的現在和未來有一個生動的認識。下面雷鋒網整理了其中 5 位專家的觀點,以饗讀者,感興趣的讀者可以查看報告原文

Barbara Grosz(哈佛大學)

史丹佛教授發佈首份AI Index報告,指引 AI工作者不再「flying blind」

Barbara Grosz 是哈佛大學工程與應用科學學院自然科學家

AI Index 的這份報告非常值得稱讚,它彌補了很多缺失。但是報告中還沒有覆蓋到人工智慧技術與人的交互的這方面。鑑於最近人們越來越重視開發能夠補充或者增強人的能力而不是複製人類的人工智慧技術,這一點還是尤其值得關注的。

例如 IJCAI-16 就是以「人類認知 AI」為主題,AAAI-18 以「人與 AI 的合作」為主題,最近幾年有見到許許多多關於 AI 與人的研討會和座談會。

這種 gap 反映在自然語言處理的部分,報告中提到了 parsing 、機器翻譯等,但是卻沒有提到對話系統或聊天機器人。parsing 和機器翻譯不需要考慮人的情感,但是對話系統和聊天機器人卻需要。這是很重要的一點。

正如 AI Index 報告所指出的那樣,只有當有很好的方法來衡量這些因素時才會把它們放到報告中。對考慮到人類因素的 AI 技術進行測量還真的是一個巨大的挑戰,但是這卻非常重要。

光考慮 AI 算法和系統的效率、計算能力不行,還要考慮它們對人類生活的影響。如果 AI Index 報告能夠促進對這些指標的衡量,那麼它將對 AI 領域做出非常大的貢獻,不論是對電腦工作者,還是整個社會。

此外,我也希望能夠看到未來 AI Index 報告能夠不僅調查人工智慧課程的入學情況,也希望能夠包括研究人工智慧道德問題的課程情況。隨著智慧系統日益遍及我們的日常生活,AI 的教學課程需要向學生傳達考慮道德的重要性。

AI Index 還需要考慮諸如有多少公司在設計 AI 系統時會考慮這個系統是否應該被設計出來,有多少 AI 系統設計者在他們的設計過程中會考慮他們設計出的系統是否會出現意想不到的結果並盡力去改善它們。

李開復(創新工場)

史丹佛教授發佈首份AI Index報告,指引 AI工作者不再「flying blind」

AI index 對人工智慧的討論做出了很大的努力。在其首份報告中有許多重要的統計數據可以用來瞭解 AI 的發展,不過主要是針對美國市場的。現在讓我填補一些中國在 AI 方面的狀況。

「數據從來都不嫌多。」(There’s no data like more data.)數據越多,AI 就越智能。那麼中國到底生成了多少數據呢?

中國擁有世界上最多的手機和網路用戶,是美國或者印度的大約三倍之多。可能很多人會認為中美之間的數據也是三倍這麼大,而事實是遠比這個大。在中國,人們使用手機支付是美國人的 50 倍;中國的糧食運輸量是美國的十倍;共享單車公司摩拜只花了 10 個月的時間就從一無所有到每天 2000 萬的訂單。

2000 萬輛自行車提交它們的 GPS 數據和其他傳感器訊息到伺服器上,每天創造了 20TB 的數據。同樣的,據報導,中國的汽車共享公司 DiDi 將其數據與一些試點城市的交通管制聯繫起來。所有這些互聯網連接的東西都將產生數據,這有助於使現有的產品和應用程序更加高效,也出現一些我們從來沒有想到過的應用程序。

中國的 AI 產品質量如何呢?很多人可能還記得中國在 15 年前除了模仿之外別無所有。但是現在聰明而又熱切的中國科技巨頭和企業家們已經被西方的創新所推動,甚至超過了海外的同行們。舉一個 AI 的例子,中國人臉識別創業公司 Face++最近在 3 個計算機視覺比賽中獲得了第一名,領先於來自 Google、Microsoft、Facebook 和 CMU 的團隊。

中國國務院宣佈了一個明確的計畫,到 2030 年要成為 AI 創新中心。

中國政府對技術發展持一個開放的態度。中國的環境也更有利於快速啟動和迭代。2017 年 7 月,中國國務院公佈了「下一代人工智慧發展規劃」,其目標非常明確,就是到 2030 年成為全球人工智慧創新中心。

該計畫有望推動人工智慧作為主要行業和省級政府的重中之重。如果你認為這只是一個大話,你可以看下中國過去在高鐵等一些項目中的政策,最後都得到了很好的執行。我們可以期待中國政府在人工智慧方面的政策也將走向類似的道路。

中國在 AI 領域具有前沿的科技、專業的實驗以及高速的發展,這些將使中國變成一個非常強大的 AI 大國。在這個 AI 時代,我預測中、美雙寡頭不僅是不可避免的,事實上它已經到了。

吳恩達(Coursera,Stanford)

史丹佛教授發佈首份AI Index報告,指引 AI工作者不再「flying blind」

人工智慧是新電力,正在悄然改變著諸多的行業。而 AI Index 則幫助我們當代人跟蹤並駕馭這種社會轉型,同時也將幫助後代回顧並理解 AI 的崛起。

此外,AI 現在是一個全球現象,AI Index 也提示我們每一個人,必須超越自己的國界,瞭解全球的進步。美國和中國享有最大的投資以及最快速的應用,加拿大和英國在這方面也做出了開創性的研究貢獻。

由於人工智慧改變了許多技術系統的基礎——從網絡搜索到自動駕駛,到客戶服務聊天機器人。這給許多國家提供了在某些應用領域跳躍發展的機會,制定有明智的人工智慧政策的國家將更加迅速地發展,而相反哪些政策模糊的國家將面臨落後的風險。

深度學習首先顛覆了語音識別,其次是計算機視覺。今天自然語言處理和機器人也正在經歷類似的革命。最近語音和視覺精度的提高也導致了使用語音(例如)或計算機視覺(如自動駕駛汽車)的應用呈現出蓬勃發展的現象。

今天自然語言處理的深度學習轉型也正在順利進行,這將導致相應的應用(如聊天機器人)的蓬勃發展。機器人技術的深度學習也獲得了巨大的推動力,這也將導致許多新的應用(如新的製造能力)。

Sebastian Thrun(史丹佛大學,Udacity)

史丹佛教授發佈首份AI Index報告,指引 AI工作者不再「flying blind」

Sebastian Thrun是 Google 無人車之父

人工智慧領域已經有了 60 多年的歷史,並且已經產生了重大的影響。例如,AI 是 Google 搜索算法、Amazon 網站設計、Netflix 電影推薦等的核心。但是,現在強大的計算能力和規模空前的數據相結合的出現漸漸成為了社會遊戲規則的改變者。

在過去的幾年裡,系統已經發展到了與高技能的人類相媲美,甚至超越的地步。DeepMind 的 AlphaGo 擊敗了世界上最好的圍棋大師。在我們自己的實驗室,我們發現 AI 系統可以比一些取得資格證書的皮膚科醫生更準確地診斷皮膚癌的圖像。此外,我也一直認為 Google 的自動駕駛汽車比我這樣的普通司機開得更好。還有創業公司 Cresta 現在已經證明,人工智慧系統與人類專家合作可以使在線銷售團隊的效率翻番。

我相信在不遠的將來,AI 將能夠使我們擺脫重複的工作。人工智慧系統將能夠在工作中觀看人類專家,並逐漸掌握我們再日常工作中所應具備的技能。當這種情況發生時,機器將會進行越來越多的重複性工作,而我們人類則將有更多的時間進行創造性工作。

這樣的革命在歷史上也有類似情況。在蒸汽機發明之前,我們大部分都是農民,大多數人都是通過自己的體力(而不是腦力)來定義的,不斷地在耕種上進行高度重複的工作。

而現在機器已經把農民變成了超人,根據 FarmersFeedUS.org 的數據,一個美國農民可以養活 155 個人。結果就是美國只有不到 2% 的人口在從事農業,這使我們中 98% 的人能夠去做別的工作,而其中 75% 的美國勞動力都在辦公室中。我們成為律師、會計師、醫生、軟體工程師等等。

當然,我們的大部分工作現在也仍然是高度重複性的。可以想像,今天的 AI 技術可以學習那些重複性工作的模式,並幫助我們更快地完成工作。最終在 AI 協助下,無論是生活還是對世界的認知,我們可能將變成真正的「超人」。

這是好還是壞呢?我認為,當未來的人類回顧歷史時,將會認為這是人類的巨大進步。當我們許多人不再從事重複性的體力勞動時,我們變得更有教育,變得更具創造力。隨著這場新的革命,我們將進入一個前所未有的人類創造力的時代。

當然這也給人類帶來重負。據估計,如果自動駕駛出租車成為了日常交通的主要方式,那麼人類有 1/9 的就業機會將面臨危險。為了適應這些變化,我們人類必須成為終身學習者,我們必須掌握新的技能,學習新的技術。從整個社會的角度來考慮,我們需要找到新的方式來幫助所有人來適應這些變化。

這也是為什麼這份報告(AI Index)很重要的原因。它認真地研究了人工智慧的最新進展,並記錄其對社會的影響。我希望這份報告能夠為公眾對 AI 的討論有建設性的貢獻。如果我們掌握了 AI 所帶來的挑戰,如果我們能夠為這些挑戰做好準備,而且如果我們能領先做好的話,那麼未來將是驚人的。這對我們所有人都是如此。

Michael Wooldridge(牛津大學)

史丹佛教授發佈首份AI Index報告,指引 AI工作者不再「flying blind」

Michael Wooldridge是牛津大學計算機科學系主任以及人工智慧國際聯合會議和歐洲人工智慧協會主席

這份報告用一系列的證據表明,人工智慧技術在 AI 早期的一些核心問題(遊戲、機器翻譯、定理證明和問答等)方面正在取得穩步地進展;在許多方面,人工智慧已經達到甚至超過人類的專業水平。報告還提供了非常明確的證據說明,人工智慧正在吸引學生和工業街的注意力,人工智慧課程招生人數激增,人工智慧公司大幅增長。

顯然,目前是人工智慧的一個泡沫期。這個報告促使我想到一些問題:這個泡沫最終是會破裂(參見 1996-2001 年的網路泡沫化)還是會緩慢地縮減?以及什麼時候發生?當發生之後會留下什麼?我最擔心的就是目前正在目睹的大規模投資之後會出現幻滅,我們可能會看到另一個 AI 寒冬。現在 AI 行業內有大量的行業騙子和蛇油推銷員(snake oil salesman,通過誇大項目具有神奇的能力來銷售自己的產品的人),他們所銷售的是他們期望 AI 做到的,卻不是當前 AI 能做到的。這可能會導致人們對 AI 變得越來越沮喪。

不過,雖然我認為未來數年內 AI 的泡沫會縮減是不可避免的,但我認為有理由期望一個溫和的縮減,而不是一個劇烈的破裂。主要原因是,AI Index 清楚地表明,AI 正在履行人們期望的東西,在各種任務中,AI 系統正在穩步地(有時是快速地)提高性能,而且這些研究在許多不同的應用領域都取得了巨大的成功。換句話說,我認為在當前 AI 泡沫下有實質的東西——現在各大公司都明白如何高效地使用 AI 技術。因為這些,所以我不相信我們會再次看到 AI 寒冬。(所以我期待閱讀 2027 年的 AI Index 報告,看這個語言是如何被消除的。)

如何參與

需要再次重點強調的是,這份 AI Index 還非常的不完善,而另一方面,這是一個開放的報告,任何人都可以加入社區共同促進 AI Index 的完善和發展。那麼如何參與呢?

很多種方法——

1、問題回饋看完 AI Index 2017 報告後,你有啥想法,通過郵件或者 twitter 發個反饋。

2、開放你的數據。如果你或者你的組織有能力共享相關數據,那麼就聯繫他們吧。

3、提供領域知識。未來 AI Index 報告會量化 AI 在具體垂直行業的影響,例如醫療保健、交通運輸、農業等。如果你對你所在的行業對 AI 瞭解很充分,那麼去吧,卡比丘!

4、指出錯誤。AI Index 的所有數據以及數據使用方法都是公開的,所以你可以從 step 1 到 the end 檢驗它的每一步。

5、幫忙收集數據。顯然,關於 AI 的數據千千萬,光靠 AI Index 小組的成員遠遠不能顧得下,有興趣不妨幫忙把手邊的數據收集整理一下,打包給他們。

6、一起國際化。從報告數據來源也可以看出,目前大多數數據都是來源於美國,關於中國的數據完全沒有,那麼難道大家不想在報告中看到中國的進展嗎?

However, it is just a beginning!

(本文經合作夥伴 雷鋒網 授權轉載,並同意 TechOrange 編寫導讀與修訂標題,原文標題為 〈 斯坦福教授發佈首份AI Index報告,指引 AI工作者不再「flying blind」 〉。)

更多的 AI 相關文章,這邊推薦給你

為何 Tesla 自己開發 AI 晶片,難道合作夥伴 NVIDIA 真的不給力嗎?
PTT 之神剖析台灣 AI 契機:台灣有實力成為全球人工智慧島,就缺這個重點元素
【AI 入門懶人包】從 0 開始學 AI,線上課程、精選實例先儲存連結吧!