【為什麼我們要挑選這篇文章】2017 年看到科技公司卯起來開發語音、表情辨識的AI 技術,以前AI 只是讓「辨識」的能力優化,現在AI技術開始拓展到「理解」層次,甚至AI 在某些領域的閱讀理解比人類更進步,人類社會本來的分工階層會怎樣被顛覆呢?(責任編輯:鄒昀倢)

提起閱讀理解這四個字,你會想到什麼?

被四六級、雅思、托福支配的恐懼?英語試卷上連原作者都搞不懂的選擇題?

我們以前都以為,只有人類擁有「閱讀理解」詮釋的能力

不管哪種答案,肯定都逃不出一個規律:進行閱讀理解這項「有益身心運動」的主體,必然是跟你我一樣的人類。

畢竟嘛,這東西需要閱讀一大段文字,然後理解了意義之後再做題目,堪稱一場英語考試中最複雜最費腦筋,也最考驗綜合能力的一個環節。所以你的英語老師一定說過這樣一句話:得閱讀理解者得天下。

AI 連閱讀能力都比人類好,我們還拿啥混口飯吃?

但是,我如果告訴你今天得這個天下的,已經不再是人類而是AI了,你會怎麼想?也許此前我們想像過AI可以完成單詞聽寫、句子翻譯甚至寫作,但可能很多人可能都沒有想到,AI做閱讀理解現在也能甩人類幾條街。

可事實就是這樣,1月11日,斯坦福大學著名的機器閱讀理解賽事SQuAD刷新了全球排名,阿里巴巴憑藉82.440的精准率打破了世界紀錄,超越了人類82.304的平均得分。

當然了,AI是不會去跟你比托福刷分的,這件事的背後,腦洞有點大哦……

什麼是機器閱讀理解?

機器閱讀理解,雖然看起來只是讓AI上陣來一場考試。但是卻是自然語言處理技術中,繼語音判斷、語義理解之後最大的挑戰:讓智能體理解全文語境。

而斯坦福大學發起的SQuAD挑戰賽,則是業內公認的機器閱讀理解最高水平賽事。

SQuAD挑戰賽的基本規則,是通過眾包的方式構建一個包含10萬個問題左右的大規模數據集,並給出來源於維基百科長度大約在幾百個單詞左右的文章。參賽者提交的AI模型在閱讀完數據集中的一篇短文之後,回答若干個基於文章內容的問題,答案與標準答案進行比對,最終得出成績。

由於閱讀理解這項「智能」調整,需要運用到大量邏輯、細節和結構分析能力,並且直接作用於現實中的文本資料,所以實際價值很大。

比如說,我們首先要面對的問題就是,假如AI已經比人類平均水平更擅長於對文本中的精准信息進行理解和回答,會帶給我們什麼呢?

當AI的「閱讀理解」得分超越人類,意味著?

舉個例子或許可以很簡單地理解這個問題:英語考試上,當AI可以翻譯單詞的時候,我們一點都不驚奇;但AI可以聽寫整句話的時候,我們會感嘆技術進步了;當AI自己做閱讀理解的時候,我們大概會想,還要我考這個試幹什麼?

這裡面的差別,在於處理閱讀理解相關問題時,AI不只是要運算和記錄,而是要主動去分析和理解。所以閱讀理解問題一直被人當成是NLP的標誌性臨界點。但這個點被AI破解,直接意味著原本很多必須由人類才能完成的工作,已經能夠被AI接管。

因為閱讀理解問題,不只是要處理語音和簡單的語義,而是要理解和關注詞彙、語句、篇章結構、思維邏輯、輔助語句和關鍵句等等元素構成的複雜組織網絡。

機器閱讀理解達標,最直接的產業影響是大多數今天還必須由人工完成的規則、對話、服務信息類的相關工作,都可以被AI所取代。比如說客服、訊息管理和推薦類的工作,都可以考慮用不眠不休、高運算速度的機器來取代。

AI 閱讀技術提升,第一個會被影響的是「客服」行業

或許我們都注意到了這樣一個問題:今天的互聯網世界,文本內容變得越來越多,各種各樣的信息爆炸而來。太多你知道的、你不知道的、你以為自己知道的卻實際不知道的事情呼嘯而過。甚至你雙11想要剁個手,都有各種各樣的遊戲規則等著你。自己讀吧,太累太痛苦還沒時間,問客服吧,很可能出錯還很慢,簡直是薛定諤式問題。

這裡或許就可以用AI閱讀理解來解決了。比如客戶對某個電商促銷規則有疑問,就可以直接向AI提問,而AI就可以把這個問題當做閱讀理解來進行解決方案回饋。

AI的閱讀理解能力,將在如何向客戶提供非模板式的智慧客服服務中發揮作用。而當AI在這些能力上超越人工,那麼AI客服的利用價值將可能快速提升。換句話說,AI客服終於可以不那麼機械化了。

由此不難看出,這種關鍵能力的突破,對大量強調與普通消費者交互的產業線益處最多。

推而廣之,AI閱讀能力也是文娛領域進行內容尋找和推薦的有效方式,比如閱讀用戶提出的複雜需求,進行精準推薦;與IoT產品相結合,給出對用戶大段語言的回饋,乃至對話互動,都必須以機器理解能力為依托。

AI 理解力的提升,象徵未來技術的進步幅度可能加廣、加大

除了知道AI可以充當更好的客服之外,究竟我們為什麼應該關注AI閱讀理解這件事?或許關鍵,是我們應該知道理解力在目前AI世界中的重要程度和期待指數。

AI作為一種從計算機科學下的分支,一個智能體先天具備的是運算能力,而希望進行仿人類智慧的智能模擬,第二步就是模仿人類的感知。今天我們看到的機器視覺、語音識別、語義理解,都是在做這件事。而第三步,就是讓AI產生理解力。

顯然,識別有著龐大應用場景,並會在接下來很長一段時間內佔據主流。但是AI的理解能力是大多數識別能力的進化,假如單純識別出卻無法產生輸出,那麼AI無非只是更靈活的傳感器而已。

從這個邏輯上看,閱讀理解對於AI來說絕不僅僅是個測試,或者商業應用的技術加持,更重要的是開啟AI紀元理解力的加速器。

更廣闊的意義在於,當我們不再考慮AI是否能理解人類文本和語言,那麼DeepNLP將可能達成,人機交互的範圍將級擴大。AI可以開始捕捉人類的邏輯。

可能那還很遠,也可能很近,但機器理解力讓我們在未來面前不再是個孩子,這應該是毫無疑問的。

(本文經合作夥伴虎嗅網授權轉載,並同意 TechOrange 編寫導讀與修訂標題,原文標題為 〈親愛的,你連閱讀理解都做不過AI了 〉,圖片來源:charlywkarl, CC licensed)

延伸閱讀

深度學習專家 Yann LeCun:全球首位機械公民 Sophia 是場騙局,根本 BullShxt!
總結 2017 年 Google Brain 成果:機器學習的各種應用、開源都在這
科技部長陳良基:台灣教授只活在國際會議中,沒人創業技術再強也沒用