
虎嗅注:本文來自WSJ.com
百度公司最近宣稱在 ImageNet(圖像識別最大數據庫)的圖像識別人工智能基準測試中擊敗了谷歌和微軟。但是周二(6 月 2 日),ImageNet 宣稱百度在測試中存在違規行為,百度已經為自己「誤導公眾」而道歉。
百度的行為凸顯了人工智能領域競爭中存在的高度風險。目前,全球頂級科技公司都在爭相研發人工智能技術,包括允許計算機識別圖像、控制機器人、理解口語以及執行其他任務等。而積累起巨大計算資源的互聯網巨頭承受著巨大壓力,它們需要竭力維持自己的領先地位,無論是聲望還是潛在商業利益方面。
除了百度、谷歌、微軟外,蘋果、Facebook、IBM 等科技巨頭也都在重金招募大量人工智能研究人員,並且各具雄心。
5 月份,百度宣稱其在 ImageNet 測試中取得了全球最好結果,其圖像識別錯誤率僅為 4.58%,而微軟是 4.94%,谷歌為 4.8%。在這種測試中,人類辨識 ImageNet 照片的錯誤率為 5% 左右。
可是,週二,ImageNet 的計算機科學家發表聲明指出,百度在測試中存在違規行為,百度採用了密集測試的方法以提高成績。按照規定,ImageNet 只允許參與者每周向測試服務器提交 2 次測試結果。可是在 3 月份的 5 天時間內,百度卻提交了 40 次結果。ImageNet 表示,百度還使用了 30 個不同的帳號,在過去 6 個月中提交了約 200 次測試結果。
在 ImageNet 測試中,人工智能需要掃描擁有 100 多萬張圖片的數據庫,然後將它們分為 1000 個不同類別。大多數研究人員通常使用數據庫中的部分圖片,對軟體進行圖像識別測試。而通過密集測試,百度工程師可以通過調整他們的軟體熟悉這些圖片的信息,從而獲得優勢。
人工智能公司 Clarifai 首席執行官、ImageNet 競賽上屆贏家馬休·澤勒爾(Matthew Zeiler)表示:「這種做法是非常糟糕的,這也是為何要限制參賽者向獨立服務器提交測試結果的原因。如果你知道了測試內容,你就可以調整參數模型,從而獲得更好的測試結果。」
ImageNet 已經要求百度在今後一年停止遞交 ImageNet 測試結果。百度拒絕回答相關問題,但在 ImageNet 網站發表聲明稱,百度科學家吳韌已經為他所謂的「失誤」道歉。他寫道:「我們已經在研究中添加了註釋……我們將繼續提供相關更新。」
《TO》小結:這情節有些像之前防毒軟體事件《【專訪】品牌能否從地獄再爬上天堂?中國奇虎 360 喊冤被評測機構捅刀》啊。
(本文轉載自合作夥伴《虎嗅網》;未經授權,不得轉載)