【我們為什麼挑選這篇文章】AI 發展固然飛躍,不過有許多細部的「道德」仍有待加強。Google Photos 的自動識別 AI 將黑人視為「猩猩」即是其中一例,儘管我們知道這不是 Google 本意,卻也希望能避免掉這種情形。目前 Google 尚未找到完美的解決方法,只好先把「猩猩」這個詞彙刪除。(責任編輯:陳君毅)

2015 年,一名黑人軟件開發人員在 Twitter 上說,Google 的照片服務(Google Photos)把他和一個黑人朋友的照片打上了「大猩猩」的標籤,這讓 Google 感到非常尷尬。Google 宣稱自己「感到震驚和由衷的歉意」。一名相關的工程師表示,Googele 正在「研究更長期的解決方案」。

Google 避免 AI 歧視的方法:刪除「大猩猩」這個詞彙

兩年多之後,Google 給出的其中一項修復措施,就是將大猩猩和其他靈長類動物的標籤從該服務的詞庫中刪除。這一尷尬的變通方案表明,Google 和其他科技公司在推進圖像識別技術方面仍舊面臨著諸多困難,儘管這些公司希望能夠在自動駕駛汽車、個人助理和其他產品上使用這些技術。

《Wired》雜誌用 4 萬張圖片對 Google 照片服務進行了測試,這些照片中有很多動物。Google 照片在尋找包括熊貓和貴賓犬在內的許多動物上表現得非常棒。但當使用「大猩猩」、「黑猩猩」和「猴子」等詞進行搜索時,Google 照片反饋稱「沒有結果」。

作為一款移動應用和網站,Google Photos 為 5 億用戶提供了管理和備份個人照片的地方。它使用機器學習技術,自動將照片進行分組,比如湖泊或拿鐵。同樣,用戶也可以利用該技術對他們的照片進行搜索。

在《Wired》雜誌的測試中,Google Photos 確實識別出了一些靈長類動物。使用「狒狒」、「長臂猿」、「狨猴」和「猩猩」等詞進行搜索,結果都還不錯。只要搜索時使用術語而不是使用 M 開頭(monkey)的詞語,就可以找到卷尾猴和疣猴。

在另一項測試中,《Wired》上傳了 20 張黑猩猩和大猩猩的照片,這些黑猩猩和大猩猩來自非營利組織「黑猩猩天堂」和「黛安· 福西研究所(Diane Fossey Institute)」。有些猩猩可以用使用「森林」、「叢林」或「動物園」等關鍵詞來搜索到,但事實證明,其餘的都很難被發現。

結論是:在 Google Photos 中,狒狒是狒狒,但猴子不是猴子。大猩猩和黑猩猩是不可搜尋的存在。

在第三次測試中,《Wired》雜誌上傳了一組 1 萬多張用於面部識別研究的圖片。

用「非洲裔美國人」這個詞進行搜索,最後只出現了一幅羚羊的畫面。輸入「黑人男性」、「黑人女性」或「黑人」,Google 的系統會返回黑白圖像,按照性別正確排序,但不被種族過濾。對於膚色較深的人來說,可以使用「非洲式(afro)」和「非洲人(African)」等詞進行搜索,儘管結果好壞參半,並不那麼準確。

Google 的一位發言人證實,在 2015 年的事件發生後,「大猩猩」就從搜索和圖片標籤中刪除了,直到今天「猩猩」、「黑猩猩」和「猴子」等標籤仍在屏蔽中。該發言人在電子郵件中寫道:「圖像標籤技術還處於早期階段,但不幸的是,它還遠遠不夠完美。」他強調了 Google Photos 的一個功能,即允許用戶報告錯誤。

Google 對大猩猩圖片的謹慎處理,說明了現有的機器學習技術上的一個不足之處。有了足夠的數據和計算能力,軟件就可以被訓練,可以用來對圖像進行分類,或者在較高的精確度下對語音進行轉錄。但它無法輕易超越這種從訓練中得出的經驗。即使是最優秀的算法,也缺乏像人類那樣運用常識或抽象概念的能力,來完善它們對世界的詮釋。

因此,機器學習工程師在現實世界中部署他們的成果時,必須對他們的訓練數據中沒有發現的「邊緣案例」保持警惕。維吉尼亞大學教授維恩特·奧達尼斯·羅梅恩(Vicente ord ez rom n)說:「你的系統一旦開始上線運行,你就很難再對它進行建模」。去年,他參與了一項研究,該研究表明,應用於圖像的機器學習算法可以識別並放大人們對不同性別之間的偏見

Google Photos 用戶上傳的照片是在各種不完美的條件下拍攝的。考慮到數據庫中的圖片數量,將一種類型的「類人猿」誤認成另一種類型的可能性極小。

Google 母公司 Alphabet 和更廣泛的科技行業面臨著更大的風險,比如應用在自動駕駛汽車上。羅曼(Román)和他的同事、軟件可靠性專家拜沙希·雷(Baishakhi Ray)一起,正在探索如何限制視覺系統在自動駕駛汽車等場景中可能的誤判行為。雷說,這方面已經取得了一些進展,但目前還不清楚如何能夠很好地控制這些系統的局限性。「我們仍然不能非常具體地知道這些機器學習模型正在學習什麼,」她說。

部分 Google AI 有識別黑猩猩的「權利」

Google 的一些機器學習系統被允許在公開場合使用大猩猩照片進行檢測。該公司的雲計算部門為企業提供了一項名為雲視覺(Cloud Vision) API 的服務來構建他們自己的項目。當《Wired》雜誌用大猩猩和黑猩猩的照片對在線演示進行測試時,它同時識別出了這兩張照片。

例如,一隻成年大猩猩抱著雙胞胎寶寶的照片被 Google 的雲視覺服務貼上了「西部大猩猩」的標籤,其信心指數為 94%。系統會在相關的標籤上返回一個最佳猜測列表。「哺乳動物」和「靈長類動物」的得分也達到了 90% 甚至更多。

Google 向企業提供的雲計算圖像識別服務可以自由地稱大猩猩為大猩猩。

Google 向企業提供的雲計算圖像識別服務可以自由地稱大猩猩為大猩猩。

Google 的 Assistant 也可以自由地將大猩猩稱為「大猩猩」。在安卓手機上,Google Assistant可以被召喚去嘗試解釋手機屏幕上的內容。當被要求識別「一隻成年大猩猩抱著雙胞胎寶寶」的照片時,Google Assistant 給出的建議是「山地大猩猩」。

但是,「Google Lnes」,被標榜為展示該公司「計算機視覺上的進步」的應用,在去年 10 月添加到了 Google Photos 上。當被要求識別同一幅圖像時,它回應道:「嗯 …… 還沒看清楚。」

——

(本文經合作夥伴 36kr 授權轉載,並同意 TechOrange 編寫導讀與修訂標題,原文標題為〈谷歌AI 將黑人識別成“大猩猩”兩年後:就算能識別,也不敢識別了〉。)

延伸閱讀

看不見的玻璃天花板:當科技承襲人類的性別偏見,壓迫和歧視該如何消除?
【政府做不到的交給科技】抵擋白人至上主義!Google 撤銷歧視網站,Facebook、Youtube 跟進
【醫療史上最大突破】殺死 99% 愛滋病毒的抗體問世,對患者的歧視是否也能一起消失?