AI 把集中營大門標記成「叢林健身房」惹議!哪些原因造成演算法出現偏見?

圖像辨識

TechOrange 編輯部推薦好書:《AI 科學家李飛飛的視界之旅
Flickr 在 2015 年將一名 56 歲黑人男子的黑白肖像照,自動標註成「猿猴」。史丹佛大學李飛飛博士回憶這起爭議事件,原本圖像分類成功故事,忽然變得有點一言難盡。她指出,科技行業的組成不夠多元、缺乏代表性,使得演算法在無意之間出現了偏見。

文 / 李飛飛,譯者 / 廖月娟、林俊宏

「猿猴」?我的老天啊。

這是 Flickr(隸屬於 Yahoo 的圖片託管服務)在 2015 年 5 月自動生成的標注,但標注的是 56 歲黑人男子威廉的黑白肖像照。民眾之間迅速掀起一場義憤,但這還只是 Flickr 新技術一連串錯誤的開端,像是後續曾把一張達浩(Dachau)集中營大門的照片標成「叢林健身房」,也曾再一次把人標成「猿猴」,只不過這次是一名臉上塗著彩色粉末的白人女性。

出錯的不只有 Yahoo;時至六月,Google 的 Google 相簿也惹出類似的爭議,把兩位黑人青少年標成「大猩猩」。短短幾週,原本殆無疑義的圖像分類成功故事,忽然變得有點一言難盡。

就算是我們這些沒在惹議公司上班的人,也很難不覺得有點愧疚。那些錯誤絕非出於惡意,但這麼說實在算不上安慰,因為如此一來,可見問題更令人不安:錯誤起因包括了資料集不夠多樣化(包括 ImageNet 在內),演算法並未經過充分測試,以及決策過程值得質疑。如果網際網路上的日常生活景象主要就是白人、西方人、還通常為男性,我們得到的技術也就很難用來了解其他類型的人。

演算法在無意間出現了偏見

這無可避免地導致記者兼評論員克拉克(Jack Clark)所謂 AI「男山男海」(Sea of Dudes)的問題:科技行業的組成不夠多元、缺乏代表性,使得演算法在無意之間出現了偏見,只要遇上非白人、非男性使用者,就表現不佳。

克拉克的文章於 2016 年發表在《彭博商業周刊》,後續也有愈來愈多人加入對話,共同討論 AI 如何一念為善(支持殘疾人士、追蹤森林遭到砍伐摧毀的情形,以多種新的方式保護人類生命),但也可能一念為惡。

我回想起當初還在辛苦打造 ImageNet 的那些年,就算是當時那些最具創意、即興揮灑的我們,基本上也對這樣的問題一無所知。十年前,在 Google 與維基百科的組織下,關於這個世界的內容爆炸般成長,似乎打開了一扇窗,讓人可以望見人類生活最真實的面貌,而不只是像電視或報紙那些傳統媒體狹隘的匆匆一瞥。

當然,在某種程度上,Google 與維基百科確實達到了這樣的效果。然而,雖然這樣呈現的面貌極其生動、我們也對此深懷期許,但這樣看到的景象與真正完整的全貌卻還有很大的距離。

這是個我們早就該面對的問題,但光是像這樣的對話,還不足以讓我心裡的工程師覺得滿意。雖然當中的問題顯然有一大部分在於資料集不夠平衡,但也還有其他無數因素得加以考慮。演算法的模型呢?受到這些資料影響的演算法當中,是否還隱藏著尚未發現的架構弱點?用來輔助訓練過程的學習技巧,會不會也有問題?目前看來,不僅問題的數量比答案更多,比例還愈來愈不平衡。

如果你每月只有看一本書的時間,讓《編輯推薦好書》電子報幫你找到必讀的那一本!

感謝訂閱!隨時注意信箱的最新資訊

「AI4ALL」讓更多女性參與 AI 研究

這些問題也沉甸甸地壓在魯薩科夫絲基的心頭上。在這個男性占絕大多數的領域裡,我們兩個身為相對少數的女性,多年來可說是惺惺相惜,對於女性做 AI 研究這件事,種種不愉快的體驗也極為相似。等到 2010 年代中期,她實在覺得受夠了,決定要不做點什麼,要不就徹底離開學術界。她最後選擇了前者,而我們也決定攜手合作。

我們意識到,代表性不足的問題常常是經過多年的醞釀,只是我們在過程中一直沒有感受到;因此我們決定精挑細選一批九年級和十年級女孩,為她們開設史丹佛人工智能實驗室課程。這個為期兩週的 AI 速成班緊湊扎實、絕不輕鬆,但也向所有在場的人證明,雖然歷史上女性似乎被排除在這個領域之外,但其實只要投入少到讓人意外的資源,就足以讓她們相信自己也可以。

事實證明,這個想法大受歡迎,如同滾雪球一般發展成一個全國型的非營利組織,擴展到北美各個校園,也不斷擴大其使命。很快地,我們就開始將類似課程提供給其他邊緣群體,納入了有色人種、經濟弱勢等等。

過了短短幾年,這項計畫正式命名為「AI4ALL」,甚至還吸引到一些資金投入,其中一輪改變一切的投資,投資者就包括了梅琳達.蓋茲(Melinda French Gates)的樞紐創投(Pivotal Ventures)與輝達創辦人黃仁勳。整個過程可能需要花上好幾個世代才能完成,目前只能說是跨出了一小步,但它就是一個開始。

而且,看著這整個產業在追逐 AI 未來的時候常常是恣意妄為而缺乏省思,現在這個發展也能稍稍令人感到寬慰。

◆ 推薦閱讀:

你真的沒必要一直玩生成式 AI——生成圖片的碳排最高,或許少玩一點吧?

ChatGPT 甩鍋工作給人類!它怎麼可以比我懶惰——小技巧教你對付發懶的 AI

AI 是吃電怪獸也能幫省電?AI 的未來會變得更節能嗎?

購書連結:《AI 科學家李飛飛的視界之旅

*本文書摘內容出自《AI 科學家李飛飛的視界之旅》,由 天下文化 授權轉載,並同意 TechOrange 編寫導讀與修訂標題。圖片來源:shutterstock

(責任編輯:陳可錞)

立即下載《2024 趨勢觀察報告》