電腦演算法就是公平公正第三方?小心,它其實比人腦還更有偏見

「我們正監視著你。」—這是芝加哥警察局給「熱名單(Heat List)」上的 400 多人的警告。這張名單上的人都是芝加哥警察用「預測演算法」所推算出的最可能犯罪人口。

根據《芝加哥論壇報》(Chicago Tribune)所敘述,這個演算法的機制乃是蒐集「他或她的熟人的前科、他們自己的前科,以及以上任何相關人物曾中彈的紀錄。」

這樣的電腦演算法想當然引起許多令人不快的疑問。名單上有誰?會被列在名單上的原因又是為何?人種、性別、教育程度與其他個人因素會不會都被列入考量?

這樣的演算法會引起關注有很多原因,但是帶來的結果有好也有壞。人類都有偏見,所以我們會把偏見寫進機器裡,接著這些偏見會被放大並被自動執行。這並不是全然的壞(或好),但這觸發了一個問題:

當越來越多「個人分析」可以預測種族、宗教、性別、年紀、性向、健康狀況與其他更多細節,我們應該怎麼做?

我跟你打賭,就算大部分的讀者認同演算法的背後動機,他們對於芝加哥警察局的熱名單還是會感到有點不安。為了要更負責任的去使用機器學習與公共數據,我們需要去討論我們該教機器些 什麼 ,以及我們該 如何 使用機器所產出的訊息。

  • 我們該教機器什麼?

多數的人對於人種、宗教與性別會下意識的分類,但若要他們更精準的去為其下定義,他們很快的就會發現他們很難確認。人類無法客觀認同已被假定的人。

因此,種族歧視的定義隨著時間逐漸改變,例如:義大利人在南美一度被視為黑人,所以某人在這個時候被歸類為某個族群,十年後可能又會被歸類為另一個族群。也因此無法精準定義像是「種族」之類的概念是個人分析的風險之一。

使用任何設計來預測、控制與展示種族類別的程式,其目的都是用於內部處理與人類消費,而機器學習則是達成此目的的最有效的方式,因為機器學習程式的學習內容是來自人類所提供的案例,而不是清楚的規則與啟發式教學。

也就是說,程式設計師依據所謂的一般美國人,寫出了一個可以做出完美種族預測的演算法,此演算法叫做「常識測試」,而其產出的結果與其他觀點都不同。很多在巴西被認為是白人的巴西人在美國會被認為是黑人。 電腦演算法會採用其創造者的偏見,而這些偏見會與其他人的偏見有所衝突

結果就是,機器學習程式分類種族的方式會與其創造者相同,但不一定與那些受測者的自我認同相同,或是與程式的使用者所認知的種族相同。這個在行銷與社會科學的研究上可能相對沒問題,但對芝加哥的熱名單、「禁飛名單」與其他公共安全應用來說,偏見與誤解可能會有嚴重的衍生結果。

  • 我們該如何使用數據?

任何個人分析的演算法都會犯錯;每個人都是複雜的,所以很難被分類到清楚數序的族群裡。不過,當收集到很多個人預測時,演算法就可以有對人群更好的了解,也能幫助我們辨識出差異,讓我們可以做出更好的決定,讓社會更好。

所以,如果說傳統上去敲潛在罪犯的家門是錯的,那麼我們有什麼替代方案呢?

有了芝加哥警察局的演算法,其中一個替代方案就是去用高風險人口與活動的地點去作出「熱地圖(Heat Map)」。很多警察管轄區,例如:洛杉磯、亞特蘭大、聖塔克魯茲等等,都已經採用 PredPol 的預測監督工具,讓警局可以在不使用任何個人數據的狀況下,在對的時間於高犯罪區域增加警力。這個工具嚴格監控種類、地點與犯罪時間。

但這是不是用另一種形式的歧視來做罪犯特徵分析呢?會不會警察在熱地圖的區域內不斷逗留,且開出更多罰單呢?如果我只能負擔得起經濟弱勢的住房,我會不會比住在富人區的人更常被警方盤查呢?鎖定目標且又可預測的警力布局會不會造成犯罪勢力轉移到警方無防備的地區,導致犯罪區域擴大化?

儘管有很多疑慮,但也不可諱言這樣的科技還是會帶來許多好處,當警力策略性分佈並與社區合作時,就有機會降低犯罪並為居民創造出更好的機會。演算法有機會比人類分析來得更少歧視,在安裝了 PredPol 的城市裡,系統回報了高達二位數的犯罪下降率(芝加哥警局尚未公布任何熱名單的成效數據)。

  • 無法逃避談論的禁忌

偏見並不是個讓大家喜歡的話題,但在機器學習的領域上,這卻是絕對不能避免的討論主題。

為了避面擴大刻板印象或是違反個人權力,當偏見運用在每種辨識並分類人群的機器學習演算法時,我們必須討論關於偏見的話題。輸入這類演算法的資料透明性與如何使用演算法的輸出結果,可能會是最重要的因素;像這類的道德考量已經被學術團體視為重要問題:他們已經做出新的課程,而且舉辦像是 FAT-ML 之類的會議來進行相關主題的論文發表與討論。

我們也不難想像如果有人濫用這種能力,會產生怎樣的狀況:假若是在 1940 到 1950 年代晚期,Joe McCarthy 參議員可以使用個人分析來追殺女巫呢?若是在今日,有反同志或反變性人相關法律的國家可以使用這個科技來辨識這些族群,並用來傷害這些人呢?

光是想像都讓人憂心,但我們卻不能因噎廢食,就此放棄這項科技,因為水能載舟,亦能覆舟,這個科技也可以幫助很多人。藉由科技學習,學者與立法者可以提出重要問題,並利用答案來做出對個人與社會有著深遠影響的重要決定。正如許多科技一樣,科技學習本身的價值是很中性的,但最後的應用會影響問題、偏好與創造者的世界觀。

(資料來源:TechCrunch;圖片來源:Marc_Smith,CC Licensed;未經授權,不得轉載)

點關鍵字看更多相關文章: