Google 的 in-house 哲學家: Google 是個抓不住真相的「胡扯」引擎

當你對萬物有了疑惑時,你第一個動作是什麼?大多數人通常是:Google 一下準沒錯!

我們都希望搜尋引擎能提供我們最好、最完善的資訊,當我們使用搜尋引擎時,總覺得自己獲得的資訊就是完美的解答,根據耶魯大學 2015 的研究報告,我們甚至認為自己在搜尋時的狀態比 平時還要聰明(不管我們有沒有從搜尋引擎上找到我們需要的資訊)。

但是你知道當你在 Google 引擎上搜尋「恐龍發生什麼事了?」(What happened to the dinosaurs?),得出的第一個結果卻是一個名為《創世紀的解答》(Answers in Genesis) 的網站。根據此網站的解釋:聖經給予我們大略的構架以探勘恐龍出現的時代,也就是好幾千年前的世界,包括恐龍存在當時一些難以解釋的現象,以及發生在牠們身上的事情。將網頁往下拉,你就會發現有一堆回應聖經理論的辛辣文章,當然還有回應這些文章的另一堆文章。大概要將網頁拉到最底,才會出現真正以科學角度解釋恐龍存滅的文章。

Luciano Floridi,人稱 Google 哲學家,卻認為這樣的情況是 ok 的。Floridi,為牛津大學哲學系教授,同時也是 Google 為日前歐盟通過的「被遺忘權」(Right to be Forgotten) 成立的對策顧問團其中一員。當我和他聊到剛剛的恐龍話題時,他也不諱言的說那群神創論者的說法簡直太荒謬了,但撇除他對此事的看法,他認為 Google 不該移除掉所謂的「以信仰為基礎的解答」(faith-based answer)。

「你應該理解身為哲學家的我追求時事的態度吧!但以 Google 的搜尋引擎為例,我認為管理搜尋引擎的人,也可以視為管理真相的人,必須更加謹慎的管理這個業務。假如你將太大的權力給予一家私人公司,那是很危險的舉動,所以事實就是不該讓 Google 掌管不管是今天還是明日的真相。」

  • 抓不住真相的搜尋引擎

Google 從來沒有保證給予使用者最好的資訊,Google 搜尋引擎的算法,本來就是以效率為核心概念來設計:提供使用者最有可能的資訊。而為了達到這個目的,Google 將我們的數位資訊加以分析,並擷取出我們最容易接受且會點擊的項目。

所以根據以上的說法,再以搜尋引擎的算法來推論,會得出《創世紀的解答》這樣的搜尋結果,其實也不奇怪。就讓我們一步步來分析,從這個網站的標題「恐龍到底發生什麼事了?」,跟原本的搜尋問題「恐龍發生什麼事了?」,只有兩字之差,再加上以 蓋洛普民意 為基準,推測出美國境內多數的人是神創論者,才會讓這個搜尋結果成為引擎中最熱門的選項。

假如我們是以「恐龍跑去哪了?」為搜尋目標,搜尋引擎的算法會將你導向一首兒歌,因為那首兒歌的歌名就是「恐龍跑去哪了?」。他的原文 開頭 為:

Sixty-five million years ago
On the Yucatan peninsula in the Gulf of Mexico
There crashed a mighty asteroid of ten miles wide, or so
Sixty-five million years ago

也就是說,Google 的搜尋引擎、Bing 搜尋、DuckDuckGo 以及其他類似的搜尋工具,都有一個通病,那就是它們容易抓不住真相!

抓不住真相以哲學定義來說就是胡扯:「胡扯不是以真相為基礎,但也非全然謊言,然而它依舊不是事實。」,此番話出自普林斯頓哲學系教授 Harry Frankfurt,以溝通理論為基礎發表於 1986 年的論文「On Bullshit」。

「胡扯和真相之間缺乏連結,也就是抓不住事實的真相,我認為這就是胡扯的本質。」

如果以這個理論為衡量標準,那很遺憾地可能得稱 Google 搜尋引擎為胡扯引擎,畢竟它搜尋出來的東西有的時候和所謂的真相差距甚遠。

然而我們還是將這些搜尋引擎搜到的結果視為真相,根據 Pew Internet 和 American Life 在 2012 年 2 月的調查 報告 發現「73% 的使用者認為搜尋引擎的結果可信度高且精確。」

路透社年初的一篇報導指出「搜尋引擎」漸漸成為搜尋新聞的 起點 之一,尤以義大利、日本、德國及西班牙又更為明顯。而根據 Journal of Computer-Mediated Communication 在 2007 年發行的研究報告,可知人們對於搜尋引擎得出的結果,比直接從網站看到的內容,還要 更加信任 ,至於這是為什麼,使用者也說不出個所以然來。

  • 每個搜尋引擎的結果都像甜甜圈難以抗拒

當然 Google 跟其他搜尋引擎的提供者,也不是沒有想過拉近搜尋引擎結果和事實之間的落差。

2015 年的 3 月,Google 內部提出了一個新型的 搜尋引擎雛形 ,主要是以知識為基礎 (knowledge-based trust) 的搜尋索引,也就是說這個新的引擎可以將從網站擷取出的內容和 Google 的知識庫 (knowledge vault) 比對,好讓得出的結果更具信賴感。

同時 Google 還有另一項計畫叫做 Trust Project,在去年的 10 月推行,是由 Google news 負責人 Richard Gingras 和倫理學家 Sally Lehrman 共同策畫,計畫的目標主要是以高標準來審視新聞的內容及品質,並以 Google news 的聚和器將最好的新聞抓出並呈現給讀者。

不過 Google 實施的這些計畫及方向能否成功,還是有待進一步觀察,且根據紐約時報 7 月的 報導 指出,Google 的機器學習算法 (machine-learning algorithms),其實很容易受到人類行為的影響,導致搜尋結果中反映出人為的偏見。從此可知,我們使用者本身就是問題中的問題。

不過當然還是有使用者相信我們每天找到的資訊都是最好、最具可信度的,但事實上我們的點擊動作卻洩漏出另一個結果。來自 Facebook 位於田納西州內容 實驗室 的 Stephen Levy,將以上的問題稱為「甜甜圈障礙」。

「甜甜圈對需要控制體重的人來說絕對不是個好選擇,但當這麼美味的甜食出現在你眼前…,你可能會想說好吧,管它的!」

搜尋引擎出來的結果,就像每一個甜甜圈一樣,對我們使用者來說難以抗拒,我們無法克制的點擊每一篇文章,畢竟這些文章都比內容精準、嚴謹的文章還要更好消化。

一些媒體也常在 Facebook 上製造大量的甜甜圈式文章,吸引用戶點擊觀看,於此同時獲得同業盛讚的高水準新聞,例如調查報導,卻很難在輕鬆的社群網站上獲得關注。

「數位媒體的影響和閱聽族群及廣告收益的巨大改變,都再再地打擊調查式報導的存在,使得它在 20 世紀中後的黃金時期已不復強盛了。」,曾替華盛頓郵報報導過水門事件的 Leonard Downie Jr寫道

在過去的十年內,非營利組織也身負衝高點擊率的任務,但是在最近幾年內的成果卻有限,上文是根據 Nikki Usher 和 Matthew Hindman 對 Knight Foundation 於 2015 年 報導分析 ,「非營利組織的新聞是絕對無法填滿閱聽民眾與新聞之間的落差」,兩人也總結道。

事實上,許多評論家認為整體社會能進步歸功於調查式報導的興盛,因為錯綜複雜的調查容易引起人們的關注及討論,人們對於時事的參與度才會增加。我們老是崇拜那些習慣閱讀艱澀、訊息繁雜書籍的朋友(面對偶爾才接觸這些書籍的自己感到心虛)。習慣啃咬甜甜圈式文章的我們,提供八卦及無關緊要訊息散播者很多的管道,以蓬勃它們的發展。

  • 堅決攝取健康的新聞

所以說到現在,Google 和 Facebook 是否給予了使用者健康的新聞呢?他們能否透過過濾器將最真切的事實及新聞,毫無保留地傳遞給社會大眾呢?

「當 Facebook 達到這樣的目標,我們就會像活在烏托邦世界中」,Floridi 認真的告訴我。隨著搜尋引擎的出現,Floridi 認為像是完全的錯誤訊息,例如 2 +2 = 5,這種離譜的資訊應該被嚴格監控。「控管好流竄的訊息是很重要的,必須堅守訊息的品質及真實度,這是絕對需要好好把關的動作。」

但這並不表示我們應該委託 Google 對這些訊息做檢查的行為,「現在我們總會有一個迷思,認為 Google 提供的訊息都是真的,但這樣無意識的信任 Google,有一天你會看到『你所搜尋的資訊已經被 Google 官方刪除』,我認為這是非常可怕的情況,因為這代表 Google 手中握有過大的訊息操控權。」,Floridi 說道。

為了防止 Google 過度染指訊息的操控權,現在必須有一個合乎民主授權的品管處,就像政府替學校購書是為了讓我們聰明、淨水是為了使我們健康、研發綠能科技是為了保護環境,都是為了保護民眾的權益。

當然 Google 和 Fcebook(包括 Apple 即將發行的 Apple News app) 都已經事先做過用戶調查,以用戶偏好的搜尋式習慣重新塑形自己的搜尋引擎,但是我們都知道我們習慣甜甜圈式訊息,根本都是無意識的點選文章來觀看,這和我們真正需要閱讀的訊息相差甚遠。

以民主政府為例,選舉制度的制定需要詢問多方意見才能決定,也就是說透明化的制度才能平衡及保證一個系統的信賴度。假如私人科公司也能以這樣的方式從業,相信我們最終都能獲取真正的真相。

Floridi 認為最好的結果,也許可以透過不同搜尋引擎的合作,交叉提供用戶不同的搜尋結果。「透過以上的方式,你所搜尋的問題將會得到不同的解答,畢竟應該不是所有的搜尋引擎都認為恐龍的消失跟造物主有絕對的關聯。」

當然要達到這樣的目標,首先就是要有強烈的企圖以及完備的搜尋樣本,「假如我們擁有更好、更聰明的用戶,需要更好的服務項目,這樣就能躁動整個市場的變化,促使像是 Facebook 等公司做出調整及回應。」

總而言之,在想出一個具備倫理道德的搜尋引擎算法前,我們需要更多具備倫理道德的使用者。

(資料來源:QUARTZ;圖片來源:leahwsprague,Katherine scribbles,theglobalpanorama,CC Licensed)

點關鍵字看更多相關文章: