文:YY Liu藍立晴共同編寫

21 世紀的今天,「Google」成為搜尋一字的代名詞,已經是超過十載的共識。過去十年,多數時候 Google 在全球搜尋引擎市場一直穩坐 90% 以上市占。繼微軟旗下瀏覽器 IE 於今(2022)年宣布退場,人們大概更難想像有任何搜尋引擎能挑戰  Google 霸主的地位。

但最新消息是: Google 可能即將遇上能動搖其地位的挑戰者——AI 智能搜尋引擎 Andi 。

Andi 可突破 ChatGPT 的「限制」

在深入介紹 Audi 這款 AI 搜尋引擎之前,我們可以先來聊聊 ChatGPT。這也是最近最受到大眾關注,甚至被認為可望挑戰 Google、對 Google 市佔率蠶食鯨吞的一項 AI 工具。

不過,ChatGPT 是否算是個「有效的」搜尋引擎,卻還沒有一個定論——這是因為 ChatGPT 的訓練模型並不會即時更新,因此有可能提供使用者過時的答案,並且很多時候仍然需要使用者「另外 Google」來驗證 ChatGPT 提供的訊息是真是假,這位聊天機器人本身也如此坦承其缺陷:

對於我的服務用戶來說,記住這一點很重要:在使用我提供的任何資訊之前,應該根據可靠的外部來源進行驗證。

而 Andi 既能過濾掉 Google 等傳統搜尋引擎的弊病,又能彌補聊天機器人 ChatGPT 在提供即時、最新資訊方面的不足,但它是怎麼做到的?

TO 延伸閱讀:在我們還無法想像有人可取代「Google 搜尋」時,「AI 合成引擎」橫空出世了

AI 基底的認知搜尋,可望越過「Google 障礙」

傳統上,從零建立一項新的搜尋引擎,就像打造一項新的基礎建設,耗時、費力又燒錢,原因是要在浩瀚網路裡的數兆個網頁中搜索,前提是要建立足夠多的索引(Index)頁面供引擎爬取(crawling),而在這點上,Google 已有數百億個索引頁面,堪稱是任何對手、新進者難超越的障礙。但透過 AI 運作的搜索引擎,有望越過此一阻礙。

據《TechCrunch》報導,一項於今年下半年問世、名為 Andi 的 AI 搜尋引擎衝著傳統搜尋引擎而來,旨在顛覆未來人們搜索資訊的方式。這類以 AI 為基底的搜尋引擎與傳統搜尋方式不同,並非從網頁中的文本、摘要分析相關性來排列搜尋結果, AI 搜尋引擎更接近所謂認知搜尋(cognitive search)。

認知搜尋簡單來說是以更有脈絡、人性化的搜尋結果來回應使用者想搜尋、發問的問題。

以採用類似技術的資料庫搜尋引擎工具 Amazon Kendra 為例,據 AWS 官網指出,過去當我們要搜索某公司的營業時間,可能會打上「公司名稱」、以及「營業時間」來搜尋,但使用認知搜尋的工具,允許使用者以完整句子來搜尋,像是句構較複雜、牽扯不同修辭及人性化口吻的長句。

使用者可以直接發問:「我什麼時候可以到該公司辦事?」而系統會從資料庫散落的資訊中,編排(compose)出適合結果,給出像是:「該公司每日營業時間是……」這樣的答覆,而不是給出一行又一行的超連結,等著使用者逐一點開,找到自己要的答案。

同樣的, Andi 透過經大量語言模型訓練的 AI ,結合即時線上資料,提供使用者一項經過多項知識來源組合的回答。

實際使用 Andi 的過程,使用者首先會進入一個類似 Chat bot 的對話介面,並在訊息框中輸入想發問的句子,接著系統會從所問問題,尋找與該問題具有高度相關及品質優良的資訊,並將這些資訊在排序後,從中提取資訊,編排成一項完整答案。

Andi 的使用者介面。

使用者也可選擇圖片、影片等不同呈現方式的搜尋結果。

據 Andi 研發人員指出,該平台針對不同知識領域,例如歷史事實、coding、保健等,量身打造不同 AI 系統,其汲取的資料庫來源也包羅萬象(有些資料庫來源可能像是 Forbes、紐約時報等媒體資料庫)。

AI 搜尋引擎能掃除傳統搜尋引擎弊端:廣告、垃圾網頁、侵犯隱私

Andi 創辦人、年僅 23 歲的 Angela Hoover 認為,這類像是跟 AI Chatbot 對話的搜尋方式,將改善現行搜尋引擎的問題。

Z 世代討厭 Google ,搜尋結果總充斥著廣告、精心編纂過 SEO 關鍵字,但實際上是垃圾的網頁,用戶得花大量時間才能從一行行雜亂無章的網頁超連結找到自己想要的資訊。」Hoover 說道。

更糟的是傳統搜尋引擎,透過紀錄搜尋關鍵字來追蹤使用者的資訊、位置以及興趣,來投放廣告。 Angela Hoover 聲稱, Andi 不僅不追蹤使用者資訊,也不會記錄和儲存使用者閱讀或點擊的搜尋結果,僅會使用粗略的座標數據來提高搜索結果的相關性。

整體來說,根據使用者經驗, Angela Hoover 指出 Andi 可以為使用者節省 15 或 20 分鐘的搜尋時間,來得到想要的資訊。

不過,編輯實際測試 Andi 與 ChatGPT,發現 Andi 的確僅有「搜尋」的功能——它並不具備 ChatGPT 可以寫詞、寫故事、寫信的能力,而當未來 ChatGPT 啟用付費選項後,要更新即時資料庫或要突破更多限制,似乎就不成問題了。因此,對於 Andi 來說,其未來挑戰仍然是艱鉅的。

有趣的是,當編輯轉頭向 ChatGPT 提問「你能取代 Google 嗎」之後,發現它並不認為自己是個搜尋引擎:

AI 會碰上的困境,Andi 也避不過

最後,如同 Google 也深受其擾的,即便是 Andi 這樣的 AI 搜尋引擎,也可能受到假新聞、不實資訊誤導,另外還有所有 AI 模型都會面臨的問題:演算法造成的偏見、歧視。

就像《紐約時報》所形容,新一代聊天機器人最終可能會改變我們在線上學習和查找資訊的方式,但它們並不總是說實話。

目前處於 alpha 版本軟體測試階段、在今年冬季剛被創投 Y Combinator 投資的 Andi 正努力排除這些問題。

Angela Hoover 指出,系統將努力透過列入黑名單、加權指標等技術排除不實資訊,至於演算法造成搜尋結果具有刻板印象或偏見等問題,Angela Hoover 認為這需要更多資金、人力與時間的投入,才能開發、培訓更多更適合市場所需的 AI 模型。

TO 延伸閱讀:低頭族即將消失!Google、Amazon 都在押注的「環境運算」是什麼?

參考資料:TechCrunchY CombinatorAWSEconsultancy紐約時報,首圖來源:Shutterstock。