生成式 AI 註定會產生「幻覺」嗎?看看科技巨頭、新創怎麼想辦法解決它

生成式 AI 浪潮襲來,像 ChatGPT、Claude 或 Bard 這樣的大語言模型(簡稱 LLM),回答問題的能力讓人類驚嘆,卻也帶來不安。因為,大語言模型都面臨同樣的問題──它們會編造出錯誤的事實。這個現象被稱為「產生幻覺(Hallucination)」,引發民眾、媒體大量搜尋討論,更被劍橋詞典選定為 2023 年的年度代表字。

生成式 AI 出錯的範圍很廣,有些看起來奇怪、無害或許能一笑置之,但也可能帶來危險。根據《TechCrunch》,澳洲市長去年曾威脅起訴 OpenAI,因為 ChatGPT 錯誤聲稱他在賄賂醜聞中認罪;大語言模型也曾提供不當的心理健康和醫療建議,例如稱喝酒能預防癌症。

對於成千上萬家透過 ChatGPT 等大語言模型建立生成式 AI 產品的公司,幻覺更可能帶來重大的法律和聲譽風險。推出生成式 AI 服務的科技巨頭,一直試圖解決這個問題,也有新創聲稱可以幫助企業解決幻覺。但這需要先釐清 2 個問題──幻覺為什麼產生?可以被消除嗎?

為什麼會有幻覺?幻覺可以被解決嗎?

首先要了解的是,生成式 AI 模型並沒有真正的智慧──它們是預測文字、圖像、語音、音樂或其他數據的統計系統,根據模型蘊含的訓練資料──通常來自大量公開的網路內容,從上下文來預測在使用者給出提示之後,應該要回答什麼樣的單字或段落。

按照《Fast Company》的比喻,大語言模型是猜謎機,而不是答錄機。大語言模型也不會自己推理,很難區分高品質或低品質的資訊來源,而且因為資料來自公開網路,也會接觸到大量的垃圾資訊──或許你閱讀了網路世界的全部資料,也會產生幻覺。

那麼,如果大語言模型是以「預測」為基礎的方式運作,幻覺真的可以被解決嗎?《TechCruch》指出,這取決於你說的「解決」是指什麼。艾倫研究所的研究員 Vu Ha 斷言,大語言模型確實並且永遠會產生幻覺,但他相信有具體的方法可以減少發生。

減輕幻覺有 2 大方法!有誰正在解決幻覺?

根據報導,減少幻覺發生機率有 2 大方法。第 1 個,你可以嘗試微調模型(Fine-tuning),也就是重新餵養一批新的資料到模型中訓練,但這通常昂貴且耗時。OpenAI 在去年推出新的 AI 訓練方法,針對預測正確的每一步提供獎勵,確保模型可以按照類似人類的方式思考。

第 2 個方法是較為常見的技術──RAG(檢索增強生成),它的原理就像 AI 的事實查核器,可以把 AI 模型回答的內容,先和你提供的資料進行比較和調整,然後再送到你面前。

Google 已在一些產品加入幫助減輕幻覺的功能,採用的方法便是將大型語言模型、公共數據集、Google 搜尋結果或你私有的資料連結起來。微軟則透過客戶的真實資料提供模型反饋,並始終提供引用的資訊來源,以降低產生幻覺帶來的風險。

新創也看到企業對減輕幻覺的龐大需求,例如 Vectara 就運用 RAG 方法,幫助需要建立客製化聊天機器人或問答系統,但又無法花數個月或數百萬美元來調整模型的企業。Vectara 的第一批客戶以客服、銷售領域為主,而理論上 3% 的錯誤機率是可以被接受的。

另一家新創 Gleen AI,則針對企業需求打造反幻覺的資料層軟體,吸引了風險投資以及 Meta 前產品管理副總裁 Sam Lessin 等天使投資人的 490 萬美元融資。Gleen 建立專屬的 AI 和機器學習層,並作為回答內容的檢查點。如果缺乏可回答問題的證據,聊天機器人會直接說「我不知道」,而不是冒著編造資訊、產生幻覺的風險。

掌握 AI 趨勢 & 活動資訊一點都不難!訂閱電子報,每週四一起《AI TOgether》

感謝訂閱!隨時注意信箱的最新資訊

如果幻覺無法被完全消除,該怎麼辦?

事實上,有一些人包含 OpenAI 執行長奧特曼,傾向將 AI 產生的幻覺視為一種「功能」,而不是一個直接的錯誤,因為幻覺對於創意或藝術發想任務來說,可能很有價值。不過整體來說,隨著技術進步,生成式 AI 產生幻覺的疑慮或許會降低。

奧特曼曾提到,他認為 OpenAI 可以把幻覺問題解決得更好,而這需要 1 年半至 2 年的時間,屆時人們將不用再談論這個問題;而如果想要在創造力和完美的正確性之間取得平衡,模型仍須不斷學習。

《TechCrunch》認為,生成式 AI 和任何技術一樣都是不完美的,而以目前解決幻覺問題的方案來看,以懷疑的眼光檢視 AI 模型給你的任何內容,似乎是最好的方法

立即下載《2024 趨勢觀察報告》

  

【推薦閱讀】

生成式 AI 元年已過,GenAI 仍未被大規模商業化——3 大原因說給你瞭

比遇到問題不問還搞砸的同事棒多了!這些機器人知道何時該向「人類」尋求幫助

AI 狂潮最火紅的新玩意:RAG,未來 GPT 不再吐出幻覺就靠它?

 

*本文開放合作夥伴轉載,資料來源:《Fast Company》《TechCrunch》《Venture Beat》《Business Insider 》《CNBC》《Fortune》。首圖來源:Unsplash