Google 搜尋弱掉了!科學家想開發腦機接口搜尋:腦中思考就能搜到資訊

brain

【為什麼我們要挑選這篇文章】隨著腦機技術發展,科學家正在思考「腦機接口搜尋」的模式,也就是在腦中思考,就能夠搜尋到資訊的技術。目前 Google 等搜尋引擎大多使用關鍵字,但關鍵字無法傳達情境、情緒等資訊,透過腦機接口,可以提供系統更多訊息,或許可以搜尋到更精準的資訊。(責任編輯:郭家宏)

本文經 AI 新媒體量子位(公眾號 ID:QbitAI)授權轉載,轉載請連繫出處
作者:量子位

講真的,再熟悉不過的搜尋引擎,正影響著我們的思考方式。

正如 TCP/IP 協議之父、圖靈獎獲得者溫頓.瑟夫(Vinton Cerf)認為:

搜尋引擎,已傾向於成為人類基本記憶的替代品。

怎麼理解?

簡單來說,就是很多情況下,我們不再記憶所需的資訊本身,而是記住能把它們搜尋出來的方法和關鍵字。

而隨著我們對搜尋引擎的越發依賴,對其性能也提出了更多要求。

那麼站在當下,未來的搜尋,應該是怎樣的呢?

腦機接口能得到關鍵字以外的資訊,讓搜尋更精準

提到腦機接口,或許你會想到馬斯克,想到猴子用「意念」打遊戲。

但它也能還跟我們常用的「搜尋」聯繫起來?

是的,而且二者的結合,還是可能「加強人類自身思考能力」的那種。

這就是由清華大學計算機系黨委書記劉奕群教授所做的極具未來感的研究。

先來簡單了解一下腦機接口的原理:

腦機接口透過設備採集大腦中的信號,而後對信號進行特徵提取、轉譯,變成電腦可以理解的「人腦命令」,最後透過腦機接口的一些應用,實現對外部世界的操控。

那它與搜尋的結合點,又是什麼呢?當前的搜尋過程大致是這樣的:

用戶產生了「搜尋資訊」的需求,然後通常會用「關鍵字」的形式在引擎中進行搜尋;而後搜尋引擎會回饋給用戶結果,用戶看到之後便會產生相應的感受,也就是「是否滿足了自己想要的答案?」

這是傳統搜尋的一個流程,但卻存在三個問題。

首先,是查詢。

簡單來講,用戶搜尋需求是非常豐富的,但查詢本身是受到表現形式的影響,換言之,絶大部分人還是依賴關鍵字形式的查詢。

其次,是搜尋結果的滿意度。

雖然在查詢過後,搜尋引擎會呈現很多結果,但這種形式是非常間接的。

具體而言,用戶可能會去點擊結果,或者在結果頁面上停留一段時間,但這種回饋毫無疑問,是帶有非常強的歧義性。

最後,是上下文環境。

用戶在搜尋過程中,是具備完整的上下文環境,包括用戶自身的資訊、時空位置,而對於這些資訊,搜尋引擎在很多情況下是沒有利用起來的。

而透過腦機接口的能力,能做到的事情要比傳統搜尋更多。

例如在需求方面,腦機接口能夠給搜尋引擎,除了關鍵字之外的更多資訊。劉奕群教授表示:

我們想到什麼,就能提供給搜尋引擎,如此一來,所提供的資訊是非常精準的。

而且不僅僅是查詢的需求內容,還有可能是用戶當時的情感資訊、周圍環境對用戶產生影響的資訊等等。

更重要的是,這種提供查詢需求的方式還是近乎即時的,因此也更具真實性。

簡單來講,腦機接口+搜尋引擎,要做的工作就是:

透過腦機,擁有用戶的情感,感知用戶的情緒,便可以建立良好的心智模型,提供用戶在搜尋關鍵詞之外更加精準的用戶資訊需求描述,更好的提升搜尋的體驗。

當然,這是一件具備未來感的事情,那是否有點天方夜譚?可否實現?

劉奕群教授認為,應當先來思考一下當前透過腦機接口可以實現的功能。

例如現在可以腦機接口以高精準度控制滑鼠的移動、可以把人要說的話「解譯」出來、高端的思考和認識轉變成文字,以及透過功能性核磁共振等輔助工具,來研究資訊需求產生的過程。

基於此,劉奕群教授提出了對「腦機接口搜尋」所面臨的三大挑戰。

第一個難點,是需要對搜尋的交互模式進行重新定義。

人腦思考方式非常複雜,很難做到聚精會神地思考一個問題,如何提煉相關性的上下文,還能過濾掉無關的資訊,是另外一個難點。

第三點,就是在提升用戶客製化體驗的同時,如何做到保護用戶的隱私。

未來的搜尋演算法:深度語義學習

而除了「搜尋方式」之外,未來的「搜尋演算法」,又該是怎樣的?

舉一個例子,「Future and Options」在日常情境下是「未來與選擇」的意思,在金融情境下卻是「期貨與期權」。

搜尋引擎如何處理這種問題?

搜狗 CEO 王小川認為,未來的搜尋將從關鍵字搜尋走向深度語義搜尋。

使用稠密向量表示的檢索模型,深度語義特徵匹配排序以及自動提取搜尋答案,實現深度檢索、深度排序和深度展現。

深度語義搜尋雖好,但對於網路海量的數據和紛繁複雜的用戶意圖,在應用中還面臨著三大技術挑戰。

1. 檢索挑戰:語義漂移

人的語言表達是很隨意的,如果搜尋「炒股的炒字是怎麼來的」,既可能匹配到與炒股一詞的由來相關的結果,但還可能匹配到股票是怎麼被炒起來的。

這就是深度語義學習在檢索層面的一大挑戰「語義漂移」,使得檢索出的結果與用戶實際查詢意圖不完全相符。

2. 排序挑戰:結構丟失

傳統倒排索引方式搜尋結果的排序有人工參與,可以對整篇文檔的結構清晰度、所屬站點的權威性等特徵進行提取和打分。

而使用深度語言模型對檢索結果提取特徵有一定的字數限制,難以覆蓋到整篇文檔。這會造成排序依據的結構丟失。

3. 展現挑戰:價值稀疏

現在的搜尋引擎給出一些結果條目,需要用戶主動在其中瀏覽挑選。而據統計有 1/4 的搜尋請求都是問題式,搜尋結果不能直接給出答案是結果展現的「價值稀疏」。

搜狗針對這些問題,採用將傳統倒排索引的結果和深度語義稠密向量搜尋的結果結合起來的辦法。

進一步的,將兩路結果的特徵相互交叉融合。對稠密向量檢索結果計算內容匹配特徵,對倒排檢索結果計算語義特徵。

最終達到超過 BERT 的效果。

除了技術挑戰之外,深度語義搜尋還面臨三個工程問題。

▌兩種搜尋結果結合的辦法增大了運行成本,如何做到低系統開銷、可復用?
▌如何做到高性能、在高並發計算時如何保障低延遲?
▌面對峰值壓力如何做到高可靠性?

如何解決這些問題就是搜狗今後要探索的道路。

以上精采內容,全部出自 CCF C³ 的第三期活動,主題為「深度語義學習在搜索的應用」,由搜狗承辦。

C³ 活動是由中國計算機學會 CCF CTO Club 發起的,旨在聯結企業 CTO 及高級技術人才和資深學者,每次以一個技術話題為核心,走進一家技術領先企業。

第一站走進京東,主題為「智慧客服」,清華大學的黃民烈、劉知遠教授與京東技術副總裁何曉冬共同探討了下一代智慧對話系統。

第二站走進小米,主題為「智慧家居」,小米副總裁崔寶秋、小米 AI 實驗室主任王斌與清華大學徐迎慶教授分享了 AIoT 的歷史與智慧家居的發展方向。

本次第三站走進搜狗報告結束後舉辦了承辦單位旗幟交接儀式,揭曉了下一次活動承辦單位是百度,具體時間是 5 月 14 日晚上 6:30 – 9:30。

參考資料

ACM》、《中國計算機協會

(本文經 AI 新媒體量子位 授權轉載,並同意 TechOrange 編寫導讀與修訂標題,原文標題為 〈用脑机接口去“搜索一下”,是种什么体验? | CCF C³[email protected]搜狗 〉。首圖來源:flickr CC Licensed

延伸閱讀

馬斯克發表最新腦機介面成果並宣布人體實驗在即,網友躍躍欲試:腦洞已經開好了!
將導電聚合物做成牙膏狀,MIT 用 3D 列印製作腦機介面電極
用縫紉機把晶片植入大腦,馬斯克新創 Neuralink 正在打造超科幻「腦機帝國」


點關鍵字看更多相關文章: