【新語言模型立大功】「幫我拿零食和可以配的東西」,Google 怎麼讓機器人真的聽懂?

科技快速發展,機器人讓我們現在的生活變得更方便。現在許多大型家電都講求智慧化,只要完成設定,掃地機器人就可以在自動打掃家中環境;下班一回到家,冷氣、電燈就自動打開,讓人們有更多時間去完成自己想做的事。

不過,科技巨頭們對於目前的機器人技術還不滿意,因此都積極研發,希望能打造出一個全能的管家型機器人,協助人類完全解決家中的大小雜事。

Google 機器人助手更容易理解人類指令

機器人幫忙遞零食給人類,看起來可能不是機器人技術的一項壯舉,但這卻是 Google 教機器人如何提供人類幫助的一大進展。機器人之所以能完成這項任務,並不是因為程式中輸入了執行這組定義明確的任務,而是讓機器人自行了解人類的要求以及該如何回應。這樣的挑戰比智慧居家助理還要更困難。

這個外型像白色水管的機器人(下方影片所展示,非本文首圖)是由 Google 母公司 Alphabet 旗下的 Everyday Robots 所打造。Google 一直致力於研究機器人相關的應用,希望透過軟體功能的提升讓機器人能更大程度的提供幫助。

Google 也分享了在機器人軟體研究的最新里程碑—— PaLM-SayCan 的新語言模型。這套軟體是和 Everyday Robots 一同合作開發的,將幫助機器人能對這個世界有更廣泛的理解,以及回應人類的要求。

例如「幫我拿一些點心和可以配的東西」和「我把飲料打翻了,你能幫忙嗎?」 對機器人來說,需要先理解這些口語化的敘述、得出最終目標、將其拆解為幾個步驟,並使用機器人可達成的技能來完成任務。

簡立峰:「雖然 AI 尚不能真正『懂』各種句子,卻能藉分析語句去判斷寫作者的情緒與立場,這在行銷科技已大有可為。」
而 Google 的語言模型未來可望讓這種智慧逐步在「機器人」中顯現出來。

TO 在《2022 雲端 AI 應用大調查》中發現,越來越多台灣企業看重 AI ,「發展 AI 與機器學習」更拿下 2023 重點 IT 投資 Top1!

現在下載報告,近距離看台灣企業 AI 競賽結果,還能搶先聽簡立峰深入剖析:AI 在語言辨識上,已經走到哪一步了?

據 Google 稱,目前的 PaLM-SayCan 研究是機器人首次獲得大規模語言模型。公司表示,與過去的軟體相比,PaLM-SayCan 讓機器人成功完成任務規劃提升了 14%,成功完成任務的比例也提高了 13%。Google 也發現,當機器人完成超過八個步驟的任務的能力提高了 26%,例如「蘇打水、蘋果和水灑了一地,你能把它們扔掉,然後拿海綿給我擦桌子嗎?」

儘管 Everyday Robots 的機器人已經在 Google 開始執行一些有用的工作,例如分類垃圾,但整個工作仍然是在教機器人如何自學。這項研究目前還處於早期實驗階段,除了尋找和取物等任務外,還包括訓練機器人打乒乓球和接球。

繼特斯拉之後,小米也推人形機器人

機器人技術除了 Google、特斯拉都在開發之外,中國科技公司小米於上週也推出了一款人形機器人的原型:Cyber​​One,又稱鐵大。

根據小米的官方規格,Cyber​​One 重 52 公斤,身高 177 公分,行走的最高時速為 3.6 公里/小時(略低於一般人的平均步行速度),並配有一雙類似手套狀的手,可以打開和關閉,但無法進行更靈巧的運動。

從影片中可以看到,Cyber​​One 具有某種類似導航的機器視覺系統,可以在 8 公尺內的距離內進行深度感應。小米表示,Cyber​​One 還可以「感知」人類的情感,外媒 The Verge 推測,可能是使用人工智慧系統來解析臉部表情。

特斯拉執行長馬斯克也曾表示將開發一個人形機器人,不過當機器人 Optimus 正式亮相時,卻讓許多人失望。

馬斯克指出,特斯拉將全力開發機器人應用,並希望機器能夠遵循複雜的人類命令,例如「去商店買以下商品」。馬斯克也表示,特斯拉的人形機器人 Optimus 未來將取代人們從事重複、無聊和危險的任務。

本文開放合作夥伴轉載,參考資料:fastcompanyThe VergeEveryday Robots,首圖來源:Unsplash