Search
Close this search box.

【劉永信專欄】AI 時代的競爭焦點:OpenAI 與 Google

AI 的發展如同火箭奔向月球、甚至是火星,其速度勢不可擋。今年的 Google I/O 大會在 5/14 於美國如期舉行,吸引全球開發者的目光。回顧過去十多年,從 Android 到 Google Glass、Chromebook、Google TV 等產品,每一屆 I/O 大會都見證了許多革命性的技術發布,這 I/O 的核心精神 — 創新與開放 (Innovation and Open)始終如一。

我記得曾經參加過在舊金山 Moscone Center 舉辦的 Google I/O 大會,坐在擠滿人潮的會議室地板上熱血地聽著 Android 重要技術可以加速軟體效率的 JIT(Just-in-Time)開發者在講台上講解 JIT 技術的來由和創新:對於 Java VM 來說,可以快速增加應用程式的發展,有了 JIT,更可以加速應用程式運行的效率。這也是 Android 的核心之一,造成了在 2011 年達到 100M Android Activation,當時 Google 的期待就是 One OS everywhere。

那時,Android 對決 iOS 的戰爭如火如荼,Android 僅用 4 年 9 個月達成了 100 萬個應用程式,而 Apple 則是用了 5 年 3 個月,這顯示了 Google 在快速開發與應用程式運行效率上發揮了優勢。

今年 I/O 大會中,DeepMind 執行長 Demis Hassabis 介紹了 Project Astra — 多模態的 AI 引擎。Hassabis 表示 “A multimodal universal agent assistant is on the sort of track to artificial general intelligence.” 這個 Google 推出的 AI 創新產品,標誌著未來通用人工智慧(AGI)的基礎。這是暨去年 Hassabis 接任 Google DeepMind 負責人後,透過多模型的 AI 展示應用,定義了新時代的 AI、也成為跨時代的關鍵一步。

在 I/O 大會的前一天,OpenAI 的技術長也發布了 GPT-4o,並現場展示了多模態應用,包含一步步拆解數學題 3x + 1 = 4。Google 也介紹了 NotebookLM 的技術更新,更顯示了 AI 在教育領域的發展潛力。這兩間公司,不約而同在 multimodal(多模態)與 Long-Context(大量資料)的競爭,正變得愈發激烈。當然,GPT-4o 在 Google I/O 前一天發表,也有一種互相較勁的意味。

上一世代 Apple iOS 與 Google Android 之間的競爭,最終兩者各有斬獲:Apple 在手機市場取得超過 80% 的利潤,而 Android 則在市場佔有率上超過 80%(從廣告角度來看也是間接獲得了利潤),雙方算是平分秋色,各霸一方。

兩個巨人的競爭,開啟通用人工智慧(AGI)發展

如今,AI 的競爭速度更快,過去手機大約是一年出一個新產品,現在 OpenAI 的 GPT-4o 和 Google 的 Gemini 每半年都會有新的突破,每一次發表都令人驚艷。Google CEO Sundar Pichai 提到,Gemini 提供了 multimodal(多模態文字、語音、圖片與影片處理等)、Long-Context(大量資料)、Agent(智慧型引擎),其處理能力甚至已達到 2M token。用手機的相機跟著人一起走掃描一圈辦公室環境,它甚至可以告訴你你的眼鏡放在哪裡!

或許這次兩個巨人之間的競爭,正式開啟通用人工智慧(AGI)發展的起頭,如同這次發表的 Gemini $2M token,未來的目標更是無遠弗屆。記得 Google 創立時的願景 “Organize the world’s information and make it universally accessible and useful”,經歷作業系統競爭 “One OS everywhere”,到現在 AI first 的願景 — “Making AI helpful for everyone”。

面對未來,將有更多的技術發展,也期待兩個巨人迎向更高的挑戰:在良性競爭下,能夠發揮初衷(Don’t do evil),保護隱私、建立 AI 道德標準,持續推出有利於社會發展的創新產品。

* 本文經 劉永信 Spencer Liu 授權轉載,並同意 TechOrange 編寫導讀與修訂標題。首圖來源:Google Keynote(Google I/O‘24)

(責任編輯:曾品潔)