資料上雲≠資料變得有價值!Google Cloud 如何突破限制,讓資料發揮 AI 價值?

Google Cloud

【為什麼我們要挑選這篇文章】一年一度的 Google Data Cloud Summit 媒體聚會又來了!Google 這次一樣一次端出了許多豐富好菜。他們怎麼靠新的服務,讓資料真正為企業發揮應有價值?(責任編輯:藍立晴)

由於資料、工作負載以及使用者的數量及類型急遽成長,研究調查預測,到了 2025 年全球數據資料量將翻倍成長達到 181ZB,同時有 73% 數據決策者認為,即時存取數據能力極為重要;對於企業而言,資料的影響力亦不再僅限於分析師,更是已擴及所有員工、客戶和合作夥伴,然而即便企業採用雲端環境,也能以透過傳統資料架構讓龐大的資料產生實際效用,發揮應有價值。

為解決企業數據處理挑戰,並滿足使用者對數據應用的創新需求,Google Cloud 此次發表的項目包括  BigLake 和 Spanner 變更串流,協助使用者進一步整合客戶資料,同時確保資料可以即時傳遞;另外,Vertex AI Workbench 和 Model Registry 則能讓使用者輕鬆將資料轉化為 AI 方面的價值。

Google Cloud 指出,為讓所有人都能使用這些資料,將發表經統合的商業智慧(BI)服務,當中包含全新的 WorkSpace 整合方案,以及進一步支援 Google 資料雲端合作夥伴生態系的新計畫。

Google Cloud 發表新服務,「湖倉一體」不困難

● BigLake Beta 版:該工具不僅能整合數個資料倉儲和資料湖泊,達到湖倉一體,進一步發揮 BigQuery 的效用,還可在多雲端儲存空間中提供存取權控管機制、加快效能,而且無須額外建立資料副本。

在不同的倉儲與湖泊間管理資料會造成各自獨立,進而提高風險和費用,這樣的情形在需要遷移資料時更是明顯。使用 BigLake 便不必複製或遷移來源中的資料,可減少費用並提升效率。

Twitter 已開始採用 BigQuery 的儲存空間功能來打破資料限制,以便進一步掌握其用戶使用 Twitter 平台的方式,以及會感到興趣的內容類型。因此,Twitter 能透過每秒可執行超過 300 萬次聚合作業的廣告管道,每天為數兆個事件提供內容。

Spanner 每秒可處理超過 20 億項要求,使用者可隨時存取最新資料

● Spanner 變更串流:這項即將推出的新產品,方便使用者追蹤 Spanner 資料庫中的變更,還可輕鬆存取其中的資料並整合至其他系統,讓資料發揮前所未有的價值。

Spanner 變更串流可以追蹤 Spanner 的植入、更新和刪除作業,並在整個 Spanner 資料庫中即時串流異動內容。

這樣一來,使用者能隨時存取最新資料,同時將 Spanner 中的變更複製到 BigQuery 來進行即時分析、透過 Pub/Sub 觸發下游應用程式行動,或是將變更儲存至 Google Cloud Storage (GCS) 來遵守法規要求。Spanner 目前每秒最多可處理超過 20 億項要求,同時維持 99.999% 的可用性。

團隊使用「相同工具組」完成資料分析、數據科學、機器學習等工作

● Vertex AI Workbench (GA):現已正式發布,透過單一介面整併資料與機器學習系統,因此資料分析、數據資料學和機器學習領域的團隊都能使用同一套工具組來進行作業,在更短時間內將 AI 模型部署至實際工作環境,進一步簡化維護作業。現在使用者可在 Vertex AI Workbench 中直接存取 BigQuery。

此外,Vertex AI Workbench 與 BigQuery、無伺服器 Spark 和 Dataproc 整合後,可讓團隊快速建立、訓練及部署機器學習模型,速度是傳統筆記型電腦的 5 倍。一間跨國零售公司採用了 Vertex AI Workbench 之後,銷售額增加了數百萬美元,產品上市速度也加快了 15%。

管理大量構件不容易,如何輕鬆管理模型的維護作業?

● Vertex AI Model Registry:這項全新的服務提供中央存放區,可用於探索、啟用及管理機器學習模型,且支援 BigQuery ML。有了 Vertex AI Model Registry,數據資料學家就能輕鬆分享模型,供應用程式開發人員使用,進而輕鬆依據資料進行即時預測和決策,讓全體團隊更能靈活因應瞬息萬變的市場環境。

● Google Cloud 的統合式商業智慧產品組合:Google Cloud 的各項商業智慧 (BI) 產品能順暢地搭配運作,進而擴增資料存取管道,並讓團隊所有成員都能以最輕鬆的方式,獲得促進創新的全新洞察。

  ○ Looker 連結試算表 + 數據分析:現在 Google Cloud 的使用者不但能使用 Looker 連結試算表,還可存取數據分析中的 Looker 資料模型。這項全新的整合體驗能讓使用者根據自身需求,透過單一且安全的存取點 (Looker 探索、Google 試算表或數據分析拖曳式介面等) 來使用資料。

資料庫遷移計畫全新的資料遷移計畫有助 Google Cloud 的使用者將地端部署環境和其他雲端中的資料,迅速且順暢地轉移至 Google 的代管資料庫服務中,藉此提升搬遷效率。除了工具與資源外,使用者還可透過這項計畫獲得合作夥伴提供的專業知識,以及 Google Cloud 提供的獎勵補助,省下將資料庫遷移至 Google Cloud 所需的部分費用。

此外,由於使用者希望合作夥伴解決方案不僅能跟 BigQuery 等產品緊密整合在一起,並可以進一步優化。因此,Google Cloud 也公布 Google Cloud Ready – BigQuery ,這項全新的驗證機制,能夠識別一系列符合功能性和互通性核心需求的合作夥伴解決方案,例如 Fivetran、Informatica 和 Tableau 所提供的服務。

目前,Google Cloud 已在這項「Google Cloud Ready -BigQuery」計畫中收錄了超過 25 個合作夥伴。這項嶄新的計畫可協助使用者減少評估新工具所需的成本,同時支援新的應用情境。

Google Cloud 也指出,目前已有超過 700 個軟體合作夥伴使用 Google 的資料雲來驅動自家的應用程式。 Bloomreach、Equifax、Exabeam、Quantum Metric 和 ZoomInfo 等許多合作夥伴均已開始採用 Google Cloud 的資料雲功能,並參加 Built with BigQuery 計畫,來享有專屬工程團隊、協同行銷和市場開發的支援,也可在 Google Cloud 資料雲端策略系列小組講座取得實務內容。

(本文訊息由 Google 提供,內文與標題經 TechOrange 修訂後刊登。新聞稿/ 產品訊息提供,可寄至: [email protected],經編輯檯審核並評估合宜性後再行刊登。圖片來源: Google。) 

AD