首圖來源:Deeplearning.ai

吳恩達近期在 Deeplearning.ai 的一場論壇,說明了自己對於機器學習(Machine Learning)和 MLOps 的最新看法。

在過去,機器學習社群在意的是建模、參數調整、架構選擇,來達到對性能的監控。現在產業運用 AI 的幅度大增,開始轉向了新的階段,一大面臨問題是,當模型投入了生產,許多無法預期的因素,會影響模型性能。

產業、學界對 MLOps 定義具分歧?吳恩達:這仍是一個新興學科

企業開始追求大幅擴展這些機器學習模型 — 試想,當一間公司的信用卡用戶,從一百萬上升到十億人,傳統的檢查點還能全然適用嗎?這就是專家提倡 MLOps 的原因 — 匯集 DevOps 和機器學習的所有優點,確實,產業對於具備相關技能的人才也正急遽上升。

一些專家提出 MLOps 是目前可用的最佳解決方案,但由於這是非常新穎的領域,所以仍然存在歧義,通常沒有一套標準考參考。

為解決這些問題,吳恩達創辦的 Deeplearning.ai 最近主持了一個 MLOps 專家論壇,來切入討論機器學習生產的關鍵面向,以及 MLOps 出現在一間企業當中,究竟會是什麼樣子。

吳恩達承認,AI、深度學習等領域在過去十年中取得了巨大的進步,他也強調 MLOps 將幫助每個人完成機器學習項目的整個生命週期:一路從範圍界定、數據蒐集管理,訓練模型、改進數據、優化模型,再到部署監控、管理數據驅動模型維護的完整概念。

「我認為 MLOps 是一門令人興奮的新興學科,可以解決機器學習項目的整個生命週期,是極為前沿的議題」,吳恩達說。

>> 收看本場完整論壇 <<

MLOps 的第一步到底該怎麼跨出?吳恩達:高品質資料

任何涉及機器學習企業,都必須關心客戶對產品的需求 — 畢竟,目的終究是要商業化。

不過,談到對 MLOps 工具的看法時,吳恩達則表示,目前工具大多有明顯的限制,比方說,把數據餵入,不代表就能直接提高性能。

在建立 MLOps 團隊時,吳恩達推薦了一套他認為可靠的原則:要求團隊進行長期、認真的審視,以確保在整個生命週期中,始終保有品質好的數據。高品質數據究竟多重要?

特別是針對後續模型表現不佳時,應做的資料改善,吳恩達建議,MLOps 團隊可利用不同工具和準則,來確保連續性的高品質資料,光是做好這一點,就足以解決很多問題,甚至專案還能以兩倍以上的速度加快完成,「兩倍,甚至更快,只要你做好資料品質控管這件事。」

MLOps 是一個尚未完全成型的新興領域,吳恩達說,數據品質管理、MLOps 等重要關鍵字眼,大家不一定會在所謂職缺的工作描述中看到,但假設你想在機器學習領域更上一層樓,就千萬不要忽視。

許多公司都在找尋懂得構建、部署機器學習系統的人才,即使在面試過程中,也可能會被問有關 MLOps 觀念的問題。吳恩達總結,在現階段或是不久的未來,MLOps 將會是非常重要且加分的一項重要技能。

參考資料:Deeplearning.aiAIMiThome

看更多 MLOps 好文

• 【NVIDIA 進軍 MLOps】輸入極少量數據、幾小時內就能開發 AI 模型的 TAO 框架是什麼?
• Google 全新代管式機器學習平台 Vertex AI,幫助 AI 模型開發的程式碼量減少了 80%!
• 【GitHub 已開源】IBM 機器學習框架 CodeFlare,把 AI 模型訓練流程從 4 小時縮短為 15 分鐘!