Google、軟銀都陣亡過!盤點 AI 專案失敗的 4 大原因

(本文經合作夥伴 若水 AI Blog 授權轉載,並同意 TechOrange 編寫導讀與修訂標題,原文標題為 〈AI 專案一直卡關,為什麼?〉;首圖來源:若水國際。)

【我們為什麼挑選這篇文章】為了適應未知多變的世界,許多企業搶做「數位轉型」,從公司營運的各層面如客戶體驗、商業模式、企業文化到作業流程等,透過科技的導入來提升效率與效能;而對製造業企業而言,原料採購、物流管理、庫存調配、生產、行銷等環節則是企業主進行數位轉型會優先考量的面向。

在這之中,AI 的運用扮演很關鍵的角色,如何將 AI 應用到上述各層面並實際執行,是許多企業面臨的挑戰,有哪些要點是執行 AI 專案時需特別留意的?(責任編輯:賴佩萱)

作者:若水 AI 數據資料處理部負責人 簡季婕

2020 年,突如其來的新冠肺炎疫情(Covid-19)改變了許多產業的命運,同時加速推促 AI 落地的速度,AI 人工智慧的應用將成為企業的新日常。

若水 AI 數據服務團隊本著為台灣 AI 應用落地盡份心力的初衷,順著這波改變,推出全新系列內容:與機器學習(ML : Machine Learning)、AIOps 智能運維(Artificial Intelligence for IT Operations)有關的實用文,分享各界專家在每一天如何持續營運、優化 AI 架構以及數據處理的基本功。

【若水導讀】AI 專案順利通關的三個絕招:
1. AI 數據來源要多元,避免學習偏誤
2. 標註前,請先建立客觀的 AI 數據標註(Data Annotation)原則
3. 讓 AI 人工智慧成為組織的共同語言,會更容易成功

企業都想做 AI,但實際上沒那麼簡單

根據《台灣人工智慧學校 AI Academy Taiwan》2019 年針對台灣各大產業 1,095 位業界校友的調查統計,成功導入 AI 人工智慧的台灣企業僅占 20%。放眼國際,許多全球知名企業的 AI 專案也慘遭滑鐵盧:

Google 在泰國落地測試智慧醫療失敗,拖慢醫療流程;美國杜克大學發布的 PULSE 演算法誤將歐巴馬的頭像還原為白人,引發種族歧視爭議。

在日本,軟銀(Softbank)社長孫正義原本打算以 AI 機器人取代銷售人員,沒想到 AI 機器人無法應付實際場域的複雜性,計畫負責人只好承認失敗:「我們把機器學習(Machine Learning)想得太簡單了」。

AI 專案難實際執行,問題出在哪?

若水經手過台灣、日本超過 200 個的 AI 數據處理專案,從橫跨各大產業領域的專案經驗,整理出企業 AI 之所以無法順利落地的四大原因。

1. AI 模型訓練過程中沒有加入實際場域的數據

無論是剛導入 AI 而產生數據處理需求的新手企業,還是已有 AI 專案經驗、為了 retrain 模型再度找上若水的老手企業,都曾經在同一個地方卡關:AI 數據標註品質有做到位,但 AI 模型卻無法應用落地

為什麼?

原因在於,客戶並未以「實際場景」的數據來進行 AI 模型訓練。

現在市面上有許多開放資料集(Open Dataset)或是免費的商用網路圖片,企業通常會優先使用這些免費資源進行 AI 數據標註(Data Annotation)讓機器學習,但是放到實際場域測試後,經常發現 AI 模型成效不佳,無法適用於實際場景,最終還是需要回過頭再進行第二次模型訓練(Model Training)。

因此 在 AI 專案開始前,建議企業首先需要在內部建立數據資料流(Data Pipeline),而在收集數據時,不只使用開放資料集(Open Dataset),也須確保有使用符合實際應用場景的數據來訓練 AI 模型,全盤考量數據類型、角度等多元性,避免機器學習偏誤

2. AI 數據標註原則定義不夠客觀

與企業工程師對接 AI 數據處理需求時,當我們詢問這批人臉辨識(Face Recognition)的 AI 數據標註的原則是什麼,常常會接到諸如此類的回答:「頭太小的話,就不要標註數據」。

一般人的邏輯覺得很合理的事情,對於機器學習(Machine Learning)來說卻是一大挑戰。 機器學習需要知道的是趨近「絕對客觀」的原則 ,例如,所謂的頭太大、太小,換算成具體數值會是幾乘幾大小的 pixel?如果圖片背景融色或模糊,也需要標註起來嗎?

一旦 AI 數據標註原則不夠客觀,AI 模型很容易隨著人的「主觀認定」來學習,當專案換了一位工程師,機器學習出來的效果可能也會跟著變 。在我們的經驗,原則的訂定最好透過「對話」,藉由反覆詰問,才能加快釐清目標。有了歸納、定義出客觀的 AI 數據標註原則。就會加快模型學習(Model Learning)成效。

為了清楚定義圖片融色或模糊的問題,我們採用國際照明委員會(International Commission on Illumination)訂定的 Delta E 標準,和影像(圖像)品質評估標準 BRISQUE,和客戶確認彼此認知是否一致。

根據國際標準,人的肉眼能分辨得出來的色差,至少會在 Delta E 值 2 以上。所以,當一張影像測出來 Delta E 值小於 2,就表示這張圖的融色程度太高,無法標註。

假如客戶希望「太模糊的圖片不要標註」,團隊也會根據 BRISQUE(影像品質評估標準)的標準,輸出不同模糊指數的圖片,請客戶確認所謂的模糊,具體來說是 70% 還是 80%。

3. AI 模型訓練(Model Training)沒有循序漸進

以肢體行為辨識(Posture Estimation)為例,Coco Dataset 從一開始只辨識人體 7 大主要關鍵點(Key Point),後來逐步發展成 25 點,甚至快 40 點,有些客戶會希望若水 AI 團隊可以一次就標註 40 個關鍵點,直接拿去機器學習(Machine Learning)。

說起來,機器學習和教小孩很像,一下子給太多的特徵點(Feature Points)反而會「揠苗助長」,導致 AI 模型學到最後分不清楚自己到底在學習什麼。我們也遇過有些客戶,一開始想用難度較高的 Segmentation 方式讓模型學習人的行為,但是人的行為百百種、語意切割(Segmentation)的變異度也高,就比較難學得好。

當這些客戶再回頭來找若水,通常會比較循序漸進,從小地方開始逐步改進 AI 模型。

4. 缺乏管理層的理解與支持

AI 熱潮讓許多企業趨之若鶩,然而 AI 要能夠順利落地,除了上述三項實務建議,企業管理層對於 AI 的認知和支持更是一大關鍵。

許多台灣企業的 AI 數位轉型主導者,可能是傳統公司裡面有豐富資歷的 CTO 技術長或管理階層,對於 AI 人工智慧這個全新領域的概念,比較缺乏深度的理解,也沒有類似 AI 模型訓練和測試的相關經驗,從上述 4 個原因去追尋難以落地的根源,或許能有所助益。

(本文經合作夥伴 若水 AI Blog 授權轉載,並同意 TechOrange 編寫導讀與修訂標題,原文標題為 〈AI 專案一直卡關,為什麼?〉;首圖來源:若水國際。)

你可能會有興趣


混合辦公蔚為風潮,企業 IT 防疫你做了嗎?

同事們不斷回報 Wi-Fi 網路連線、資訊存取等問題嗎? 立即斬斷這些疑難雜症,全公司的連線體驗一次超進化,還可獲得 2021 雲端網管黃金白皮書 >> 進入測驗

點關鍵字看更多相關文章: