【陳昇瑋談大數據】為什麼很多企業大數據應用的效益,沒有專家說的那麼神?

Screen Shot 2016-06-27 at 6.15.13 PM

【為什麼我們要挑選這篇文章】不論是「大數據」、「物聯網」都是近來產業熱門關鍵字,但它們都有個共通問題:講起來很熱,但真正能做出點成績的很少。

其實資料的真正價值必須要靠有效分析、靈活運用,而不是盲目投注資源期待馬上獲利。這,其實是許多台灣企業應該改正的心態。

本文作者陳昇瑋為中央研究院資訊科學研究所研究員、台灣資料科學協會理事長,以下為作者對於大數據產業的深刻觀察。(By 責任編輯鄒昀倢)

近來大數據研討會不勝枚舉,無論是從上而下的期待,以及從下而上的推動力量都很強勁,已看到許多政府組織、民間企業及非營利機構躍躍欲試,欲積極將大數據技術應用在業務的各種層面。這個節骨眼上,我們得解決所謂大數據應用的最後一哩路問題,先了解大數據應用究竟可以作哪些事情,才不會投入資源之後,卻得不到真正的效益。

通常認知上,導入大數據技術有三種選擇, 委外、購置完整解決方案 (total solution),或自行組織資料團隊 進行研發。我想指出的是, 若要將資料分析的價值完全發揮,恐怕並沒有完整解決方案可以導入 ;所以這是二選一,而非三選一的問題。因為,數據分析不是買一套升級系統,而是在經營管理上導入新的工作流程,不只是軟體系統面,組織面也會加入新的職能分工,同時高階決策者的思維都要跟著轉變。這是接入全新的基因,是整家公司的進化,不可能求短效。

  • 大數據分析能作的事情,比你想得到的更多

讓我們來看看運用資料來進行分析的標準步驟有哪些: 收集、儲存、處理、檢視、分析、效能評估、及上線 。其中,分析」是最關鍵的步驟,因為透過分析,決定能否從資料裡頭淬取具體價值 。資料科學家在進行「分析」時,常見的目的有五種:情勢評估、推薦、預測、行為解讀、及決策最佳化

如果想透過大數據分析的技術導入,獲得有價值的結果,就必須了解這五個目的的內涵是什麼。很多企業花大錢導入大數據分析卻沒有成效,很多時候是因為在一開始就沒弄清楚,自己到底想要透過數據分析達到哪些經營上的目標。

  1. 「情勢評估」指的是利用資料分析,來評估組織/個人/產品/決策的 績效 。例如,評估某個買一送一的行銷活動是否真的是帶來買氣?而買氣是一時的還是長久的?或是比較銀行分行 / ATM 的績效,是否值得此分行或 ATM 設在精華地段等等。
  2. 「推薦」是基於歷史資料,將廣告或商品推薦給潛在消費者。例如,什麼商品應該放在商店的入口處,又什麼商品應該放在結帳處,最能增加購買率。另外也可做個人化的推薦,例如在網路商店選了五件商品後,自動推薦最可能購買的其它商品給該消費者。
  3. 「預測」同樣是根據歷史資料,但目的是要預測,預測未來的表現或需求。例如,今天某家分店的御飯團要進貨幾個能夠賣得剛好?有時,要預測的是某些行為的後果,例如,某行銷計畫可以帶來多少新的來客?或是,派某個籃球員上場後他可能會得幾分?
  4. 「行為解讀」指的是根據資料來解讀個體/群體行為背後的動機。例如,為什麼某款式的衣服粉色系較好賣,而另一款衣服偏偏要深色才受歡迎。行為解釋有助於未來的策略制定
  5. 最後,「決策最佳化」是運用機器學習等演算法,由程式自動建議產生參數,例如,自動決定貨物的最佳運送路線,或者新的餐廳分店應該開在哪個地點等等。

上面說的這些分析目的,在業界已經可以找到很多例子。多數電信、金融及電商業者會導入商業智慧系統來做「情勢評估」,以及導入推薦系統來做商品「推薦」、導購及精準行銷。情勢評估及推薦系統因為需求明確,故可以同一技術核心,配合客製化提供各場域的使用。 所以,許多企業會優先導入這兩類型的資料應用;可惜的是,多數機構也就停留在此階段,以為這就是資料分析能做的事

  • 花大錢做了資料分析基礎建設,別浪費真正的價值

必須要說,「預測」、「行為解讀」及「決策最佳化」會是大數據應用更有價值之處 光是能夠評估情勢及做行銷還是不足的,有效的資料分析,絕對可以輔助甚至替代人類進行更佳的判斷及決策。但此三類分析較為複雜,其資料輸入及輸出會依情勢有極大的差別,所以沒有現成的解決方案。例如,預測御飯團會賣幾個、預測一畝田半年後的收成,以及預測走某條路徑到達目的地的時間花費,所需要的資料、使用的演算法,及檢驗成果的方式,截然不同。因為無法歸納出適用於多數情況的最大公約數,自然就沒有解決方案可以一體適用各種情境。

台灣的產業界習慣等待系統業或顧問業者提供解決方案, 在沒有解決方案的情況下,以為大數據應用就等於商業智慧及行銷推薦系統 。其實很多企業已蒐集資料,建置資料基礎建設,卻因為無解決方案的原因而停留在這一步,有比這更可惜的事情嗎?

所以,回到本文的主旨,為什麼很多企業大數據應用的效益,沒有專家說的那麼神?因為您可能只做了最基礎的最常見的兩種資料應用,更深入的「預測」、「行為解讀」及「決策最佳化」還沒有做到,當然一點也神不起來。

(本文經專欄作者陳昇瑋授權刊登,並同意由 TechOrange 編寫導讀與修訂標題,原文標題為 〈大數據應用的最後一哩路 〉。首圖來源:KamiPhuc, CC licensed)

點關鍵字看更多相關文章: