【我們為什麼挑選這篇文章】  數據分析該如何迅速幫助企業績效提升?曾任阿里巴巴集團副總裁、數據委員會會長,現任紅杉資本中國基金任專家合伙人 車品覺,第一手分享他在阿里巴巴的實戰經驗。談及自己如何完成馬雲指派的「不可能的任務」–將幾十人的營運、行銷部門全數自動化?讀來非常精彩!(責任編輯:劉庭瑋)

一次,曾鳴特地找到我,對我說:「品覺,作為阿里BI(商業智能)部門的老大,你的任務就是努力將 BI 部門消滅掉。」我當時真的蒙了。作為BI 部門的老大,你要我努力將 BI 部門消滅掉?

後來我才明白,這正是他的戰略思考,終局的想法是我們要將數據做得越來越便捷,未來根本不應該有集中式的 BI 部門。

數據應該回歸本身,讓所有人都可以分析,人人都可以成為數據分析師。不是說沒有BI 部門,而是說未來某天數據分析技能已經被每個業務人員掌握。即便從一個數據分析師的角度看,曾鳴的決定也頗具遠見和創造性。

大數據下半場,路在何方

如果我對你說, 2010 年時,阿里的數據化運營也是摸著石頭過河,最初的數據分析產品還不到 50 個用戶,業務方對數據化管理一點也不感冒,大家可不要感到奇怪。

到了2015 年,阿里的數據平台用戶已經超過 8000 人。在整個進程中,我們從建立一支精銳的數據分析團隊,發展到能開發一個全公司的業務和工程人員都能使用的數據平台。數據戰略從數據化運營,轉移到了運營數據,並協調不同事業群數據共享、共創及標準化,同時又要保持業務的獨立及積極性。

6 年中讓我記憶最深刻的事情,是聚划算一個部門的自動化項目。馬雲要求我們用人工智慧和大數據去取代一個近百人的部門,而且業務增長率不能下降,難度可想而知。經過這個項目的錘煉,我一直在思考,數字經濟引擎的形態是什麼樣的,以及如何搭建新科技下的數字經濟引擎,也深深感受到,未來每家公司都將是「大數據+ 人工智能」公司,這在未來將不再是一個夢想。

全域大數據時代已經到來

我們應該清楚地認識到, 商業基礎正因眾多終端帶來的全域大數據而發生著改變。它帶來的變革不限於數據本身,還有思考社會和商業模式將如何被改變的全新角度。在全域大數據的大潮之下,每家公司都要重新思考,當互聯網的場景從單一的桌面轉移到多源、多終端時,不僅會帶來豐富的空間維度,還會增加更多從前匪夷所思的新場景所產生的數據。

這麼多零散的數據和維度疊加在一起,下一難題就變成瞭如何保證有效地存儲、更新、辨識和連接這些數據,並靈活地使用它們。在我看來,開啟「上帝視角」是未來趨勢,這無疑是激動人心的。

在數據科學成為炙手可熱的話題的兩年後,我發現我被企業管理層問得最多的問題是:如何確保有足夠多的數據來發展人工智能?需要儲備什麼樣的人才?我認為,大家都忽略了大數據能力的根源來自連接,而連接的基礎是數據的流通和標準化。

以阿里為例,數據打通絕對不是馬雲一聲令下就可以解決的問題。從 2014 年開始,阿里管理層數次要求各業務部門(包括支付寶)無條件地將數據互通,然而換來的終究也只是表面的打通而已。手下人的陽奉陰違也是花招不少。比如,我有數據,但是我不告訴你有什麼;就算你知道我有數據,但我不能保證提供給你的是有質量的數據。因為沒有業務關聯,對方很難長期、義務地配合你,所以就更不會把新增的業務數據和盤托出了。我認為,問題的關鍵,在於互惠互利。只有你找到真正的痛點,才能將企業數據循環打通。

互惠互利,打通企業數據循環

在這個人工智能蓬勃發展的時代,數據的增量比存量多。多變的業務場景也意味著需要敏捷的數據更新(包括結構)。在你使用數據時,數據本身可能早就出現了定義上的變化, Data broken(數據斷裂)指的就是數據已經不能反映當前現實。因此,以這些斷裂數據為基礎的任何人工智能算法,都會相應地產生偏差。

這種事情表明了什麼?所有的數據流通必須建立在一個永恆不變的道理上:互惠互利,否則你無法做到對數據進行適時的修正。雖然說高層掌握著權力,但要發揮出整體的數據戰略,只靠從上而下的命令是不可能的,還必須依靠從下而上的共建共創。只有這樣,才能實現合力而成的多源異構大數據。所以我一直強調: 大數據是自利、利他的成品。

在阿里時,我是怎麼處理部門間數據互通這件事情的呢?很簡單,首先是找出大家有意願共用的部分,我稱其為企業內的公共數據,然後安排資源把這一部分先建設起來。選擇公共數據也有一定的技巧,簡單歸類就是:各部門已經在高頻率但低效率的單線流通的數據,被野蠻重複複製到各部門的相同數據,大家都有意願首先標準化的數據。當這些帶有公共性質的核心數據建立起來之後,大家就能更容易地感受到數據高質量流通的意義及好處。要保證這些數據的質量和新鮮度也相對變得容易了。

之後,我採取的是共創共贏策略。我將我們部門所有的、我認為很有可能成為公共數據的數據,全部都放在大家眼前。如果其他部門有人要使用的話,這些數據可謂招之即來。當然,前提是這些資源都是我先開發完的。當他們所有人都開始使用這些數據時,我就可以輸出技術及標準,去幫助其他部門完成更大範圍的數據打通。

加入支付寶後,我面對的第一件事就是著手組建支付寶數據分析師團隊。2010 年的支付寶,大部分業務團隊對數據團隊都不太滿意,而且高層對數據能產生的價值也沒有太多認識。同時,由於當時數據負責人調職,導致支付寶的數據分析和數據技術部門被分開管理。

面對數據分析和技術團隊的目標不一致,業務部門對為什麼要使用數據以及如何善用數據充滿疑問,甚至有人認為數據分析僅是門面功夫。但我堅持數據分析產品化路線,相信數據分析的工作最終必須落地在產品上。

從解放集中式的數據分析師團隊到「人人都是分析師」的泛化過程中,我們的業務部門自己就可以便捷地使用工具解決問題。經過一年多的努力,有一天CEO (彭蕾)走到我辦公室對我說:「你知道嗎?你們做的產品讓我覺得很爽,我很喜歡這個產品。」看到同事和老闆對產品的支持,讓我肯定自己在支付寶走的這條路是正確的。如果讓我總結這其中的精髓,我的秘訣是: 數據分析也要講究用戶體驗。

運營自動化,是大勢所趨

當我 2010 年進入阿里時,我們的數據團隊會利用數據去做好報告,以支持業務部門,讓業務部門可以更好地把握其業務。數據團隊繼而在 2012 年開發了很多數據產品,將重複的業務分析需求產品化,把數據能力泛化到一線團隊。

幾年間,大數據距離成為業務的核心就僅差一步。直到谷歌的無人駕駛汽車項目出現,我忽然如夢初醒,這不就是業務與數據的無縫對接嗎?

問題來了:商業運營的過程能像無人駕駛汽車一樣實現全面的自動化嗎?

2014 年,我接了一個任務,即把阿里某團購業務的運營從幾十個人的團隊完全轉變為自動化(去人化),這項工作需要大量數據、多種算法及 IT 系統的有機結合。在這個過程中,我們要把已知工作流程中的人為決策,轉化為數據驅動的自動化決策(我們稱其為數字經濟引擎)。而決策之間的權衡也是一種算法,決策本身就是一場博弈,越大的場景運營起來毫無疑問就越複雜。後來這個項目按計劃完成了,但實際上棘手的問題並未真正解決。

在這個過程中,我們更體驗到智能/ 自動化所要求的數據質量更高,數據不足的情況更明顯,尤其是外部數據(包括競爭環境)的稀缺更非靠我們一己之力能在短期內解決的。

另外,數據商業引擎的最佳原則是,人為乾預越少,數據回流越順暢。最終,這個項目其實是在妥協中結束的。

最近受阿里前同事的盛情邀請,讓我有機會回杭州看一個智能客服的項目,即用客服機器人取代人工客服。剛一落座,我就問道:「機器人還有多長時間可以完全取代人類?」我很期待作為人工智能應用一線負責人的答案,他明確地表示「5 年」。

他提到,讓客服機器人獨立運作前,首先要做的是惡補客服機器人在沒有足夠數據的情況下的一些智識盲點。短期的改善方法是,他們設置了一個叫「人工智慧培訓師」的新崗位,幫助解決客服機器人數據不足的問題。借用人工智能專家、香港科技大學楊強教授的觀點,客服機器人的好壞,關鍵在於有沒有高質量的數據。令人興奮的是,目前客服機器人(非語音)已經能自動應對 85% 的客戶訪問了。

最後,我想分享,阿里在數據化實踐過程中有三大原則:

  • 相信數據是未來所有業務的核心競爭力。
  • 不在線的數據,不是大數據。
  • 數據的有效使用與高度流通要有互惠互利機制。

只有真正做到這三點,才能讓大數據真正成為企業增長的殺手鐧。

(本文經合作夥伴 36  授權轉載,並同意 TechOrange 編寫導讀與修訂標題,原文標題為 〈都在談商業智能的時代,曾鳴幹掉了自己的BI部門 〉。首圖取自Linguistic Linked Open Data

延伸閱讀

前阿里巴巴數據技術副總裁:第一手大數據實戰分享!如何短時間找到上萬名潛力買家?
資料有看沒有到》台灣資料科學教父:輕忽 Data 力量,電商落後美國 20 年
想成為一名戰鬥力超強數據分析師?讓公司程式白痴聽懂程式碼在幹嘛,保證你立刻成為最強人才
打敗 R 語言,Python 是如何登基成為史上最熱門數據分析語言?