如何打造一個「頂級數據科學團隊」? LinkedIn:狂用 A/B Test 就對了!

【我們為什麼挑選這篇文章】LinkedIn 於 2003 年成立,旨在為用戶建立商業世界的連結,截至去年最新的數據資料顯示,LinkedIn 在全球超過 200 個國家已累積 6.45 億的使用人口,面對龐大的用戶數據,LinkedIn 的「數據科學團隊」如何提供給用戶最有價值的資訊?(責任編輯:賴佩萱)

定下「頂級數據科學團隊」這個研究話題時,我們第一時間想到了領英(LinkedIn)。

2008 年,正是在這家公司,DJ Patil 建立了全球首個真正意義上的「數據科學團隊」,並開始用「數據科學家」(Data Scientist)這個詞來描述這些 Data man 們的工作性質。

在這之後,「數據科學家」開始被譽為 21 世紀最性感的工作,也成為全球技術精英們近年來最理想的職位之一。

儘管已經過去了十多年,但當我們請 LinkedIn 全球數據科學團隊負責人許亞給數據科學團隊下個定義時,她還是表示,這不容易。

全球數據科學團隊負責人:許亞

領英全球數據科學團隊負責人許亞

的確,儘管數據科學在學術領域的概念 50 多年前就有了,但作為職業,相比業內更多成熟的團隊和路徑,這依然是個相對很新的概念。

不同公司和團隊領導人對於「數據科學團隊」的定義範疇大相徑庭:

從時間維度來看,當年研發出 Hadoop、Kafka 的人會稱自己是數據科學家,但是現在這些大數據底層技術都變成了偏基礎設施的內容,在狹義概念上,已經不再屬於數據科學團隊的範圍。

隨著這個領域囊括的範圍越來越多樣,數據對於每家公司的重要性也都只增不減,數據科學的「嵌入」性越來越高、邊界也越來越模糊。

儘管如此,談及 LinkedIn 這些年「數據科學團隊」的定位和建設,許亞依然有自己非常清晰的思考。「對於 LinkedIn 來說,數據科學團隊的整體趨勢更加走向專業化,他們的職責不再是建立數據基礎設施或平台,而是怎樣去使用數據科學和工程來最大化數據的價值。」

這是許亞對數據科學團隊任務的要求。

如何讓數據價值最大化?從定義工作範圍開始

那麼到底如何讓數據的價值最大化呢?從團隊運作方式、商業影響力設定和社會責任等角度,許亞給出了 LinkedIn 的答案:「嵌入式工作,中心化管理」,數據科學團隊更加「專業化」、「工程化」。

和多數網路服務公司一樣,LinkedIn 的數據科學團隊規模也在近幾年飛速增長。許亞表示,僅是近兩年來,LinkedIn 的數據團隊擴張了近一倍,從 150 人增加到目前的 300 多人。

許亞提到的數據團隊是指 LinkedIn 中心化的數據科學部門。 如果用一句話來概括 LinkedIn 的中心數據科學團隊的運作方式,那就是「嵌入式工作,中心化管理」

和國內不少互聯網公司將數據分析師歸屬於業務 BU、向業務主管匯報不同,LinkedIn 的數據科學團隊成員由許亞的中心部門統籌。雖然在項目工作上,數據科學家們依然會在工位分佈和職能上與業務部門緊密聯繫,但是從職級從屬上,都直接向許亞匯報,不同領域的數據科學家在工作中會有交集,還會一起開會。

其實 LinkedIn 的數據科學團隊的設置也不是一開始就如此,隨著 LinkedIn 數據科學團隊定位的變化,數據科學團隊也從最初的產品組,移到了現在的工程大組。

數據科學家定位轉變:從「做」產品,到「開發」產品

值得一提的是,目前 LinkedIn 的數據科學和人工智能團隊都在同一個大組裡,許亞表示,數據團隊和人工智能/工程團隊是緊密相連的。

這也從一個側面說明,隨著對數據科學團隊的需求逐漸增大,數據團隊的工作會越來越「工程化」。跑的數據會越來越多,對工程團隊的需求也會越來越大,需要對工程團隊越來越多的要求和技術定位。

近年來,各大公司越來越意識到數據的重要性,已有數據科學涉入領域在進一步擴張。 數據團隊之前最常被用到的部門是市場和產品,但是基於 LinkedIn 本身的數據基因,近幾年的一些產品也對之前沒有用到數據的地方做了數據驅動的嘗試

例如,與架構工程部門合作的數據團隊會去衡量工程架構的建設是否有效率:每年跑大數據的硬件設備花費很高,怎麼樣在時間上做規劃,讓硬件/GPU 等更有效的發揮價值。

LinkedIn 將數據團隊做明確分工:工程、演算法、業務

在人員構成上,和十年前相比,LinkedIn 的數據團隊也更加專業化了,底層架構人員也從數據科學團隊分離了出來。

目前 LinkedIn 的數據科學團隊也根據員工不同的專業領域設立了三個工作方向:

  1. 工程專家 :可以很有效的建立起數據管道(data pipeline)和數據流(data flow)
  2. 演算專家 :在預測、算法領域的技術咖
  3. 業務專家 :有很強的業務屬性,將數據見解和公司戰略結合起來

由於工作側重不同,在管理的過程中也會有意的區分這三類數據科學家,並且保持各類員工的競爭力。

許亞提到, 她的團隊內部更多是「自下而上」的工作文化。她不會給團隊指派任務,因為每個組會自覺的告訴許亞他們想達到什麼樣的目標 。對於一些大的項目​​,一般需要跨部門合作,各部門的領導達成共識,分配資源來一起實現這個目標,是自上而下和自下而上的結合。

如何量化數據團隊的工作?LinkedIn 採用三大 KPI

相對複雜的構成和與業務團隊的緊密性,給數據團隊設定商業影響力和發展路線不是一件容易的事。

許亞表示,兩年前她接手 LinkedIn 數據團隊後做的第一件事就是擬定了團隊成功的三要素。雖然數據團隊的價值有時候很難量化,但是有三個指標可以作為探討的基礎。在數據團隊內部不同組可能會有不同的側重,但對大部分組來說這三個因素都很重要。

1. 數據易得性和工作效率

數據易得性,指的是當外界需要數據的時候,獲得這些數據的難易程度; 工作效率 ,指的是一個人的工作是否可以提升整個團隊的工作效率。

許亞表示,數據科學家之前被人詬病過於追求新鮮感,喜歡挑戰高難度問題,但做完 MVP(Minimum Viable Product)後沒有維護迭代的習慣,永遠都在追逐下一個新難題。其實數據團隊擁有許多數據資源,比如原始數據,指標數據,數據模型,數據可視化。

當外界需要這些資源時,如何保證這些需求能夠隨時被滿足? 軟體開發有一系列衡量數據獲取難易程度的指標,比如 SLA(Service-Level Agreement)的達標率就是一個很好的量化指標。

有些數據科學家做了一個很不錯的分析,但是不太關心怎麼把這個分析過程自動化,所以每次有人提需求的時候就需要有人再手動跑一次模型,其實都是重複勞動,不同的人在做相同的重複勞動。如果這個分析實現了自動化,大家都可以享用,其他人就不需要花太多時間精力在這個模型上,整個數據科學團隊的集體工作效率都提高了。

以前許亞的團隊也缺少這種分析自動化產品化的意識,所以她把這個設置為成功三要素之一,強調這種意識的重要性。

2. 戰略化思維

戰略化思維,指的是數據分析結果對公司重要戰略性決策是否有指導作用。

許亞的數據團隊和公司很多高層會打交道,因為他們團隊有一個很重要的職責就是透過數據來確保公司重要決策的大方向是準確的。比如他們需要了解用戶在疫情期間是如何使用 LinkedIn 服務,如何通過 LinkedIn 的產品獲取價值的。

許亞認為 在疫情後,用戶的行為多少會發生一些不可逆轉的改變,數據可以幫助團隊更好地去學習用戶行為變化,從而在戰略上指引公司對哪些領域進行重點投資 ,而不管是產品開發還是市場戰略的決定,都需要依靠數據。

3. 直接商業影響力

直接商業影響力(Direct Business Impact),指的是工作成果對公司商業目標的直接影響力。

每個部門的工作開展是和公司要達到的大目標息息相關的,LinkedIn 有公司層面的四個核心指標, 數據部門在計劃工作的時候,需要考慮如何對公司的商業目標產生積極影響。

產品/功能推出後,LinkedIn 靠 A/B Test 分析使用者體驗

我們都知道,企業在做產品/功能測試時一般都會用到 A/B test ,即分為兩組用戶,一組對照組,一組實驗組。對照組採用已有的產品或功能,實驗組採用新功能。要做的是找到他們的不同反應,並以此確定哪個版本更好。

A/B test 能對大範圍的事情進行測試,例如亞馬遜對個性化推薦進行 A/B test 後,發現個推顯著提升收益;谷歌在對搜索廣告進行排名時也用到了 A/B test。

那麼對於 LinkedIn 來說,A/B Test 在 LinkedIn 的產品設計中又扮演著什麼角色呢?如何影響產品決策呢?

許亞和 Ron Kohavi、Diane Tang 共同寫的一本書關於 A/B Test 的書籍《Trustworthy Online Controlled Experiments: A Practical Guide to A/B Testing》,在今年 4 月出版,書裡有很多關於 A /B Test 的例子

基本上我們在 LinkedIn 網站上能感知到的更新,LinkedIn 團隊都會做 A/B Test,有些是前端的改變,有些是後端系統的調整。當你打開 LinkedIn APP,從搜索欄,搜索引擎算法,底部導航,到頁面文字大小,這些都是經過 A/B Test 的。

LinkedIn 的產品文化以用戶為主導,LinkedIn 自己不會去假設用戶喜好,一切都通過數據來說話,而不是靠誰的直覺。 除了看得到的東西,後端用戶看不到的,LinkedIn 也會進行 A/B Test。比如打開 App 要加載內容,需要從後端系統裡獲取數據,每次獲取 20 條數據還是 100 條數據,這個決策就涉及到平衡與取捨,獲取數據越多,頁面加載時間越長;獲取數據越少,用戶瀏覽的時候就需要頻繁刷新。所以到底一次獲取多少數據,LinkedIn 還是通過 A/B Test 來決定。

還有一個簡單的例子,當 LinkedIn 對一個數據中心的開關做決定時也依靠 A/B Test,比如一個用戶發起數據請求,這個請求該發送到哪個數據中心來處理呢?這種情況下用戶到數據中心的距離就是一個很重要的考慮因素,最終 LinkedIn 會通過做 A/B Test 來選擇最優化的基礎設施方案。

雖然數據團隊是 A/B Test 方面的專家,在這方面更有經驗,但因為 LinkedIn 有非常完備的 A/B Test 平台,可以解決大部分實驗需求,包括實驗設計、實施和分析,所以數據團隊不需要介入到每個 A/B Test。

這對推廣實驗文化和數據文化很有幫助,因為大家都可以去做實驗,享受數據和實驗帶來的好處。LinkedIn 內部每天大概有 100 個新實驗在進行,數據團隊無法關注每個實驗,但是會集中關注一些重要的實驗,深入參與到研究和分析工作中。

在 LinkedIn 以數據為主導的文化浸染下,長遠來看所有人都受益於這樣科學的決策機制,因為有 A/B Test 的文化,所以可以跳過爭論,直接做個 A/B Test 就見分曉了。整個過程簡單公正,方案落選的組也可以通過這個機會學習到一些關於用戶的新知識。

A/B Test 提倡數學引導的創新,這種創新不取決於誰的職位更高,因此任何團隊都可以放心大膽地去做測試來發掘新點子。

LinkedIn 做為社群的一份子,如何確保平台公平公正?

在許亞看來,維護公平是一個很有挑戰的課題,因為你很難明確定義公平。

「當我們在說公平的時候,我們在說公平的機會?公平的結果?還是公平的待遇?我之前看過一個有意思的問題,給三個不同高矮的人提供凳子,在公平原則下,你該給他們提供同樣高度的凳子?還是提供不同高度的凳子讓他們坐上去之後一樣高呢?我很難說這個問題有一個絕對正確的答案。」

LinkedIn 對公平的定義是,擁有同等才能的兩個人,應該獲得同等的職業機會, 而不受到種族或者自身人脈的影響 。過去兩年時間 LinkedIn 做了很多努力來解決公平問題,取得了不錯的成果。

首先,LinkedIn 很重視可量化、可測量的指標,因為如果一個問題沒有被數據抓取到,就很難注意到。

例如,每次 LinkedIn 發布新產品,都需要通過量化的指標來測量這個新產品對用戶帶來影響是否公平。一開始 LinkedIn 的測量指標比較粗線條,他們會看這個產品平均下來對用戶是否有積極影響,但如果細看數據,有可能這個產品只對一部分人有益,但會損害另一部分人的利益。因此,後來 LinkedIn 採用了一個指數來衡量是否在一個群體內無意間引入了不公平因素,也就是對每個新產品,LinkedIn 想知道其帶來的提升是否是公平的。

其次,LinkedIn 關注現有平台上是否存在公平問題的盲點。例如一個以男性為主體的數據集,訓練出來的模型就更傾向於男性,這是一個隱蔽的不公平點。很多獵頭和 HR 用 LinkedIn 產品來招人,如果算法推薦的候選人都是男性,女性就失去了公平的競爭機會。

大概一年前左右 LinkedIn 推出了一個代表性指數來衡量推薦結果對整體數據集的代表性。比如所有可能候選人的男女比例是 1:1,那 LinkedIn 給獵頭推送的前 100 位候選人的男女比例也應該是 1:1。有了這些量化指標,LinkedIn 可以更好地規範和規避不公平的舉措。

許亞還給我們舉了一個例子。之前 LinkedIn 有一個內推功能,當某個人想申請 Google 的工作,會收到提示說我的一位好友在 Google 工作,我可以找他要個內推。

上線初期,LinkedIn 內部對這個新功能很滿意,因為可以幫助那些有廣泛人脈資源的人更快找到工作,後來 LinkedIn 意識到這個功能會讓那些沒有人脈資源的人更難找到工作,所以就關閉了這個功能。取而代之的是 LinkedIn  推出了一個「新工作快速提示功能」,一個新職位剛發佈出來,LinkedIn 會立刻給所有對此類職位感興趣的用戶推送提示 。這個功能不僅能幫助所有用戶更快找到工作,對那些關係少的人尤其有幫助,因為他們的消息相對更閉塞一點,所以這個功能能讓更多的人受益。

最近 LinkedIn 也開源了這套技術,希望能助力其他公司去構建一個更公平的社會環境。

LinkedIn 如何管理用戶的隱私數據?

隨著近年來數據洩漏事件頻頻爆發,數據隱私和安全問題被推上了風口浪尖。許亞也跟大數據文摘聊了聊 LinkedIn 在保護用戶的數據隱私方面都做了什麼。

LinkedIn 全球有超過 6.9 億用戶和 5000 萬家企業,LinkedIn 的願景是為全球勞動力市場中的每一位創造經濟機會,通過將所有在 LinkedIn 平台發生的行為數據可視化,進而打造全球「經濟圖譜」。因此用戶數據對 LinkedIn 至關重要,如果沒有用戶的信任,LinkedIn 就沒有辦法去達到他們的願景和使命。

所以在 GDPR(General Data Protection Regulation)這些開始之前,LinkedIn 在保護用戶隱私上已經有了很多投資。許亞提到,除了達到規定裡的要求,LinkedIn 也用一些很前沿的技術去確保不洩露隱私,比如現在認為是數據隱私保護的「Gold Standard」—— 差分隱私(Differential Privacy)。

大家經常說到保護隱私,比如說把一些個人訊息隱去了,其他人看不見,我就沒有隱私洩露了,其實不是這樣的。

差分隱私只是一種保證。假設你的訊息在一堆數據裡面,如果把這些訊息刪掉,再運行同樣的一些算法,從數據當中得到的兩個結果都是一樣的。相當於你的數據在或者不在這個數據庫裡面,最後對於得到的訊息沒有影響。這樣用戶就不需要擔心他們的數據隱私被洩露。

LinkedIn 三年前就開始針對數據隱私問題進行一些重要的研究,同時也有一些比較成功的應用,例如最近一個針對廣告商的產品,客戶想要用 LinkedIn 的 API 去獲得一些訊息,比如用戶互動量前十的文章,像這樣一些集合的訊息,LinkedIn 也用差分隱私去確保用戶的訊息不洩露。

LinkedIn 守則:「取之數據,用之數據」

最後,從整個公司文化上面來說,許亞透露,除了達到數據保護條例的一些要求,LinkedIn 也用到了一些很前端的技術,來確保用戶的隱私不被洩露。另外,LinkedIn 也十分重視在數據分享方面的問題,並表示會對此加強技術防護。

採訪過程中,許亞多次提到 LinkedIn 的社會責任。今年,一場突如其來的疫情,全球的勞動力市場都受到了不同程度的影響,不論是就業還是工作方式都迎來了一種新常態,LinkedIn 利用數據優勢,實時展現勞動力市場的趨勢變化,幫助個人更好地應對當下的不確定性。在分析數據時,LinkedIn 還發現不同分組內的用戶受到的影響程度不一樣,比如剛入職場的新人會受到更大的衝擊,疫情對女性的負面影響可能大於男性。

通過數據觀察到這些問題後,LinkedIn 數據科學團隊和業務部門迅速溝通,快速響應,針對各個市場及時提供了一系列有針對性的服務來幫助這些人,讓每個人都能在自己能力範圍內獲得平等的工作機會。

「這是 LinkedIn 作為一個職場社交平台的社會責任。」

(本文經合作夥伴 大數據文摘 授權轉載,並同意 TechOrange 編寫導讀與修訂標題,原文標題為 〈數據科學家”或許不再性感,但“數據團隊”的產業化才剛開始 〉。)

你可能會有興趣


科技報橘 LinkedIn 上線!

最新科技產業動態、技術新突破、專業職能技巧提升 ....... 鎖定 TO  LinkedIn 專業品牌,提升職能與產業 Know-how,躋身產業菁英之列 https://www.linkedin.com/showcase/techorange

點關鍵字看更多相關文章: