眾所皆知, Uber 向來很依靠數據資料,共乘服務就是建立在分析之上,並鼓勵乘客與司機為彼此評分。但 Uber 裡的數據科學家不只研究服務核心的功能而已,他們常常鑽研一些乘客的細節,而且能獲得意想不到的收穫。
利用貝氏機率, Uber 的數據小組能夠以 75% 的機率準確預估乘客的目的地。他們建立了一套演算法專門用來找出特定目的地,不只是大略位置,而是準確的地址。接下來,他們拿來在 3,000 名不具名 Uber 乘客身上測試。
Uber 的 Ren Lu 為我們公開他們的公式是如何運作的:
「我們取得 3000 名不同乘客在 2014 年前於舊金山的搭乘路線,為了隱私而保持不具名。每趟旅程都被乘客『標註』:當向 Uber 叫車時填寫目的地。我們假設這代表他們想去真正的目的地,並且創造了一個『黃金標準』,以此來與我們模型的預測做比較。」
Uber 的公式採取三項變數:使用者的歷史紀錄、其他使用者的行為,與特地區域的總人口。
公式在數學上融合了所有這些「先驗機率」(統計用語)與其他因素來判斷一個用戶會去哪間酒吧或街上的咖啡廳。這對如紐約或舊金山這種人口稠密的都市來說並不容易,也是傳統反向地理解析的座標或公開位置資料庫所做不到的原因。
這個人過去做了什麼?他們常常造訪哪間特定酒吧? Uber 的使用者都去哪裡?這些人口大多是做什麼的?這些都是演算法會問的基本問題。
最後,它會智慧地計算其他因素,諸如一天中的時段(人們通常不會在早上 11 點去酒吧)、距離(人們通常不會跑太遠)、甚至是目的地的郵遞區號(人們基本上不會喜歡走路,所以下車的地方與真正的目的地的步行距離不會太遠)。
這為什麼重要?就像其他的現代化公司一樣, Uber 為了更加了解客戶,還需要多做些努力。 Lu 寫道:「我們的搭乘模型是 Uber 數據小組為了改善搭乘經驗所做的努力。這項計畫的延伸包括建構更複雜的先驗機率與可能性。
換句話說, Uber 想預測的不只是你的最終目的地,有了這些實驗與模型, Uber 的預測能力只會隨著時間越來越好,你的搭乘經驗應該也會越來越好。
(資料來源:FastCompany;圖片來源:MattHurst, CC Licensed)