「演算法」如何讓 UPS 每年省下 755 億台幣、Google 營收暴漲 125 倍?

【我們為什麼推薦這本書】數據分析、人工智慧、雲端運算這些都是全球企業正瘋狂學習的技術「演算法」,但究竟演算法有何用處?《指數型組織》 以 Google、Deepmind、Netflix、UPS 等全球著名企業為例,談及他們如何利用數據、演算法造就驚人成績,讀來十分精彩!(責任編輯:劉庭瑋)

2002 年,谷歌的營收不到五億美元。十年後,它的營收暴增 125 倍,每 3 天就創造 5 億美元。 這種驚人的成長,最核心的部分是對網頁的人氣進行排名的 PageRank 演算法──谷歌並不是從人的觀點來衡量哪個網頁比較好,它的演算法只對提供最多點擊的頁面作出回應。

不是只有谷歌這樣,現在全世界幾乎都是根據演算法來運作。從汽車的防鎖死煞車系統,到亞馬遜的推薦引擎;從航空公司的動態定價,到預測下一部好萊塢賣座強片的票房成績;從撰寫新聞貼文,到空中交通管制;從信用卡詐欺偵測,到臉書讓一般用戶看到的 2 %貼文──演算法存在於現代生活中的每個角落。最近麥肯錫估計,在 700 種端對端的銀行流程中 (例如開戶或是取得汽車貸款 ),約有一半都可以完全自動化。電腦逐漸執行越來越複雜的作業。

現在甚至還出現一個名叫  Algorithmia 的市場,在這種開放式演算法市場裡,企業可以尋找可能會讓其資料數據合乎道理的演算法相互匹配。就像  GitHub 一樣 (請見第七章 ),開發人員可以開放自己的程式碼,讓別人加以改進。

有兩種類型的演算法走在新世界的尖端:機器學習 (Machine Learning)和深度學習 (Deep Learning)

Netflix 如何改進影片評分演算法?

機器學習是準確執行未曾見過之新任務的能力,從訓練資料或歷史資料學到的已知屬性做為基礎,並且以預測為根據。重要的開放原始碼範例包括了  Hadoop Cloudera,而機器學習的一個實例透過網飛 (Netflix)出現。2006 年,網飛著手改進電影推薦功能時,它沒有讓這項挑戰僅限於內部員工參與,而是 推出一項百萬美元 (激勵 )競賽,既定目標是將它的電影推薦評分演算法改進 10%。 來自一百八十六個國家的五萬一千名參賽者收到一份包含一百萬項推薦評分的資料集,達成目標的期限是五年。這場競賽在 2009 年 9 月提早結束,共有 44,014 份有效的提交成果,其中有一份達到目標並贏得獎金。

深度學習翹楚: DeepMind 和 Vicarious

深度學習是機器學習之中一個令人興奮的新子集,以神經網路技術為根據。它讓機器能夠在未接觸任何歷史資料或訓練資料之下發現新的型態。這個領域裡的頂尖新創公司包括  DeepMind Vicarious

DeepMind 在 2014 年初由谷歌以五億美元的代價收購,當時  DeepMind 只有十三名員工。

Vicarious 得到來自馬斯克 、貝佐斯 和馬克.祖克伯 的投資資金。推特、百度、微軟和臉書在這個領域也大量投資。深度學習演算法仰賴發現和自我索引,運作方式和嬰兒先學習聲音,再學習字、句、甚至語言的過程非常相似。機器學習在兩年內,從一開始花 3  天時間瀏覽隨機選取的一千萬張  YouTube 影片縮圖,並且開始辨認出「貓」。

再到兩年後,深度學習的能力大幅改進。如今深度學習演算法除了能夠改進語音辨識、創造更有效的搜尋引擎( 庫茲威爾正在谷歌內部進行這項研究) 和識別個別物件以外,還可以偵測出視訊裡的特定情節,甚至以文字描述它們,這一切都不需要人為輸入。深度學習演算法甚至會玩電動遊戲,它會先弄清楚遊戲規則,然後再充分提高效能。

演算法驚人應用:美國快遞巨擘 UPS

UPS 在美國的營運據點擁有五萬五千輛卡車,每天進行一千六百萬次的運送,在線路規劃上很可能會欠缺效率。但是 藉由運用車載資通訊 (telematics)和演算法,該公司每年為司機們省下一億三千六百多萬公里的行程 ,並因此省下 25 億 5 千萬美元的成本。 在醫療、能源和金融服務上的類似應用,意味著大家正進入「我們就是演算法」(Algorithms R US)的世界。

試想一下,我們在過去兩年內所創造的資料量,是人類整個歷史資料量的九倍以上。接著再想想,電腦科學公司 (Computer Sciences Corporation)認為,到二○二○年時,我們會創造出總計七三點五皆位元組 (ZB)的資料,也就是七三後面有二十一個零。

相當顯著、而且往往很悲慘的是,現今大部分企業仍然幾乎完全由領導人的直覺猜測來推動。

他們可能會運用資料來引導思考,但同樣有可能深受一長串自欺行為之害,例如沉沒成本偏誤和確認偏誤 (請見以下的認知偏誤表 )。谷歌成功的原因之一,是比起大多數其他公司,它的資料導向更強烈,就連招募人才都是如此。

演算法如何提升人才招募品質?

美國心理學協會 (American Psychological Association)對十七項有關人才招募的做法進行研究,發現 在成功招募人才的比例上,一個簡單的演算法比憑直覺僱用人的做法高出 25%。 人工智慧專家尼爾.雅各斯坦 (Neil Jacobstein)指出,我們可以運用人工智慧和演算法來減少和彌補諸如以下的捷思法 (heuristics)認知偏誤:*

錨定偏誤:這種傾向會在決策時,過度仰賴或「錨定」某一項特質或資訊。
可用性偏誤:這種傾向會因記憶中存有較大的「可用性」,而高估事件發生的可能性,這會受到記憶久遠程度,或是它的不尋常程度或受情緒控制程度的影響。
確認偏誤:這種傾向依據個人成見或個人有限的知識,搜尋、解讀、聚焦和記憶資訊。
框架影響偏誤:根據資訊呈現的方式或是呈現者是誰,對相同的資訊得出不同的結論。
樂觀偏誤:這種傾向會過度樂觀,對偏好和令人滿意的結果過度高估。
計畫謬誤偏誤:高估收益、低估成本和完成任務所需時間的傾向。
沉沒成本或損失規避偏誤:放棄某個物件所產生的負面作用,大於取得該物件所產生的效用。

如何利用數據為公司創造巨幅成長?

心理學家捷爾德.蓋格瑞澤 (Gerd Gigerenzer)警告說,在不確定的市場中,比較好的做法是簡化,運用捷思法並且仰賴較少的變數。另一方面,在穩定而且可預測的市場中,他建議組織運用「複雜化」(complexify),並採取擁有更多變數的演算法。

Palantir 是從大量資料擷取洞見的領導者之一。 該公司在 2004 年成立,建置政府、商務和醫療軟體解決方案,讓組織能夠了解不同的資料。藉著代為處理技術問題, Palantir 讓客戶有精力專注於解決關於人的問題。創投業認為  Palantir 相當重要,所以該公司在總投資資金上已經得到令人咋舌的 9 億美元,其市值更是該投資總額的十倍。

指數型組織想要執行演算法,就需要遵循以下四個步驟:

1. 收集 :演算法的過程始於利用資料,可以透過感應器、人類或是從公共資料集匯入來收集資料。
2. 組織 :下一步是組織資料,這個過程被稱為ETL (擷取  extract、轉換 transform 和載入 load)
3. 應用 :一旦可以取得資料,像  Hadoop 和  Pivotal 這樣的機器學習工具,或甚至像 DeepMindVicarious 和  SkyMind 這種 (開放原始碼 )深度學習演算法就能擷取見解,識別潮流趨勢,並且調整新的演算法。
4. 揭露 :最後一步是揭露資料,把它當成一個開放的平台。可以利用開放式資料和應用程式介面 (API),讓指數型組織的社群能夠將指數型組織的資料與他們自己的資料重新組合,藉此在平台之上開發有價值的服務、新功能和創意。

不消說,無數個感應器很快就會到處部署,由此產生的資料將會暴增,使得演算法成為未來每個企業的關鍵環節。由於演算法遠比人類客觀、可擴充和靈活有彈性,它不僅是未來商業的關鍵,也對致力於推動指數型成長的組織相當重要。

__

(本文書摘內容出自 《指數型組織:企業在績效、速度、成本上勝出 10 倍的關鍵》,由 商周出版 授權轉載,並同意 TechOrange 編寫導讀與修訂標題。Photo credit: Foter.com)

延伸閱讀

【亞馬遜長銷 NO.1】別把記憶當死背!國際記憶大師用圖像記憶,讓你成為職場勝利組
【史上最強思緒整理法】賈伯斯、歐巴馬都在用的想法「視覺術」,完成夢想就靠它了!
   壓力大,累成狗,怎麼有創意?Google 內部流傳的「冥想法」可能會拯救你
   台灣學生的集體失敗:掉入低等勤奮陷阱,畫線、抄筆記,不會讓你變得卓越 
【真希望早十年看到這篇】用方格筆記本學數學,不但方便理解,還能鍛鍊邏輯力!


點關鍵字看更多相關文章: