【專訪】打趴 Google 的戰鬥民族網路公司 Yandex,教台灣如何培養資料科學人才

去年,台灣突然紅起來一個詞「大數據」,上從政府下到民間企業開口閉口都是大數據分析,但是這個詞聽起來好潮卻又虛無縹緲,沒有人真的懂拿到數據之後要做啥,因此就很常出現「大數據瞎掰症候群」:

老闆:來,把市場上收集到的 data 全部拿去做成 ppt,這樣客戶才知道我們有做大數據分析。

這種大數據瞎掰症候群一天到晚發生,其實原因是數據人人拿得到,但沒人有能力從中看出端倪。其實,除了數據,更要有「方法」系統性地去促成判讀、處理這些數據的能力,因此「資料科學」這門新學問就誕生了。

提到俄羅斯,大家或許直接想到的印象就是戰鬥民族。這個離台灣遠的要命的國家,有什麼特別的?從「資料科學」的角度來看,俄羅斯其實是台灣可以借鑑的對象,當台灣正在談論「培育軟體人才、資料科學家」口號喊不停的時候,俄羅斯最大的軟體公司 Yandex 已經開始有系統地跟政府、學校合作培育相關人才,並且利用這個機會拓展出商機。

  • 打趴 Google 的戰鬥民族網路公司

Yandex 是一間很奇特的網路公司,以俄語使用者為主要服務對象,最厲害的戰績就是在俄羅斯完全打趴 Google,是俄羅斯最大的網路搜尋引擎。從 1997 年成立後,就開始慢慢拓展出搜尋引擎以外的網路軟體服務,在俄語市場中市佔率超過 60%,並且在俄羅斯擁有超過兩千萬的月活躍用戶。

現在,針對新興資料科學領域,Yandex 更有目標的利用旗下的軟體、工程師資源,重新創立一個專門資料科學部門 Yandex Data Factory。這個部門,其實就像一間新創公司一樣,從經營模式、體制編制都非常的敏捷、靈活,而且 Yandex Data Factory 誓言要用「資料科學」佔領全世界。《TechOrange》訪問 Yandex Data Factory CEO Jane Zavalashina,聽他談談一個本土化企業如何跨過國際化門檻,還有從大企業裡面做創新的理念是什麼?

問:Yandex Data Factory 的成立過程是什麼?

答:Yandex Data Factory 是一間成立於 2014 年的公司,目前員工有 40 人,超過一半都是工程師、資料科學家。這間公司是一間專注於機器學習與資料分析的新創公司,主要對企業提供服服,協助電信業、製造業、零售、金融等不同領域的企業提供數據、服務優化協助。透過我們的資料分析,平均可以幫助企業轉型,透過更智慧的方式,預測開銷成本、創造新的營收,並且平均能幫客戶省下數百萬美元的開銷。

問:可否談一下 Yandex Data Factory 的服務還有你們的技術優勢?

答:我們透過客製化的服務來幫助用戶,不僅幫客戶分析資料,我們還主動幫客戶找出可以優化的地方。其他類似競爭者,都只賣那一套「解決方案」,但是 Yandex Data Factory 從第一天就開始跟著客戶,不只幫忙分析資訊,我們更賣整套服務。資料科學的意義就在於找出那些數據背後的訊息,我們的演算法可以新型的處理方式為企業客戶促成更強的決策能力、洞察力與最佳化處理。

對於不懂資料分析的傳統公司來說,你賣了一套演算法給他,他還是不會使用這套工具,Yandex Data Factory 從工具到分析、服務全部做滿。

問:Yandex 是一間俄羅斯本土公司,但你們的 Data Factory 卻設立荷蘭,並且想要進攻國際市場。可不可以談談你們踏入國際市場的優勢與考驗?

答:談到進軍國際,Yandex 面臨到的問題其實是「跨文化」問題。

Yandex 在俄羅斯內赫赫有名,沒有人不知道我們,我們是在地市佔率第一的網路巨頭公司,但是從世界的格局來講不是這樣。當我們到德國、荷蘭等歐洲國家談生意,這些外國人都對 Yandex 一頭霧水。因此,我們公司要跨出國際,只能找到一個「通用」的法則,那就是做出一個跨出文化界線的服務,技術本身是沒有國界的,而我們解決的問題,全球想要轉型的企業都可以使用,那就是我們切入的點。

問:我想到 IBM 其實也有這種企業的數據分析、優化服務,你認為 Yandex Data Factory 與之競爭的優勢在哪裡?

答:的確,IBM 有類似的客製化服務,但是 IBM 的企業諮詢服務動輒一年、數個月。我們認為那樣太慢、耗時,Yandex Data Factory 不但在數據處理、分析上有著 Yandex 的技術支援,Yandex Data Factory 自視為一個新創。這意思就是我們動作很快!我認為動作要快、服務要能高度客製化,這樣才能快速地為我們的顧客帶來效益。這種敏捷度是我們很自豪的,畢竟軟體開發大概 3 個月就一個週期,顧客沒辦法花一年下去等。

問:Yandex Data Factory 的人都從哪找來?你們有刻意培育資料科學人才嗎?為什麼?

答:Yandex 一直在培育人才上花了非常多心血,我們與俄羅斯國內大學合開碩士相關課程,主要針對資訊工程、資料科學等項目,叫做 Yandex Data Science Academy,每年培育出 100-200 位的資料科學家,直接投入我們公司,這是公司非常大的優勢。資料科學家不僅要有程式相關的背景,還要能更進一步的了解資料要如何創造出「價值」,這是目前普遍業界所欠缺的事情,所以我們針對這項新興缺口及早做準備,這就會成為公司未來的發展優勢。

我們的資料科學家大部分來自於俄羅斯,當然在阿姆斯特丹的總部也有雇用各國人才,俄羅斯本來就是一個工業、電腦工程人才非常強大的國家,現在再加上更進一步的資料科學家,自然對 Yandex 國際化的發展有非常大的助益。

(本文未經許可不得轉載,合作夥伴不在此限)

這幾年機器學習、AI 人工智慧等詞彙人人琅琅上口,想要了解人工智慧的基礎,就是資料科學嗎?講座將會開放與會、讀者直接面對面請教專家,更深入地了解相關名詞與實際操作,千萬別錯過跟上 AI 人工智慧趨勢!

AI_600x100--for web 

點關鍵字看更多相關文章: