資料科學家

【為什麼我們要挑選這則文章】資料科學家曾被票選為「最性感的工作」,並且在現在這個講求數據的時代,企業也開始越來越重視資料的掌握。

資料科學家需要什麼技能?產業未來趨勢又會如何發展?職涯發展和人才招募平台 Glints 將在本篇文章一次解答。(責任編輯:邵元婷)

本文經 Glints Taiwan 授權

作者:Tim Kuo

資料科學家是什麼?

想要了解資料科學家就要先懂得資料科學本身的定義是什麼。

資料科學其實是一個橫跨多領域的學術知識,其中包括統計學、數據探勘、科學方法、人工智慧 (AI) 和資料分析等,主要的目的是從資料中發掘價值。「準備資料再進行分析」也是資料科學的重要的環節之一,過程包含了清理、彙總及處理資料。

但在規模較大的企業會有所謂的資料工程師完成此任務。最後,資料科學便是檢閱分析結果,幫助企業、學術、或是任何有關資料方面的項目取得明智的見解。

所謂資料科學家就是對以上事情瞭如指掌的專業人士。他們的工作內容主要搭配運用一系列的技能,分析各式各樣的資料:從網路、到智慧型手機、感應器和其他來源,並從中獲取可行的見解。資料科學家就是要發現問題,提出問題然後設計方法,並且對可取得的資料進行分析。

一個完整的數據團隊基本上會包含資料科學家、資料分析師以及資料工程師。資料分析師進行統計方面的工作,如實驗設計,數據分析等:資料工程師程式實作方面的工作,如大數據的收集與整理,演算法的部署等。

TO 推薦閱讀:超高年薪、獎金還配加密貨幣!矽谷人才狂跳槽,Web3 為何成全新夢幻工作?  

資料科學家的 大技能

對資料科學家有了初步的了解後,這邊要帶大家來看資料科學家在職涯上,最常被要求以及用到的 6 個硬技能以及 2 個軟技能。

硬技能:

1. Python 與 程式語言(Python CodingR Programming

寫程式雖然不是資料科學家最主要的工作內容,但是因為統計的運算不運用工具會相對的花時間,再加上通常數據量都會很大,沒有使用 Python或 R 來協助整理,基本上是沒有辦法使用的。

2. SQL 資料庫管理系統(Database/Coding

說到資料收集,就必須要做到清理與管理,資料科學家在這方面必須要有非常高的技術,最主要的原因一樣是回到數據的量與質,想要將資料運用的好,就一定要先會整理並管理資料。

3. 機器學習與人工智慧(Machine Learning and AI

資料科學家必須要對機器學習與人工智慧有一定的掌握度,原因是它們資料撇不開關係。沒有數據就無法做到機器學習,或是開發人工智慧。

4. 數據處理與數據分析(Data analysis

稍早有提到資料科學家需要利用 SQL 資料庫管理系統,主要就是為了儲存並有效的處理數據,進而達到利用儲存的數據來做分析。而資料科學家當然也需要非常的熟悉數據分析,又能夠從數據中發現價值,並加以利用。

5. 資料視覺化呈現能力(Data Visualization

資料科學家除了要懂得如何分析數據,還要能夠將其視覺化,以便解讀。資料科學家需要面對的利害關係人包括老闆、管理者、C-levels、高層經理等公司重要的角色,但這些人並不一定對資料的觀察如此的精通,所以將資料視覺化的呈現成為了資料科學重要的一部分。

6. 高級數學與統計能力(Mathematics and statistics

數學與統計是資料科學家必備的能力,在資料科學家的工作中,每天都要面對複雜的數學以及統計學的問題,計算風險、計算可能性、預測等等,都需要對數學與統計有相當的學術理解。

軟技能:

1. 部門交流與溝通能力(Communication skills and Teamwork

溝通與交流的能力是團隊合作不可或缺的,對資料科學家來說更是如此,在一個資料或是數據的團隊中,除了科學家以外,還有資料分析師與資料工程師,加上他們要面對其他團隊(有利害關係之團隊),所以優越的溝通能力與部門交流會格外重要。

2. 行銷理論與實務經驗(Marketing theory and practical experience

資料科學家也同時需要有行銷的知識與實務經驗,原因是他們的分析與推算往往對公司營運與行銷的層面有著直接性的影響,了解行銷對於判斷資料的價值也有相當大的幫助。

想要近一步了解資料科學家在做什麼的人,可以看以下文章:【揭開資料科學家的神祕面紗】

TO 推薦閱讀:矽谷頂尖人才大量跳槽中!前進 Web3.0 高薪產業,不用羨慕聯詠千萬分紅  

資料科學家的趨勢與產業

資料科學的理念是在 1997 年初一場叫做「統計=資料科學?」的講座中, C.F.Jeff Wu 教授所提出的。時間快轉到 2008 年,DJ Patil 和 Jeff Hammerbacher 第一次用資料科學家(Data Scientists)這個詞來描述他們的團隊。 兩年後大家也見證了資料科學以及資料科學家的發展,最主要的原因是企業開始在交易中應用到相關技術。以下跟大家簡單說明資料科學家的趨勢:

大數據分析(Big Data Analytics):

數據分析的發展得益於大數據的發展。大數據這個概念的建立於「3V」,數量(volume)、速率(velocity)以及真實(veracity)的理念。換言之,在大數據的時代中,最重要的三個需求就是要大量的、快速的、真實的資料。 儘管儲存大量的資料是一直以來都沒有問題,但分析和處理這些資料的方法卻相對有限。

資料科學自動化(Data Science Automation):

在不知不覺中資料科學自動化已經慢慢成為了我們生活中的一部分,根據業內專業人士的預估,資料科學自動化將會很短的時間內有更加突破性的發展。現在世界處於一個資料科學模型自動化的階段。靠著資料科學,模型自動化將會越來越被廣泛使用。

雲端和資料科學(Cloud and Data Science):

雲端計算除了大量的減少了裝置上,軟體上和平臺上的成本;同時,這也極大減少了在數據分析中的運用和維護成本。以雲端為基礎的資料科學和機器學習平臺,提供了資料科學家一個理想的環境,而環境就是能夠從雲端中的處理資料、分析資料。

自然語言處理(Natural Language Processing):

深度學習在過去的 10 年內已經成為資料科學中最受歡迎的領域之一了。而深度學習之所以備受矚目是因為它擁有可以學習複雜的非線性關係的能力。Tensorflow 和 H2O 兩框架提供了一個實用的平臺去實踐深度學習演算法,利用了許多資料科學的知識。

物聯網(Internet of Things):

資料科學是物聯網的核心,能從被連線的物體中獲取資訊,透過機器與網際網路的連線達成資料的傳遞(比如說感應器,促動器和掃地機器人),到現在的自動駕駛,基本上都有一定程度的採用資料科學的技術。

資料科學家的薪水待遇有多高?

資料科學家的薪資在台灣堪比軟體工程師,以沒有經驗的社會新鮮人來說,起薪大約也能達到 44K,一至兩年經驗的資料科學家的薪水就能翻倍,達到 80K 左右。年資再更久一點的人,年薪沒有破百萬都奇怪。若是身處在外商公司,一位資料科學家的薪資還有機會再達到更高的境界。

在美國,一位初階的資料科學家薪水大約是每年 7 萬美元(193 萬台幣),而一位相對資深的資料科學家年薪能平均落在 12-15 萬美元(300-400 萬台幣)。

不管在台灣還是美國,資料科學家的薪水都比大部分的職位高出許多,而在這個數據的時代,資料科學這個技術會越來越被需要,也許還會到供不應求的情況,所以我們也能預見更高的薪水成長。

結論

看完這篇文章後,大家對資料科學家也一定有了更多的了解。這個職位不管在現在還是未來,只要有數據存在,就是一個不可或缺的位子。也不管是在什麼產業、什麼商業模式、什麼產品,在這個什麼事情都數位化的時代,資料科學家一定是一個重要的角色。

如果想得到更多數位科技職缺資訊,免費註冊 Glints 帳戶,每星期可以獲得國內外精選職缺通知和實用部落格文章。

(本文經 Glints Taiwan 授權刊登,並同意 TechOrange 編寫導讀與修訂標題,原文標題為〈資料科學家技能、趨勢、產業、薪水大解析!成為資料科學家之前,要先了解的事!〉。圖片來源:Shutterstock)