說句老實話,你不可能在短時間內就變成一個數據分析科學家

via GIPHY

本文作者 Swami Chandrasekaran 任職於 IBM,擔任首席架構師 (the Chief / Executive Architect) 一職。作者在文章中提供了一張超棒的「數據分析學習指南」,如果你想成為一名「數據分析科學家」就不能錯過這篇文章。(以下採 Swami Chandrasekaran 第一人稱撰述)

隨著雲端計算與海量數據的發展,數據分析方法受到了前所未有的重視。如果你平時就有吸收或注意資訊科學的相關發展,你會發現無論是數據科學 (Data Science),機器學習 (Machine Learning),海量數據分析 (Big Data Analytics),認知計算 (Cognitive Computing) 等相關議題的文章,紛紛崛起於各大媒體版面,相關的研討會也是一場接著一場。

這樣的發展,成就了一個新興的職務:「數據分析科學家」(Data Scientist),他們將在新的科技進展中扮演重要角色,而且炙手可熱。

不過,有一件事是十分肯定的:你絕對不可能在短暫的時間內就成為一名數據分析科學家。如果你想成為數據分析科學家,需要歷經幾個不同的過程,而這過程肯定充滿挑戰。

因此,你應該從哪裡開始呢,應該怎麼做才能成為一位數據分析科學家呢 ── 是否有學習地圖可以參考呢?需要什麼樣的工具和技術做輔助學習呢?我又該如何判斷自己的能力已經足已成為一名數據分析科學家呢?

我嘗試依自己所知建立相關的課程地圖指南,提供給想成為數據分析科學家的讀者參考。這份課程指南的靈感來源是地鐵路線圖,我藉由相同的邏輯來描繪相關的學習路徑,這份學習地圖指南包含下列幾個領域,以及各個領域所需要了解的相關知識與技術:

1. Fundamentals (基礎相關)

2. Statistics (統計相關)

3. Programming (編程相關)

4. Machine Learning (機器學習相關)

5. Text Mining / Natural Language Processing (文字探勘 / 自然語言處理相關)

6. Data Visualization (數據視覺化相關)

7. Big  Data (海量數據相關)

8. Data  Ingestion (資料擷取相關)

9. Data  Munging (資料轉換相關)

10. Toolbox (工具類相關)

指南中的每一個領域主題都以一條「地鐵路線」來描述表示,而站點就是這個領域中的某個主題,所以,你可以透過從最基礎的認識到精通再到應用自如的漸進方式來學習。

就像你去搭地鐵,會依據你的起點與目的地來挑選行進的路線,甚至你會在行進中途決定轉換到不同的路線。

我已經在學習地圖指南中標註每一個站(路線)從 1 至 10,讓你在學習的過程中有所依據。你可以藉由這份指南做為為個人的學習計畫參考,從中確定你最有興趣和最想了解的領域知識與技能。

不過,最後還是要提醒各位讀者,擁有這份指南只是一個開始,而非結束。

有了練功指南,接著需要的是快速上手

資料科學?大數據?先打好基礎再來談,
GA,免費又超好用的數據分析軟體,讓專業大師教你從上手到拿手
好評再開班:Google Analytics 網站數據分析課程開課中 >> 了解更多

600x100

(資料來源:Nirvacana;圖片截自:Nirvacana


【2018 年 TechOrange 招募新血,引領台灣正向改變】
如果你平常關注人工智慧、fintech、區塊鏈、創新創業、數位行銷、技術開源、資安、物聯網、經營管理、科技小物等,加入《TO》跟我們一起關注社會、產業創新!

TechOrange 社群編輯、實習生持續徵才中
意者請提供履歷自傳以及文字作品,寄至 jobs@fusionmedium.com
來信主旨:【應徵】TechOrange _填上應徵職稱_:您的大名

點關鍵字看更多相關文章: