資料分析、程式語言、圖表設計工具總整理,月薪 40K 跳到 100K 的秘密還不手刀存起來?

【為什麼我們要挑選這篇文章】工作很常需要處理數據與製作圖表,要怎樣做才可以增進效率,達到良好的溝通效果?本文作者在投資銀行工作,他以投資分析為例,分享幾個好用的數據圖表工具,我們只要精通一到兩個,就可以提升自己的職場地位。(責任編輯:郭家宏)

本文經 數據分析那些事 授權轉載

投資人必須會用的資料處理工具,你知道幾個?

當實習中的你,被老闆安排找到騰訊某股東占公司註冊資金的百分比資料。你卻一臉茫然不知道從何搜集資料,硬著頭皮通宵整理完的資料又不知道如何快速整合,懷著忐忑的心情把 Excel 發出去,結果卻因資料不美觀被老闆怒罵退回。

因為對資料一無所知的你被老闆翻過幾個白眼?今天,資料君就來教你 KO 資料的三大妙招,重新整理老闆對你的認知。

搜集資料的管道

1. 券商研究報告

哪裡才能獲得第一手投資研究報告?知名金融資料平台像投行人必備的 Bloomberg(彭博)和 Factset 是最常見的獲取資料的渠道。

Bloomberg(彭博)是為大多數大型金融機構提供服務,使用者通過「彭博專業服務」可以查閱和分析實時的金融市場資料以及進行金融交易。彭博終端是一套讓專業人士訪問「彭博專業服務」(Bloomberg Professional Service)的計算機系統,基於客戶的伺服器架構建立,伺服器是一個多處理器的 Unix 平台,終端使用者使用的客戶端是一個 Windows 程序。

FactSet 研究系統是一家金融資料和軟體公司,為全球主要金融機構的分析員、證券管理員和投資銀行家提供金融信息和分析軟體,核心優勢主要集中在公司的財務資料,這也是為什麼它成為投行 Anaylst 必備技能之一的原因。 FactSet 在投行中的使用頻率是 Daily basis ,它有個性化的介面,強大的功能, Excel plugin 也不差。

2. 各大上市公司報告

一些頂級諮詢公司如德勤、 IBM 、貝恩等都會發布 annual report 以及公司近況通常具有時效性,能系統地反映公司現狀,從而輔助投資的策略判斷。

3. 上市公司公告

主要包括美國 SEC 、香港披露易、中國巨潮諮詢查詢上市公司,對於高凈值個體或大型投資有輔助分析作用。

4. 投行網站

主要包括 IPO 、 junling(巨靈)等渠道,多為華爾街諮詢、香港股票行情、金融建模及演示,可獲取各大投行現下投資組合分析及行情。

5. 銀行業網站

主要包括 World Bank(世界銀行)、 Forst(福斯特)等各大知名銀行平台渠道,可獲得實時銀行諮詢以及公告、資料的查找。

6. 資料庫

主要包括 IEEE Xplore 、 EBSCO 等,包含總體經濟資料、金融、教育、行業資料等,並擁有完備的年度資料。

7. 國外國家或經濟體資料

其中包括美國(提供了有關美國當前經濟形勢的描述和主要總體經濟變數資料)和經濟合作與發展組織資料(提供了成員國的金融資料,但也包括一些總體資料,比如 GDP 、失業和通貨膨脹等)。如 Heston-Summers 資料庫、《當代商業縱覽》等。

8. 綜合性資料

各類財經、股票、經濟類資料庫,如產品價格指數(PPI)詳細報告,國際股票市場資料庫,聯合國統計年鑒等等,提供總體經濟資訊、行業(產業)發展報告、企業(公司)資訊、產品市場分析,大量表格和統計資料,以及很多相關站點的連結,內容從收入、財富到貧困問題都有。

9. 策略常用網站

國內常用財政部、發改委等官方網站來了解政府政策及實時諮詢,分析當前社會及資本浮動情況;國外常用 BEA 、 CBO 等了解股票、財政等等詳細資料和實時分析。

10. 搜尋引擎

主要包括 Google、 BASE 、 sciseek 等搜尋引擎,多用於查找、搜尋資源,能準確定位你想要的資料。

使用程序語言自動抓取網路資料

在資料獲取領域中,最為被廣泛使用的就是 python 語言,俗稱爬蟲。

通過爬蟲加正則這種自動化的工具,能夠耗很少的人工就可以將資料和信息採集並結構化,後續通過更多的分析工具完成許多有商業價值的分析並獲取所謂的 insight(將訊息轉化為知識和洞察)。

推薦使用 這個網站

處理資料的工具

1. 萬能的 Excel

Excel 是迄今為止最簡單最便捷的處理資料方式。下至四則運算,上至各類統計分析、矩陣運算及線性規劃都可以搞定。但是想在投行借 Excel 玩出花樣,千萬不要以為會了 VLookup 及一些快捷鍵就可以耀武揚威了,至少需要把矩陣乘法、向量乘法、 Offset / Cells / Row / Range 等函數用到極致,這樣大多數 Financial Model 會做得非常靈活,而且各種資料查詢及配對工作會達到部分 SQL 的處理水平。

2. 進階版 Excel:VBA

VBA 會讓 Office 的能力提升一個檔次,除了完成函數不能完成的一些任務,最有價值的是能夠在 Office 的各套軟體之間實現信息同步。

學習 Excel VBA 較為正規的書是 John Green 的 Excel 2007 VBA Programmer’s Reference ,中文版由 Excel Home 翻譯為《Excel 2007 VBA 參考大全》。這本書應至少閱讀完前 7 章。閱讀完前 4 章即可以嘗試解決工作中遇到的問題了。

完美呈現資料,製作圖表的工具

當資料清理完畢後,如果你直接呈現給 Boss ,那就糟了!你知道美化前後的資料的差別有多大?

前者是一個落魄的流浪漢,後者成了一個精英,雖然還是同一個人,但明顯視覺感受迥然不同。而且最重要的是美化後的表格能帶來 80% 的溝通效力。

如何美化資料?資料視覺化,了解一下,它主要是藉助於圖形化手段,清晰有效地傳達與溝通信息。

資料視覺化技術包含以下幾個基本概念:

1. 資料空間:是由 n 維屬性和 m 個元素組成的資料集所構成的多維信息空間;

2. 資料開發:是指利用一定的演算法和工具對資料進行定量的推演和計算;

3. 資料分析:指對多維資料進行切片、塊、旋轉等動作剖析資料,從而能多角度多側面觀察資料;

4. 資料視覺化:是指將大型資料集中的資料以圖形圖像形式表示,並利用資料分析和開發工具發現其中未知信息的處理過程。

資料視覺化主要用於以下兩方面:

1. 報表類,如 JReport , Excel , FineReport , ActiveReports 報表等。

2. BI 分析工具,如 Style Intelligence 、 BO 、 BIEE 、帆軟 FineBI 等。

國內的資料視覺化工具,有 BDP 商業資料平台-個人版,大數據魔鏡,資料觀, FineBI 商業智慧軟體等。

1. Excel

Excel 的圖形功能並不強大,但 Excel 是分析資料的理想工具。作為入門級工具, Excel 是快速分析資料的理想工具,也能創建供內部使用的資料圖,但是 Excel 在顏色、線條和樣式上可選擇的範圍有限,這也意味著用 Excel 很難製作出能符合專業出版物和網站需要的資料圖。但是作為一個高效的內部溝通工具, Excel 應當是你百寶箱中必備的工具之一。

2. Chart.js

JsChart 元件功能強大,能適應各種複雜的需求和業務,而且操作起來相對簡單。

3. Google Chart API

Google Chart API 工具中取消了靜態圖片功能,目前只提供動態圖表工具。但 Google Chart 的一個大問題是:圖表在客戶端生成,這意味著那些不支持 JavaScript 的設備將無法使用,此外也無法離線使用。

當然, Google chart API 還是很強大的,線上自動幫你將所需要的資料匯總成,各式各樣的圖示,折線圖、圓餅圖、柱狀圖、氣泡等等。

4. Echarts

Echarts 是一款開源、功能強大的資料視覺化產品。可以流暢的運行在 PC 和行動設備上,相容當前絕大部分瀏覽器(IE8 / 9 / 10 / 11 、 Chrome 、 Firefox 、 Safari 等),底層依賴輕量級的矢量圖形庫 ZRender ,提供直觀,交互豐富,可高度個性化定製的資料視覺化圖表。

5. D3

D3(Data Driven Documents)是支持 SVG 渲染的另一種 JavaScript 庫。但是 D3 能夠提供大量線形圖和條形圖之外的複雜圖表樣式,例如 Voronoi 圖、樹形圖、圓形集群和單詞雲等。 D3 想要入門不是太簡單,至少都要有 HTML 和 JavaScript 基礎才行,對 JavaScript 的 DOM 要求也有點高。

6. Crossfilter

Crossfilter 是一個 JavaScript 類庫,能夠在瀏覽器端對大量資料進行多維分析。 Crossfilter 既是圖表,又是互動圖形使用者介面的小程序,當你調整一個圖表中的輸入範圍時,其他關聯圖表的資料也會隨之改變。它可以在不同的 Group By 查詢之間實現「交叉過濾」,自動連接和更新查詢結果。

7. R 語言

R 語言是主要用於統計分析、繪圖的語言和操作環境。 R 是屬於 GNU 系統的一個自由、免費、源程式碼開放的軟體,它是一個用於統計計算和統計製圖的優秀工具。它可以運行於 UNIX 、 Windows 和 Macintosh 的操作系統上,而且嵌入了一個非常方便實用的幫助系統。

8. jsDraw2DX

用於創建任何類型的互動式圖形 SVG(舊  IE  瀏覽器是  VML)的一個獨立 JavaScript 庫。除了生成所有基本形狀像線、 矩形、 多邊形、 圓、 橢圓、 圓弧等,庫包可以繪製曲線、 貝塞爾曲線(任何 degree)、 函數圖形、 圖像和文本的裝飾。

9. Visual.ly

如果你需要製作一個快速的視覺圖像,你沒有必要再詢問專業的設計團隊,你可以自己完成這些工作。 Visual.ly 就是最流行的一個選擇。其中提供了大量信息圖範本。

查找資料、處理資料、美化資料的工具都在這了,你平時用過哪幾種呢?學會其中一兩種, KO 各種資料。還怕不能升值加薪?

(本文經 數據分析那些事 授權轉載,並同意 TechOrange 編寫導讀與修訂標題,原文標題為 〈從月薪 8K 的分析師到月薪 2W,只因我有了這份工具清單! 〉;首圖來源: Pxhere, CC Licensed。)

更多圖表技術

6 張機器學習圖表「小抄」,讓你快速上手框架與函數!

一秒變資料視覺化專家,非工程師照樣做出資訊化厲害圖表

不懂程式也可以做出漂亮的動態資訊圖表,台灣新創 PlotDB 免費給你上百種華麗選項


科技報橘 LinkedIn 上線!

最新科技產業動態、技術新突破、專業職能技巧提升 ....... 鎖定 TO  LinkedIn 專業品牌,提升職能與產業 Know-how,躋身產業菁英之列 https://www.linkedin.com/showcase/techorange

點關鍵字看更多相關文章: