【看得懂比看起來漂亮重要】Amazon 暢銷工具書教你真正的「資料可視化」,做一堆美圖只是浪費時間

【為什麼我們要挑選這篇文章】每日工作中,我們時常遇到需要將資料/數據整理,並提報給老闆、客戶,但是這麼龐大的資料量,該用什麼圖表呈現、才能讓對方快速理解、提升溝通效率?讓我們來看看以 PM 為職業的  Leah 分享她的心得。(責任編輯:呂珈寧)

距離讀完《Storytelling with Data: A Data Visualization Guide for Business》已經有好一段時間,工作上在構想後台圖表或準備產品績效報表時,也不時會打開它翻找參考,趁著最近內部會議分享,又仔細重看消化過一次,就當作是自己的讀書筆記吧!

為什麼要做資料可視化?看 Amazon 高分工具書怎麼說

這本在 Amazon 評分高達 4.6/5 的工具書,作者 Cole 由淺入深解釋「為什麼我們需要做資料視覺化?」,她並沒有開宗明義就把讀者帶到一個充滿五花八門圖表的世界,反而在書的前半段反覆強調溝通的目的,之後才用很真實的情境— — 例如你必須在公司會議匯報某一季的銷售數據— 說明什麼類型的資料,適合用什麼圖表,也會透過對比(沒有做資料視覺化 vs 有做資料視覺化)的形式,讓讀者很快可以看出差異性。

後來自己上網查了一下,發現 Cole 自己經營的網站,持續透過工作坊的方式推廣資料視覺化,合作對象不乏知名網路產業,Google、Facebook、LinkedIn、Adobe…等,對她就更加欽佩了!

書的內容很豐富(非常推薦PM或是設計師夥伴人手一本!),很難用一篇文章濃縮,以下我會用自己消化過的語言簡述心得,也會帶到一些 Cole 在書裡提到的範例。

做資料視覺化之前,請先問自己這三個問題:Who, what, and how

老實說,當初我買這本書的初衷,的確是想透過實例對照,能更快把資料視覺化這個新技能應用在工作上;不過作者第一章就直接打槍這種想走捷徑的想法,她要讀者再三想清楚這3個問題:

  • Who:鎖定你想溝通的對象。

你的目標觀眾是誰?別想著你要同時跟股東或是單純對產品有興趣的人說話,不知道怎麼做的話,可以先從「和決策者對話」限縮你的對象。
你希望觀眾怎麼看你?你和觀眾是第一次接觸嗎?你是這個領域的專家嗎?他們對你有足夠的信任感嗎?在陳述之前,想清楚你跟觀眾之間的關係。

  • What:你想要觀眾知道什麼,或做什麼?

別做沒有目的的溝通。如果你是整理資料的人,那麼你比任何人都更熟悉資料的來源跟它代表的含意。透過資料說明事情是為了「下一步」 —  你可以在提出資料佐證時主動給出建議,這也幫助聽眾開始思考,否則聽眾也許看過這些漂亮的圖表後只單純發出一句:「哇,真厲害!」,那就失去你蒐集數據的意義了。

在思考跟觀眾的溝通目的時,可以參考以下這張圖,幫助你決定報告的流程以及邏輯。

圖片來源:https://gist.github.com/AdamMescher/4934fee9e8f7dda605f551f60a03d4bd

左上的 Live Presentation 場合,報告者(你)擁有最大的控制權,你能夠決定整場報告的節奏,相對而言你需要跟觀眾講述的內容所需細節較少;反之,右方區塊的 Written Doc & Email,同樣是報告者的你擁有較少的控制權,你無法預測觀眾會如何消化你提供的資訊,這種溝通情境,你就必須提供盡可能多的細節,幫助讀者了解— — 甚者,你得在報告中解答他們預期會有的問題。

  • How:這就是我們需要資料視覺化的原因。

它幫助你清楚傳達立場給你的觀眾當你想在有限的時間(3分鐘)內,向聽眾解釋一件事(Big Idea),特別是你想透過大量資料說明,如何明確、精準地溝通,顯得格外重要。

除了確保自己能回答以上3個問題之外,你也可以試著問問自己這些問題:

  • 觀眾有需要必備什麼背景知識嗎?
  • 有其它資料可以讓你的立場更有立足點嗎?
  • 有什麼因素可能會讓你的論點陷入風險?
  • ………..等等。

套用在我身上的話,我自己在每場簡報前,會在心中反覆從頭到尾練習過整個順序(如果同事有空,也會麻煩他們幫忙聽一次看看,哈),看是不是有哪裡邏輯不對、是不是有把我想講的核心重點傳達出去?如果是篇幅比較短的報告,在製作的過程中就會同時練習默念,等到做完其實也回答完 Cole 的三大問題跟一些模擬問答了。

六大常用圖表,在什麼狀況用它們比較好?

進入本書的重點之一:決定你使用資料視覺化的情境。Cole 在這本書提到的圖表都是常見的類型,如柱狀圖,並不是設計成分較高的 Infographic (如下圖)。

圖片來源: https://graphicriver.net/graphics-with-annual+report-in-infographics

以下我會分別介紹書中有提到的、在實務上也經常會使用到的 6 種圖表類型。(備註:書裡面有提到更多,考量到文章篇幅就不一一提出說明了。另外我為了做圖上方便,以下圖表並非百分百是書中提到的數據。)

1. Simple Text 純文字

乍看之下好像跟書的主題「圖表」有點衝突,不過當你的資料只有 1 個或 2 個數據,且需要一段不短的文字輔助說明,圖表並不是必須— 沒必要為了作圖而作圖 !

  • 假設使用情境:你想說明一個事實「截至 2020 年,有 20% 的已婚女性在家全職照顧小孩,1970 年則有 41%。」,並想特別強調2020年下降至20%。
  • 一般狀況直覺會使用柱狀圖,如以下:

用柱狀圖呈現這樣的數據沒有不好,只是比較難讓聽眾能一眼注意到你想強調的重點:「已婚女性全職比例2020年下降至20%」,也因此,Cole 建議此種數據若改用純文字的方式呈現,反而更能凸顯重點。

2. Heatmap 熱圖

最近疫情的關係,Heatmap 也經常在感染嚴重程度的地圖上呈現;不過 Cole 書中提到的 Heatmap 是偏向表格數據的進化體。當你的資料有多個單位、多個種類(常見的有銷售狀況、成本分攤等等),必須透過表格來呈現,適當加入視覺化可以更快抓到觀眾注意力。​

  • 假設使用情境:你要跟大家展示目前公司多種商品在多城市的銷售狀況。
  • 原始數據直接以表格呈現,如下,觀眾得左右交互查看,還不一定能馬上知道到底哪個商品在哪個城市銷售狀況最好。

  • Heatmap 透過顏色深淺,讓閱讀的人能較快一眼辨認程度高低:

3. Slopegraph 斜率圖

當你想表達橫跨兩個時間區間的資料,並想迅速看出高低起伏的比較,此時斜率圖是很好的選擇。這邊的兩個時間區間不一定是單一時間→單一時間,也可以運用在一段時間的頭→尾(例如你撈的資料時間區段是 2017–2020,而你想講的是起始/結束的差別),端看你想怎麼呈現你從數據中的發現。

  • 假設使用情境:你想跟大家說明員工對公司的滿意度問卷調查結果(2019 vs 2020),員工針對問卷裡的某個問題類型回應增加/減少最多。

採用斜率圖之前,需要注意的是,若你的數據項目間差距都相當大,意指各條目的幅度起起伏伏,那麼就不太適合用斜率圖,因為會有太多線條彼此夾雜,會讓畫面不太簡潔,反而讓讀者更容易迷失在圖形裡。

4. Bar Chart 柱狀圖

這可說是最常見的一種圖表類型,許多人在思考使用報表時經常避免使用柱狀圖,因為好像顯得太普遍(包括我自己之前也會這樣想)。Cole 提及,正因為柱狀圖最常見,對於一般大眾幾乎是零學習成本,反而在大眾媒體上很適合使用。

不過,也正因為柱狀圖非常直覺、容易理解,也可能會藉此特性做一些誤導性的資訊傳播。例如美國福斯電視台曾經在新聞播放中使用柱狀圖,解釋布希解稅案到期後,對於稅率的影響:

圖片來源: https://flowingdata.com/2012/08/06/fox-news-continues-charting-excellence/

乍看之下好像沒什麼問題—  有現在的稅率(35%),也有法案到期後的稅率(39.6%)。但是這張圖表給你的感覺是什麼?「哇!如果法案不延期的話,我好像變得要繳超多的稅!」

實際上真是如此嗎?

福斯在繪製柱狀圖時,犯了一個錯誤:起始點(Baseline)並非從 0 計算。正確使用柱狀圖來看稅率變化應該是這樣的:

這樣一看,稅案到期與否,對於稅率的差距是不是就沒有一開始看到那麼大了呢?

5. Stacked Horizontal Bar Chart 水平百分比堆疊圖

堆疊圖是柱狀圖的延伸圖種,因同時要做主/子分類的比較呈現,使用限制較多,如果子分類的基準點各自差距太多,堆疊起來反倒讓人更霧裡看花;也因此這種圖表相當適合用在問卷調查結果的呈現(反對/同意),因為這兩者的基準點是一致的,並沒有誰的基準點較高或較低的問題。

  • 假設使用情境:你想展示問卷結果中最多人強烈同意/最多人強烈不同意的項目,就能以百分比堆疊圖的方式呈現:

實務上我自己在 Instagram 上追蹤的 The Economist,也看到他們使用這種圖表類型展示市調:

6. Pie Chart 圓餅圖

這是我自己覺得很有趣的章節!首先 Cole 很直白表達她對圓餅圖的抗拒:They are evil. 再來她透過圓餅圖帶到圖表的製作鐵則— 千萬不要使用3D,你只會讓讀者更困惑。

我們看個書中提到的例子:

哇,這張圖融合了圓餅圖+3D,套用 Cole 的觀念,這張圖表簡直是一場災難,不如不要畫圖!

為什麼呢?Cole 解釋道,使用 3D 會讓視覺跟數字無法匹配,以上圖為例,31% 的面積占比反而看起來比 34% 更多,已經讓觀眾產生矛盾,再來是圓餅圖本身在視覺上就不是能夠直覺消化資訊的圖形,你得比較面積、數字,才能有大小的概念。假設我們同樣要表示供應商的銷售佔比,Cole 提到使用長條圖一樣可以達到這樣的效果,甚至把資料都排序好了,讀起來更直覺:

既然有其他更簡單易懂的圖表能夠替代圓餅圖,為什麼要使用圓餅圖呢?Cole 再三提到這個概念,不是不能用,只是在每次使用圓餅圖之前,想想是否有其他更好、更簡單的選擇呢?如果答案是肯定的,那麼圓餅圖絕對不會是推薦第一使用的圖表。

最後,把自己當作設計師一樣思考

資料視覺化會需要一些基本的設計概念,不是說你得要擁有設計師的專業,而是你得思考「這樣的圖表,別人看得懂嗎?容易懂嗎?」要怎麼做,書中有給出幾個提示:

  • Highlight 重要的資訊:使用粗體、字型大小、顏色對比…等,讓重點資訊能夠被一眼辦認出來。
  • 資訊有重要順序之分:不是每個數據都一樣重要。你的每張圖表都有一個想傳達的核心重點,即便中間蒐集的資訊也有其參考價值,但是你得移掉會讓觀眾分心的部分。

以一個例子說明:你手中擁有2017年到2020年各個學歷層的新婚率,而你觀察到新婚率幾乎是逐年下降,其中碩士學歷下降得最多。你當然可以用柱狀圖呈現所有的資料,如下圖。

但是這對讀者在第一眼印象要看的東西太多了,要關注學歷的類型、各個學歷下降的數字比例……好了,讀者可以看出新婚率逐年下降了,但是你想說的「碩士學歷下降最多」的重點呢?讀者要多久才能看出來,或者他們得等你口頭說明才能知道呢?

假設改用 Slopegraph,同樣的資訊會呈現如下:

 

再透過顏色、字型加粗等重點提示,觀眾能更快一眼看到你想表達的論點。

結語

上面的書摘內容我提了不到一半吧,只挑了我覺得比較好入門的地方寫讀後心得。關於怎麼 Eliminate distractions 以及 Case Study,書中花蠻多篇幅對比、引導思考,我自己第一次看是從頭看到尾,針對有趣或是覺得日後可能會用到的地方用書籤記號,後面幾次再看就是翻閱有需要的章節,當工具書使用了。(而且真的很實用!)

最後用一句 Cole 的話做為文章總結:

“We aren’t naturally good at storytelling with data.”

沒有人天生就超會做圖表,資料視覺化是需要長期練習的。也因為自己工作性質是產品經理,會需要定期做內部的產品績效報告,藉這種機會訓練自己在每次準備時,都有做到 Cole 的 Who, what, and how,報告內使用的圖表也會一再調整讓它更好被讀懂。

(本文經 Leah 授權轉載,並同意 TechOrange 編寫導讀與修訂標題,原文標題為 〈Storytelling with Data— — 為什麼我們需要資料視覺化?〉。)

你可能有興趣

轉行數據分析該注意什麼?騰訊工程師狂推的報表神器:FineReport
【數據科學 ≠ 數據分析】都是以數據解決問題,程式語言使用卻大大不同
隔離在家可以做什麼?數據科學家推出「14 天數據分析挑戰」,讓你每天練 coding

AD