為什麼主管不想看你的報告?《經濟學人》記者:因為圖表踩了這 3 種雷

【為什麼我們要挑選這篇文章】做完數據分析後,最後一個步驟就是用適當的方式,將資訊表現出來,讓主管、客戶、政府單位可以了解你的論點。然而,我們製作圖表的時候,常常踩到雷而不自知。

下文,經濟學人的記者將帶我們了解,製作圖表時最容易犯的三個錯誤,以及該如何修正。(責任編輯:郭家宏)

經濟學人(The Economist)雜誌除了色彩鮮明的文章之外,其在數據視覺化方面也自成一派。絶妙的顏色搭配,風格鮮明的圖表總能讓讀者過目不忘。

Sarah Leo 在經濟學人雜誌中擔任資料視覺化記者(Visual data journalist),她在一篇部落格中介紹到:雖然對於每一張圖表,他們都儘量準確地以最能支持故事表達的方式來視覺化數字,但有時候也會犯錯。

為了能夠做的更好,他們在錯誤中不斷總結教訓,不斷的自我改進。為此 Sarah Leo 還把經濟學人的錯誤總結為 3 點,並寫成一篇 文章 ,供大家參考。下文是大數據文摘對此文章的編譯。

原文 傳送門

深入瞭解我們的記錄後,我找到了幾個有用的例子。我將針對數據視覺化的問題分為三類:誤導性圖表、模糊的圖表、未能說明問題的圖表。

免責聲明:大多數「原始」圖表是在我們的圖表重新設計之前發佈的。改進的圖表是為了符合我們的新規格而繪製的。它們的數據完全一致。

誤導性的圖表:坐標軸位置、尺度、圖片形式皆會影響判斷

以誤導的方式呈現數據是數據視覺化中最嚴重的問題,雖然我們從不故意這樣做,但它確實很常發生。我們來看看三個例子。

錯誤:截斷標尺

此圖表顯示了政治左翼 Facebook 頁面上文章的按讚平均數量。這張圖表的重點是顯示 Corbyn 先生與其他文章之間的差異。

原始圖表不僅低估了 Corbyn 先生的數量,還誇大了其他文章的數量。在重新設計的版本中,我們完整地展示了 Corbyn 先生的數據並保證所有其他數據長條仍然可見。

另一個奇怪的是顏色的選擇。為了模仿工黨的配色方案,原圖使用了三種橙色/紅色色調來區分 Jeremy Corbyn 與其他國會議員和政黨。雖然顏色背後的邏輯對許多讀者來說可能是顯而易見的,但對於那些不太熟悉英國政治的人來說,這可能沒什麼意義。

錯誤:透過故意操縱坐標軸來假裝存在相關關係

兩者之間有完美相關?並不是的。

上面的圖表附有一個關於狗重量下降的故事。乍看之下,似乎狗的體重和頸部大小完全相關。但這是真的嗎?其實並不是很相關哦。

在原始圖表中,兩個坐標軸的跨度均為三個單位(左邊是 21 到 18;右邊是 45 到 42)。按百分比計算,左邊的比例下降了 14% 而右邊則下降了 7%。在重新設計的圖表中,我保留了雙坐標軸的設計,但調整了它們的範圍以反映可比較的比例變化。

考慮到這個圖表的休閒主題,這個錯誤可能看起來並沒有那麼重要。畢竟,圖表的訊息在兩個版本中都是相同的。但我們從中學到的事情很重要:如果兩個變數過於緊密相關,那麼再仔細觀察一下坐標軸尺度可能是一個好主意。

錯誤:選擇錯誤的視覺化方法

對脫歐的看法幾乎和談判結果一樣不穩定

我們在每日新聞應用 Espresso 中發佈了此投票圖表。它顯示了民眾對歐盟公投結果的態度,並以折線圖繪製。從數據來看,似乎受訪者對公投結果的看法相當不穩定——每週都會增加或減少幾個百分點。

我們並未使用平滑曲線繪製單個民意調查來顯示趨勢,而是連接每個民意調查的實際值。這主要是因為我們的內部圖表工具沒有繪製平滑線條的功能。我們直到最近才逐漸開始熟悉更複雜的視覺化統計軟體(如 R)。今天,我們團隊所有人都能夠繪製一個類似上面重新設計的投票圖表了。

此圖表中需要注意的另一件事是坐標軸如何起點的方式。原始圖表將數據擴展到全部空間。而在重新設計的版本中,我在坐標軸開始的部位和最小數據點之間留下了更多空間。弗朗西斯.加農(Francis Gagnon)為此制定了一個很好的規則:我們應當試著在一個不從零開始的折線圖下留出至少 33% 的空白區域。

模糊的圖表:不同圖表混搭,顏色選擇不當讓我看不懂啊

這沒有誤導性圖表那麼過分,但是一份難以閲讀的圖表還是表明視覺化工作做得很糟糕。

錯誤:「發散性思維」過於發散了

在經濟學人雜誌上,我們被鼓勵創造「發散性思維」的新聞報導。但是有時候,我們會認為這有點太過分了。上圖顯示了美國的商品貿易逆差和製造業就業人數。

該圖表非常難以閲讀。它有兩個主要問題。首先,一個變數(貿易逆差)的值完全是負數,而另一變數(製造業就業)都是正數,將這些差異結合在一個圖表中非常不合理。有一個顯而易見的解決方案,但這卻會導致第二個問題:兩個變數不共享共同基線。貿易赤字的基線位於圖表的頂部(透過圖表左半邊那截紅線突出顯示),而右半部分的基線則位於底部。

重新設計的圖表顯示其實並沒有必要組合這兩個數據系列。貿易逆差與製造業就業之間的關係仍然很明顯,而這一圖表並沒有額外佔據多少空間。

錯誤:莫名其妙的顏色使用

該圖表將政府在養老金福利方面的支出與國家 65 歲以上人口比例進行了比較,並特別關注了巴西的情況。為了使圖表佔據較小版面,視覺化工具僅標記了部分國家/地區,並以靛藍色突出顯示。經合組織的平均值則以淡藍色突出顯示。

視覺化者忽略了這樣一個事實,即不同顏色通常意味著不同分類。乍一看,這個圖表似乎也是如此——所有靛藍色似乎屬於與深藍色不同的組合,但其實不是這樣的,區別只是一個有打上國家標籤,一個沒有而已。

在重新設計的版本中,所有國家/地區的圓圈顏色保持不變。我將沒有標籤的數據點的透明度調高了。剩下的就靠排版了:巴西是重點國家所以用字體加粗;而經合組織則用斜體字表示。

未能說明問題的圖表:過多資訊看得我心好累啊

最後一類的錯誤不太明顯。像這樣的圖表不會誤導讀者,也不會讓人感到困惑。他們只是沒有證明他們存在的合理性,通常是因為視覺化不合理,或者因為我們非要在小版面內塞進過多訊息。

錯誤:包含太多細節

這彩虹真好看!我們在德國預算盈餘的專欄中公佈了這張圖表。它顯示了 10 個歐元區國家的預算餘額和活期帳戶餘額。

有這麼多顏色,而且其中一些很難被區分。另外,因為對應的值太小了,根本沒有辦法得到任何圖表訊息,它只會讓你眼睛一愣,然後趕緊轉移視線。而且更重要的是,由於我們沒有繪製所有歐元區國家,因此堆疊數據沒有任何意義。

我回過頭看看有沒有辦法簡化這個圖表。該專欄提到德國、希臘、荷蘭、西班牙以及歐元區總數。在重新設計的圖表版本中,我決定只強調這些。為瞭解決僅堆疊部分國家的問題,我添加了另一個類別(其他),其中包括所有其他歐元區國家。(由於歐盟統計局進行了數據修訂,重新設計的圖表中的流動帳戶餘額總額低於原始圖表。)

錯誤:大量數據,空間不足

受到版面空間的限制,我們常試圖將所有數據塞進圖表中,雖然這可以節省頁面上的寶貴空間,但它還是會有負面影響。比如這張 2017 年 3 月的圖表,它是關於科學界的論文發表是如何由男性主導的。所有數據點都同樣有趣且與主旨緊密相關。但是,一下子提供如此多的數據(四個研究領域類別以及發表人的比例)這些訊息很難一起被接受。

經過深思熟慮之後,我決定不重新設計這個圖表。如果我要保留所有數據,那麼圖表就會變得過於複雜而不簡潔。在這種情況下,削減一些內容會更好。或者,我們可以展示某種平均化的衡量標準,例如所有領域的女性發表作品的平均比例。

(本文經 大數據文摘 授權轉載,並同意 TechOrange 編寫導讀與修訂標題,原文標題為 〈 《经济学人》数据可视化编辑:错误的图表,我们也画了很多 〉 。首圖來源:Pexels CC Licensed)

更多關於表達的技術

巴菲特給年輕人最簡單的建議:好的「口語表達」能力,就能讓身價翻倍!
如何不被老闆問倒?日本王牌律師教你「思維重訓」,打造最強邏輯表達力
史上最強演說大師教你搞定麻煩客戶,牢記談判必勝心法三原則!


全球醫學矚目焦點

人類逼近打破年齡、健康限制的臨界點! 搶先報名 12/6《2019 未來科技展》再生醫療場次

點關鍵字看更多相關文章: