來源:DataHunter
大家好,歡迎來到Crossin的編程教室!
很多同學學習Python是為了做數據分析及數據可視化。不過要做好可視化,準確、直觀地展現數據及規律,光掌握代碼層面的技術還不夠。
優秀的數據可視化圖表不僅僅是簡單地羅列、總結數據。數據可視化其真正的價值是設計出可以被讀者輕鬆理解的數據展示,因此在設計過程中,每一個選擇,最終都應落腳於讀者的體驗,而非圖表製作者個人。
所以,今天我們拋開代碼,僅就可視化圖表設計層面,來分享一下前人總結的30個小技巧。通過列舉一些容易被忽略的常見錯誤,最終能夠快速提升和鞏固你的可視化製作水平。
1.條形圖的基線必須從零開始
條形圖的原理就是通過比較條塊的長度來比較值的大小。當基線被改變了,視覺效果也就扭曲了。
2.使用簡單易讀的字體有些時候,排版可以提升視覺效果,增加額外的情感和洞察力。但數據可視化不包括在內。堅持使用簡單的無襯線字體(通常是Excel等程序中的默認字體)。無襯線字體即是那些文字邊緣沒有小腳的字體。3.條狀圖寬度適度
條形圖之間的間隔應該是1/2欄寬度。
4.使用2D圖形
雖然他們看起來很酷,但是3d形狀可以扭曲感知,因此扭曲數據。堅持2 次元,確保數據準確。
5.使用表格數字字體表格間距賦予所有的數字相同的寬度,使它們排列時能彼此對齊,使比較更容易。大多數流行字體都內置了表格。不確定字體是否正確?就看小數點(或任何數字)是否對齊就行。
6.統一感統一感使我們更容易接收信息:顏色,圖像,風格,來源……
7.不要過分熱衷於餅圖
展示多個區塊比例大小,所有區塊(圓弧)的加和等於 100%。但最好避免使用這個圖表,因為肉眼對面積大小不敏感。
8.折線圖中使用連貫的線條
虛線,虛線容易分散注意力。相反,使用實線和顏色,反而容易區分彼此的區別。
9.尊重部分所佔整體的比例
在人們多選的問題上就會出現比例的重疊,不同選項的百分比之和大於一。為了避免這種情況,不能直接把比例做成統計圖。相較於呈現數值,有些圖更著重於表現部分與整體的關係。
10.面積、尺寸可視化
對同一類圖形(例如柱狀、圓環和蜘蛛圖等)的長度、高度或面積加以區別,來清晰的表達不同指標對應的指標值之間的對比。製作這類數據可視化圖形時,要用數學公式計算,來表達準確的尺度和比例。
11.使用大小來可視化值大小可以幫助強調重要信息並添加上下文提示,使用大小來表示值配合地圖使用的效果也非常好。如果您的可視化中有多個大小相同的數據點,它們會混在一起,很難區分值。12.使用相同細節添加的細節(和數字)越多,大腦處理的時間就越長。想想你想要用你的數據傳達什麼,以及最有效的方式是什麼。
13.使用基礎圖形
一個很好的經驗法則是,如果你不能高效理解,你的讀者或聽眾可能也難理解。因此,堅持使用基礎圖形:直方圖、條形圖、維恩圖、散點圖和線形圖。
14.視圖數量
將您的可視化中的視圖數量限制為三到四個。如果您添加太多視圖,大局會被詳細信息所淹沒。
1.顏色深淺
通過顏色的深淺來表達指標值的強弱和大小,是數據可視化設計的常用方法,用戶一眼看上去便可整體的看出哪一部分指標的數據值更突出。
2.使用同一色系
顏色用得太花,會給數據增加不可承受之重,相反,設計師應該採用同一色系,或者類比色。
3.避免使用鮮豔的顏色明亮鮮豔的顏色就像是把所有的字母都大寫想要強調一樣,你的聽眾感覺你在對他們大聲推銷。單調的顏色,反而能很好地用於數據可視化,因為它們可以讓你的讀者理解你的數據,而不至於被數據淹沒。
4.標籤使用不同顏色區分
在某些情況下,在一段時間或一系列的值中,我們可能測量了不同種類的物體。例如,假設我們測量 6 個月以來狗和貓的體重。在實驗結束時,我們想畫出每隻動物的體重,分別用藍色和紅色區分貓和狗。
5.顏色數量
不要在一張圖上使用6種以上的顏色。
1.解釋編碼
通過一定的形狀、顏色和幾何圖形的結合,將數據呈現出來。為了讓讀者能讀清楚,圖表設計者就要把這些圖形解碼回數據值。
2.軸標籤
這可能看起來沒有必要,或者不是很有幫助,但是你無法想像,如果你的圖表有點混亂,或者看到數據的人對此不是很熟悉,你會被問多少次 x/y 軸代表的是什麼。按照前面的兩個繪圖示例,如果要為軸設置特定名稱。
3.標題
如果我們要將數據呈現給第三方,另一個基本但關鍵的要點是使用標題,它和之前的軸標記非常相似。
4.重點元素做注釋
通常情況下,僅僅在圖表的左右兩側使用刻度本身並不是很清楚。在圖上標註值對於解釋圖表非常有用。
5.重要視圖位置
將最重要的視圖放置在頂部或左上角。眼睛通常會首先注意到該區域。
1.數據排序有序
數據類別按字母順序,大小順序,或價值進行排序,以一種合乎邏輯的和直觀的方式來引導讀者了解數據。
2.比較數據
比較是展示數據差異的好法子,但是如果你的讀者不容易看出差別的話,那麼你的比較就毫無意義。確保所有的數據都是呈現在讀者面前,選擇最合適的比較方法。
3.不可扭曲數據
確保所有可視化方式是準確的。例如,氣泡圖大小應該根據區域擴展,而不是直徑。
4.展示數據
讓讀者看到數據,這是可視化的重點。確保沒有數據丟失或被設計。例如,使用標準的面積圖時,可以添加透明度,確保讀者可以看到所有數據。
5.刪除變量很多時候,太多的信息會影響讀者的注意,從可視化中刪除隱含信息是一個好主意,在這種情況下,我認為我們不需要在軸中包含變量的名稱。
6.避免數據噪音把不重要的東西減到最少或者去掉。這包括減弱或移除圖形線,改變軸線、圖形線的顏色,以及用淺灰色描繪電子表格行。使得「數據比率」可以達到一個很高的水平,聽眾會更容易明白其中的數據情況。
良好的數據可視化應該通過使用圖形,清晰有效地傳達數據信息。最佳可視化使您可以輕鬆地一目了然地理解數據。他們將複雜的信息以一種簡單的方式分解,使目標受眾能夠理解並以此為基礎做出決策。
「設計的基本考驗是它有助於理解內容,而不是它的時尚性。-- Edward R. Tufte」數據可視化尤其應該堅持這一理念。目標是通過設計增強數據,而不是引起對設計本身的關注。
俗話說熟能生巧,在每次數據可視化的製作過程中多思考一下,有哪些細節需要注意,這些細節的處理是否合理,相信你的數據可視化水平將會大大提升!
【1】《10個數據可視化技巧,讓你一看就懂》中國統計網【2】《6個技巧,讓數據可視化看起來更專業》中國統計網【4】《數據可視化:6條真正可以遵循的製圖技巧》 CDA數據分析師【5】《10個必備數據可視化圖製作要點》 美作_書籍推薦_
本文提到的一些數據可視化方面的技巧和常見錯誤,在《數據可視化陷阱》(作者:阿爾貝託·開羅,譯者: 韋思遙)也有涉及。此書介紹了圖表製作的原理、閱讀圖表常見的五個陷阱,解釋了為什麼其中隱藏著誤導和扭曲,最終幫助讀者掌握明智應對圖表而不犯錯誤的方法。_往期文章推薦_