數據可視化,值得關注的30個技巧(建議收藏)

2021-02-23 Crossin的編程教室

來源:DataHunter

大家好,歡迎來到Crossin的編程教室!

很多同學學習Python是為了做數據分析及數據可視化。不過要做好可視化,準確、直觀地展現數據及規律,光掌握代碼層面的技術還不夠。

優秀的數據可視化圖表不僅僅是簡單地羅列、總結數據。數據可視化其真正的價值是設計出可以被讀者輕鬆理解的數據展示,因此在設計過程中,每一個選擇,最終都應落腳於讀者的體驗,而非圖表製作者個人。

所以,今天我們拋開代碼,僅就可視化圖表設計層面,來分享一下前人總結的30個小技巧。通過列舉一些容易被忽略的常見錯誤,最終能夠快速提升和鞏固你的可視化製作水平。

1.條形圖的基線必須從零開始

條形圖的原理就是通過比較條塊的長度來比較值的大小。當基線被改變了,視覺效果也就扭曲了。

2.使用簡單易讀的字體有些時候,排版可以提升視覺效果,增加額外的情感和洞察力。但數據可視化不包括在內。堅持使用簡單的無襯線字體(通常是Excel等程序中的默認字體)。無襯線字體即是那些文字邊緣沒有小腳的字體。

3.條狀圖寬度適度

條形圖之間的間隔應該是1/2欄寬度。

4.使用2D圖形

雖然他們看起來很酷,但是3d形狀可以扭曲感知,因此扭曲數據。堅持2 次元,確保數據準確。

5.使用表格數字字體

表格間距賦予所有的數字相同的寬度,使它們排列時能彼此對齊,使比較更容易。大多數流行字體都內置了表格。不確定字體是否正確?就看小數點(或任何數字)是否對齊就行。

6.統一感

統一感使我們更容易接收信息:顏色,圖像,風格,來源……

7.不要過分熱衷於餅圖

展示多個區塊比例大小,所有區塊(圓弧)的加和等於 100%。但最好避免使用這個圖表,因為肉眼對面積大小不敏感。

8.折線圖中使用連貫的線條

虛線,虛線容易分散注意力。相反,使用實線和顏色,反而容易區分彼此的區別。

9.尊重部分所佔整體的比例

在人們多選的問題上就會出現比例的重疊,不同選項的百分比之和大於一。為了避免這種情況,不能直接把比例做成統計圖。相較於呈現數值,有些圖更著重於表現部分與整體的關係。

10.面積、尺寸可視化

對同一類圖形(例如柱狀、圓環和蜘蛛圖等)的長度、高度或面積加以區別,來清晰的表達不同指標對應的指標值之間的對比。製作這類數據可視化圖形時,要用數學公式計算,來表達準確的尺度和比例。

11.使用大小來可視化值大小可以幫助強調重要信息並添加上下文提示,使用大小來表示值配合地圖使用的效果也非常好。如果您的可視化中有多個大小相同的數據點,它們會混在一起,很難區分值。

12.使用相同細節

添加的細節(和數字)越多,大腦處理的時間就越長。想想你想要用你的數據傳達什麼,以及最有效的方式是什麼。

13.使用基礎圖形

一個很好的經驗法則是,如果你不能高效理解,你的讀者或聽眾可能也難理解。因此,堅持使用基礎圖形:直方圖、條形圖、維恩圖、散點圖和線形圖。

14.視圖數量

將您的可視化中的視圖數量限制為三到四個。如果您添加太多視圖,大局會被詳細信息所淹沒。

1.顏色深淺

通過顏色的深淺來表達指標值的強弱和大小,是數據可視化設計的常用方法,用戶一眼看上去便可整體的看出哪一部分指標的數據值更突出。

2.使用同一色系

顏色用得太花,會給數據增加不可承受之重,相反,設計師應該採用同一色系,或者類比色。

3.避免使用鮮豔的顏色

明亮鮮豔的顏色就像是把所有的字母都大寫想要強調一樣,你的聽眾感覺你在對他們大聲推銷。單調的顏色,反而能很好地用於數據可視化,因為它們可以讓你的讀者理解你的數據,而不至於被數據淹沒。

4.標籤使用不同顏色區分

在某些情況下,在一段時間或一系列的值中,我們可能測量了不同種類的物體。例如,假設我們測量 6 個月以來狗和貓的體重。在實驗結束時,我們想畫出每隻動物的體重,分別用藍色和紅色區分貓和狗。

5.顏色數量

不要在一張圖上使用6種以上的顏色。

1.解釋編碼

通過一定的形狀、顏色和幾何圖形的結合,將數據呈現出來。為了讓讀者能讀清楚,圖表設計者就要把這些圖形解碼回數據值。

2.軸標籤

這可能看起來沒有必要,或者不是很有幫助,但是你無法想像,如果你的圖表有點混亂,或者看到數據的人對此不是很熟悉,你會被問多少次 x/y 軸代表的是什麼。按照前面的兩個繪圖示例,如果要為軸設置特定名稱。

3.標題

如果我們要將數據呈現給第三方,另一個基本但關鍵的要點是使用標題,它和之前的軸標記非常相似。

4.重點元素做注釋

通常情況下,僅僅在圖表的左右兩側使用刻度本身並不是很清楚。在圖上標註值對於解釋圖表非常有用。

5.重要視圖位置

將最重要的視圖放置在頂部或左上角。眼睛通常會首先注意到該區域。

1.數據排序有序

數據類別按字母順序,大小順序,或價值進行排序,以一種合乎邏輯的和直觀的方式來引導讀者了解數據。

2.比較數據

比較是展示數據差異的好法子,但是如果你的讀者不容易看出差別的話,那麼你的比較就毫無意義。確保所有的數據都是呈現在讀者面前,選擇最合適的比較方法。

3.不可扭曲數據

確保所有可視化方式是準確的。例如,氣泡圖大小應該根據區域擴展,而不是直徑。

4.展示數據

讓讀者看到數據,這是可視化的重點。確保沒有數據丟失或被設計。例如,使用標準的面積圖時,可以添加透明度,確保讀者可以看到所有數據。

5.刪除變量

很多時候,太多的信息會影響讀者的注意,從可視化中刪除隱含信息是一個好主意,在這種情況下,我認為我們不需要在軸中包含變量的名稱。

6.避免數據噪音

把不重要的東西減到最少或者去掉。這包括減弱或移除圖形線,改變軸線、圖形線的顏色,以及用淺灰色描繪電子表格行。使得「數據比率」可以達到一個很高的水平,聽眾會更容易明白其中的數據情況。

良好的數據可視化應該通過使用圖形,清晰有效地傳達數據信息。最佳可視化使您可以輕鬆地一目了然地理解數據。他們將複雜的信息以一種簡單的方式分解,使目標受眾能夠理解並以此為基礎做出決策。

「設計的基本考驗是它有助於理解內容,而不是它的時尚性。-- Edward R. Tufte」數據可視化尤其應該堅持這一理念。目標是通過設計增強數據,而不是引起對設計本身的關注。

俗話說熟能生巧,在每次數據可視化的製作過程中多思考一下,有哪些細節需要注意,這些細節的處理是否合理,相信你的數據可視化水平將會大大提升!

【1】《10個數據可視化技巧,讓你一看就懂》中國統計網【2】《6個技巧,讓數據可視化看起來更專業》中國統計網【4】《數據可視化:6條真正可以遵循的製圖技巧》 CDA數據分析師【5】《10個必備數據可視化圖製作要點》 美作

_書籍推薦_

本文提到的一些數據可視化方面的技巧和常見錯誤,在《數據可視化陷阱》(作者:阿爾貝託·開羅,譯者: 韋思遙)也有涉及。此書介紹了圖表製作的原理、閱讀圖表常見的五個陷阱,解釋了為什麼其中隱藏著誤導和扭曲,最終幫助讀者掌握明智應對圖表而不犯錯誤的方法。

_往期文章推薦_

相關焦點

  • 數據可視化必須注意的30個小技巧
    優秀的數據可視化圖表只是羅列、總結數據嗎?當然不是!數據可視化其真正的價值是設計出可以被讀者輕鬆理解的數據展示,因此在設計過程中,每一個選擇,最終都應落腳於讀者的體驗,而非圖表製作者個人。這裡給大家總結了數據可視化的製作的30個小技巧,通過列舉一些容易被忽略的常見錯誤,最終能夠快速提升和鞏固你的可視化製作水平。
  • 請牢記這5個高效的數據可視化技巧丨Data Studio
    Data studio可謂是可視化的重要工具,學會其中的一些小技巧,可幫助你大大提高工作效率!本文主要講述有關目標、維度指標、作圖等相關的小技巧。文丨武薈觸脈諮詢數據分析師「為什麼加班是我的工作常態?」像這種感嘆在工作的時候經常能聽到,那你是否想過是什麼原因導致這樣的結果呢?
  • Python數據可視化,完整版操作指南(建議收藏)
    五條:住進ICU賣掉兩套房,為什麼我建議你不要輕易買保險?.讓我們看一下使用Python進行數據可視化的主要庫以及可以使用它們完成的所有類型的圖表。我們還將看到建議在每種情況下使用哪個庫以及每個庫的獨特功能。我們將從最基本的可視化開始,直接查看數據,然後繼續繪製圖表,最後製作交互式圖表。數據集我們將使用兩個數據集來適應本文中顯示的可視化效果,數據集可通過下方連結進行下載。數據集:github.com/albertsl/dat這些數據集都是與人工智慧相關的三個術語(數據科學,機器學習和深度學習)在網際網路上搜索流行度的數據,從搜尋引擎中提取而來。
  • 外網統計2019年的25種最佳數據可視化,值得收藏
    來自義大利的數據可視化組織Visual Agency已將Leonardo Da Vinci的日記和筆記本的美麗數字圖書館匯集在一起​。這是他迄今為止最大的數字收藏。但這還不是全部,它的設置方式會讓數據可視化愛好者和藝術家都讚嘆不已。
  • 五個技巧教你用編程實現數據可視化
    這篇文章不僅提供了學習路徑,還提出最實用的建議:現在就著手去做吧!◆ ◆ ◆導 讀目前有很多用於數據可視化的軟體和工具,都非常便捷實用。我很難回答像是「我應該學著用什麼工具?像Excel這樣一行代碼都不用寫就可以做數據可視化的工具,甚至被有些人用來畫風景呢。但是,寫代碼做自己的數據可視化還是有不少好處的,除了更加靈活高效外,還可以完全根據自己的需要進行「定製」。用編程實現可視化其實是非常有趣的,雖然從起點學習編程不是那麼容易,而且大部分人都會說沒有足夠的時間,但我依然覺得,為了獲得長期的收益,從一開始花點功夫還是值得的。
  • 30個值得推薦的數據可視化工具(2020年更新)
    只需要3個步驟,你就可以製作你自己的社交媒體(如Instagram和LinkedIn)圖表,而且支持動態圖像和實時數據。Visme還提供教育折扣和非盈利機構折扣。有了Grow,企業裡的每個人都可以跟蹤他們認為有意義的數據,並創建自己的特定數據儀錶板,Grow還支持從150多個數據源導入數據。Grow表示,他們的處理速度是競爭對手的8倍,並支持超過300個預先構建的報告和實時數據更新。
  • 6個技巧輕鬆玩轉數據可視化,讓你的數據「會說話」
    數據可視化工具將數據以可視化的形式表現了出來,例如創建圖形、表格、導航圖等,這使得分析對於業務用戶來說更具意義。 鑑於人類大腦處理信息的方式,使用圖表等圖形元素實現複雜數據的可視化要比使用電子表格等基於數字的報告更容易發現一些趨勢。藉助於數據可視化,業務分析師通過手頭上的數據集就能夠輕鬆發現市場趨勢、模式和異常值。
  • MATLAB 統計分析與數據可視化
    對數據進行分析,讓數據更可視學術中國第十三期MATLAB統計分析與數據可視化研習營 在大數據的海洋裡
  • 做好數據可視化的技巧和原則!
    14.視圖數量將您的可視化中的視圖數量限制為三到四個。如果您添加太多視圖,大局會被詳細信息所淹沒。1.顏色深淺通過顏色的深淺來表達指標值的強弱和大小,是數據可視化設計的常用方法,用戶一眼看上去便可整體的看出哪一部分指標的數據值更突出。
  • 使用Matplotlib可視化數據的5個強大技巧
    數據可視化用於以更直接的表示方式顯示數據,並且更易於理解。它可以用柱狀圖、散點圖、折線圖、餅圖等形式形成。許多人仍然使用Matplotlib作為後端模塊來可視化他們的圖形。在這個故事中,我將給你一些技巧,使用Matplotlib創建一個優秀圖表的5個強大技巧。1.
  • 數據可視化設計系列(1): 數據可視化的定義
    這樣理解來,」可視化「也在描述一種「讓大家看見的」發展方向,或者能力。數據可視化的領域是廣博且在不斷擴展的,那用五個字去完整地整個領域終究稍顯單薄。本文旨在給數據可視化(Data Visualization)下一個定義,盡力為大家引入數據可視化的無窮趣味和無儘可能性。那麼,什麼是數據可視化呢?
  • Excel可視化百分比數據的小技巧!
    在公司報表中呈現百分比數據時,如年任務完成進度為67.23%,可使用簡約纖細圓環圖呈現,效果如下:
  • Python數據可視化之高速繪圖神器PyQtGraph庫,強烈建議收藏
    01為什麼使用PyQtGraph庫我們知道,在Python中,已經有了很多可供選擇的數據可視化庫。但是這些繪圖庫也存在著不足,即在圖形繪製速度上有所欠缺,特別是對於科研算法方面的數據可視化,很多情況需要實時繪圖,要求能夠提供儘可能快的繪製刷新速度,那這些庫顯的有些力不從心了。而我們下面要介紹的繪圖庫-PyQtGraph庫,則在繪圖速度方面表現尤其突出,在不失繪圖美觀、功能強大的前提下,在繪圖速度方面作了極大的優化,特別適合於實時數據採集的動態圖形繪製場合。
  • 六種大數據可視化的簡化技巧
    六種大數據可視化的簡化技巧 大數據量是如此之大,以至於很難想像您的數據實際上是什麼樣子。數據的規模和複雜性很難說明,更不用說探索了。 幸運的是,不需要IMAX 劇場或虛擬世界即可查看大數據。
  • 從數據可視化到交互式數據分析
    然而,可視化可以通過數據分析來增加對複雜問題的理解,這樣的項目雖然不多見,但不代表不重要。數據可視化的三個主要用途我知道我這樣總結可能存在嚴重簡化的風險。但是,我發現根據主要目的(有意或無意)確定數據可視化的三類主要用途是很有用的,這也有助於我在本文後面闡明一些觀點。
  • 50個最有價值的數據可視化圖表(推薦收藏)
    本文總結了在數據分析和可視化中最有用的 50 個 Matplotlib 圖表。這些圖表列表允許您使用 python 的 matplotlib 和 seaborn 庫選擇要顯示的可視化對象。這些圖表根據可視化目標的 7 個不同情景進行分組。例如,如果要想像兩個變量之間的關係,請查看「關聯」部分下的圖表。
  • 國外常用的十個數據可視化工具
    有時,數據集如此之大,以至於無法從中辨別出任何有用的東西。這就是數據可視化的用武之地。創建數據可視化很少會很簡單。設計人員似乎並不能簡單地獲取具有數千個條目的數據集並從頭開始創建可視化效果。當然可以,但是誰願意花費數十或數百小時在散點圖上繪製點?這就是數據可視化工具的用武之地。
  • 一個成功而有價值的數據可視化應該注意這25點技巧
    編輯導語:我們在工作中經常會分析數據,通過圖表等方式可以幫助我們更加清晰明了地看到分析結果,所以一個成功有價值的數據可視化能發揮到很大的作用;本文作者分享了關於數據可視化注意的25點技巧,我們一起來看一下。
  • Excel地圖數據可視化
    Hello,大家好,今天跟大家分享下我們如何在地圖上實現數據的可視化,今天我們要用到的功能是三維地圖,三維地圖其實就是powermap,只不過在2016版之後的版本中被稱為三維地圖,powermap是powerbi的組件之一,它主要是對帶有地理位置的數據進行可視化的操作,使用powermap進行地圖數據可視化的操作也非常的簡單
  • 超強盤點:常用的6個大數據可視化分析工具
    數據能表現出更為客觀、理性的一面,能我們更加直觀、清晰的認識世界,而根據數據,企業也才能制定出正確的策略。今天給大家推薦常用的5個大數據可視化分析工具,希望對你們有幫助。2、GephiGephi是開放式的圖形可視化平臺,在市場上很受歡迎,因為不用具備任何編程知識,就可使用Gephi製作高質量的可視化圖表。它重點關注可視化,而非分析,它可以處理相對較大的圖形,基本上可以無壓力地運行多達十萬個節點,它還可以計算度數,中心性等常見指標。