這篇文章把數據講透了(五):數據可視化(下)

2020-12-23 人人都是產品經理

編輯導讀:隨著「數智化」時代的到來,我們生活中的方方面面都離不開數據,而你真的了解數據嗎?本文作者將為大家重新解讀數據的概念和價值,以及數據的價值是如何在「數智化」時代下一步一步得到運用與升華的,一起來看看~

一、前言

上幾期文章中,我們已經了解到「數據」是一個龐大的體系(如下圖所示),並用了菜市場的例子,為大家講解數據來源的含義;用買菜的例子,為大家講解數據採集的步驟;用洗菜、擇菜的例子,為大家講解數據清洗的方法…

而今天小陳主要給大家講解,我們學會做菜以後,怎樣把烹飪方法簡單易懂的傳授給他人,即數據可視化的過程。

二、可視化圖表的選用原則(參考麥肯錫系列書目——《用圖表說話》)

先上圖表選取原則乾貨(見下圖),下面我們再針對每個表格的使用進行逐一講解

圖片來源——公眾號【高端商務報告】

1. 成分類

(1)餅類

一般情況下,我們會選擇餅圖來呈現成分的對比關係。而餅圖使用也存在下面這些「潛規則」

a.遵循閱讀習慣,餅圖成分重要性需要呈順時針順序

在閱讀餅圖時,人們都會下意識的從12點鐘方向,順時針讀下去。所以,為了迎合人們的閱讀習慣,我們需要將數據的佔比大小、重要性按照順時針方向切片展示。

b.切片數量不要超過7個,如果餅圖類別很細,對於受眾而言,對比起來是非常困難的。所以,當你發現切片數量將超過6個時,將其餘不那麼重要的分支整合歸為「其他」項

c.儘量避免使用立體餅圖,除非你真的有信心避免視覺錯覺。

如下圖所示,從受眾的角度看這張立體餅圖,是不是很難分清楚兩個佔比最小的扇形究竟誰大誰小?而如果我們採用「俯視」的視角看這張餅圖,就會好區分很多!

2. 項類對比

首先,我們需要明確項類對比的含義是什麼,以及它指的對比維度是什麼?一般來說,常見的維度對比無外乎數據大小、佔比這兩類。而就圖表類型而言,項類對比最常用圖表類型為條形圖,下面我們來談一談條形圖使用的原則

(1)符合嘗試的默認排序(從大到小、從高到低、從好到差),除非你需要遵循其他邏輯排序

一般來說,人們看條形圖比較想要獲取的是頭部項類對比訊息,沒有人會特別注意尾部項類的佔比和對比。所以為了迎合人們的閱讀習慣,我們需要按照從大到小、從高到低、從好到差的默認條形圖排序實現繪製

當然,遵循其他特定的邏輯排序也是可取的。例如,某公司對比業內競爭者市場佔比時,特意按照進入市場的時間長短進行條形圖排序。如下所示,是按照品牌邏輯對條形圖進行展示。

(2)條形圖間隔<條形圖本身寬度

麥肯錫條形圖的分類間距一般設置為本身寬度的20%-50%;而經濟學人的分類間距則為50%-80%,保潔等大型公司的報表中也呈現10%-30%不等。如下所示,是經濟學人一篇文章中的散點圖和條形圖。

雖然,間距不一,但不難發現,業內幾乎沒有分類間距>條形寬度本身的

3. 時間序列、頻率分布

時間序列,顧名思義,就是一條時間線下數據類別、變量的變化;而頻率分布可能會稍微難懂一點,但我相信看到下面這個例子,你就不陌生了!

相信大家大學上《概率論》的時候,都看過這個函數!概率密度函數,沒錯,他就表示了頻率分布!

時間序列、頻率分布製圖時,通常選取柱形圖、折線圖兩類,而這兩類值間應該怎樣進行選取呢?

在麥肯錫的《用圖表說話》一書中,建議以8個時間點為區分界限,當時間點>8時,採用折線圖,減少視覺對比疲勞,當時間點<8時,選取柱形圖。以下是柱狀圖、折線圖兩種圖表的使用規則。

其次,柱狀圖和折線圖的選擇還和數據特徵有關,當你想凸顯特定時間段內產量、銷量等數據指標的時間序列變化,用柱狀圖比較合適,因為它還能夠凸顯程度、數量;而折線圖則更注重變化、變化趨勢,在表現數據發展趨勢和時間序列預測分析中較為常用

(1)柱形圖

a.柱形圖間隔<柱形圖本身寬度

這一點其實和條形圖類似,此處就不做贅述了

b.堆積柱狀圖使用有度,避免對比混亂

堆積柱狀圖適用於對比多個項目、類別的成分關係,是表達成分對比關係的重要方式。

但需要特別注意,百分比堆積圖儘量不要對比每個類項超出3個細分成分,否則會帶來對比混亂。如下所示,堆積柱狀圖的類項已然超過3個,對比起來就會很混亂。

(2)折線圖

a.趨勢線要突出(顏色、粗細等)

折線圖是以上圖表中,最能夠直觀展示上升、下降、波動、維持原狀趨勢的圖表,它側重於勾勒變化和變化趨勢,用於表達數據的發展趨勢。

但,趨勢線作為折線圖中的主體,一定要突出。而這個突出,可以是顏色上的突出,使用紅色等重點色;也可以是粗細上的突出,比如,我們一定要注意到折線圖趨勢線比網格線、刻度線粗!

4. 相關性

相關性分析中,我們常使用散點圖直觀地顯示變量間的相關強度、相關方向,並用於探索性數據分析,做出擬合曲線和回歸方程,對未來趨勢進行探索性預測

(1)散點、氣泡圖

a.散點、氣泡大小需要直觀

人都是視覺動物,而圖表需要做到就是把人的視覺利用到極致!散點圖、氣泡圖中,每一個散點、氣泡就代表著一個樣本個體,而散點、氣泡的大小就能只管的展示出該樣本的大小。所以,我們在製作圖表時,需要充分利用這一點,用散點、氣泡大小直觀的展示樣本間的關係。

三、結語

以上,就是本期可視化圖表選取原則的全部內容!我們【這篇文章把數據講透了】系列到這裡也就完結了!撒花!!

接下來,你想看哪方面的文章呢?

#相關閱讀#

這篇文章把數據講透了(一):數據來源

這篇文章把數據講透了(二):數據採集

這篇文章把數據講透了(三):數據清洗

這篇文章把數據講透了(四):數據挖掘

這篇文章把數據講透了(五):數據可視化(上)

這篇文章把數據講透了(五):數據可視化(中)

本文由 @小陳同學ing. 原創發布於人人都是產品經理,未經作者許可,禁止轉載。

題圖來自Unsplash,基於CC0協議。

相關焦點

  • 這篇文章把數據講透了(五):數據可視化(中)
    編輯導讀:隨著「數智化」時代的到來,我們生活中的方方面面都離不開數據,而你真的了解數據嗎?本文將為你重新解讀數據的概念和價值,以及數據的價值是如何在「數智化」時代下一步一步得到運用與升華的。因內容頗多,筆者將分幾期為大家進行講解。
  • 這篇文章把數據講透了(四):數據挖掘
    編輯導讀:隨著「數智化」時代的到來,我們生活中的方方面面都離不開數據,而你真的了解數據嗎?本文將為你重新解讀數據的概念和價值,以及數據的價值是如何在「數智化」時代下一步一步得到運用與升華的;因內容頗多,筆者將分幾期為大家進行講解。
  • 揭秘:數據可視化設計師如何建立靈感庫?
    本文以本人工作經驗為基礎,從「搜什麼——去哪兒搜——怎麼搜——素材的整理——靈感的迭代與更新」五個方面,系統性分析了該問題對應的解決方法,這在數據可視化行業內尚屬首次。當然了,本文雖面向數據可視化設計師群體,但其中的方法是通用的,運用在其他設計領域也完全事半功倍。
  • 【數據可視化】裡約奧運數據可視化圖表
    提起《衛報》的殺手鐧,非數據新聞可視化莫屬。
  • 聊一聊幾種常見的數據可視化
    老曹一聽,這小夥越來越可以啊,主動學習的心態越來越好了,心中還是很滿意的:「小王,既然你這麼愛學習,那我就給你好好講一講。」數據產品經理小王:「你還真別說,我以前還真以為這倆是一回事呢,原來折線圖和堆積面積圖的應用場景就決定了他們倆根本不是一種可視化方式。」
  • 超硬核的 Python 數據可視化教程!
    matplotlibpython中最基本的作圖庫就是matplotlib,是一個最基礎的Python可視化庫,一般都是從matplotlib上手Python數據可視化,然後開始做縱向與橫向拓展。Seaborn是一個基於matplotlib的高級可視化效果庫,針對的點主要是數據挖掘和機器學習中的變量特徵選取,seaborn可以用短小的代碼去繪製描述更多維度數據的可視化效果圖其他庫還包括Bokeh(是一個用於做瀏覽器端交互可視化的庫,實現分析師與數據的交互);Mapbox(處理地理數據引擎更強的可視化工具庫)等等本篇文章主要使用
  • Excel數據分析系列(五):Excel 數據可視化
    作者 | CDA數據分析師Excel圖表構成元素認識Excel圖表的基本構成元素,對我們選擇和繪製可視化圖形是非常重要的。很多人都忽視了這一點,以至於製作圖表的效率很低,不知道如何修改圖表元素。Excel圖表由圖表區、繪圖區、標題、數據系列、圖例和網格線等基本部分構成。
  • 值得推薦的數據可視化工具都在這
    AntV 又是螞蟻金服出品(阿里系)的一套數據可視化語法,貌似是國內第一個採用The grammar Of Graphics這套理論的可視化庫。antv帶有一系列的數據處理API,簡單數據的數據歸類,分析的能力,被很多大公司用作自己BI平臺的底層工具。
  • 如何全面解析數據並創造數據故事 | 網際網路數據資訊網-199IT |...
    數據探索2. 特徵可視化3. 模型創建4. 模型比較五、講故事的最佳實踐六、結尾語一、講故事的必要性講故事的藝術,既簡單又複雜。故事激發思考,並能提出以前沒有被理解或被解釋的見解。為了顯著地提高你的分析,你要做的最重要的一件事是要講一個故事。你生成的流程最終的結果中可能會有很多衝突。亞里斯多德的經典五點計劃,有助於提供強烈的影響:傳遞一個能引起聽眾興趣的故事或觀點;提出一個必須解決或回答的問題;為你提出的問題提供一種答案;描述採用該答案下的行動方案的具體的好處;提出行動號召。我構建報告的一般方式是加入圖表,它們能讓我更好的理解數據。
  • 「疫情分析」的數據可視化大屏設計要點
    此刻,疫情仍然在蔓延,如何利用全面、有效,及時的數據和可視化技術準確感知疫情態勢,為決策者、管理人員提供宏觀數據依據,節省決策時間,讓數據可視化成為管理者和時間賽跑的幫手,是快速打贏這場「戰疫」的關鍵。在家為祖國做貢獻期間,設計了該NCP疫情數據可視化大屏,並總結了一些關於數據可視化大屏設計的思考。
  • 重磅:包郵寄送《Python數據可視化之美》
    文章留言點讚前3名的朋友,送親筆籤名的《Python數據可視化之美》,名單揭曉日期為
  • 2020「智慧杯」數據可視化大賽
    培養出足夠的、合格的數據人才,對我國在未來掌握大數據的核心價值起著至關重要的作用。為滿足社會對大數據人才的需求,為助力推動大數據相關學科的深化發展,助力大數據產業人才培養,今年由CDA數據科學研究院聯合永洪科技主辦的數據可視化大賽正式啟動(以下簡稱「競賽」)。本次競賽是數據可視化能力大賽,旨在促進數據可視化技能、數據可視化科學思維、數據可視化實踐能力。
  • 酷炫的可視化圖表工具來幫忙 深度評測五大Python數據可視化工具
    不少Python用戶的一大訴求是做出各種酷炫的可視化圖表,而這就需要了解清楚工具特色,才好在製作不同類型圖表順利找到適合自己的那一款。今天就來聊聊五個Python數據可視化的庫Matplotlib、Pyecharts、Seaborn、Plotly、Bokeh各有哪些優缺點。
  • 想用Python做數據可視化?先邁過這個「坎」
    用過python的人都會面臨一個問題,尤其是初學者:我應該選哪個來實現數據可視化? 這就是今天分享這篇文章的初衷,通過列舉一些使用頻率較高的工具,以及使用它們創建簡單的條形圖的方法,幫助各位進行簡單的梳理。
  • Tableau 全球用戶大會可視化分析爭霸賽作品展示,感受數據大神們的巔峰對決
    Russell Spangler、Robert Rouse、Curtis Harri 三位參賽選手在 15000 多人的注目下現場競技,各顯數據可視化身手。下載 Tableau 工作簿,你也可以用數據講故事!Viz 徵集評選活動已經開啟
  • 大公司都是怎麼做數據可視化規範的
    本周,表哥嘗試翻譯了一篇3次凱度信息之美獲獎者——Amy Cesal 的文章《What are Data Visualization Style Guidelines》,一起看看她是如何看待數據可視化設計系統的吧!1、什麼是數據可視化設計系統?
  • Excel微圖表數據可視化大全,超乎你想像!
    =REPT($E$2,B2/AVERAGE($B$2:$B$11)*10)步驟2:在E2和F2設置下拉菜單,之前講過這方面技術,不再此處贅述。新來的同學請回復「下拉菜單」獲取設置方法。步驟3:設置條件格式,讓微圖表智能變色。
  • 產品設計心法:數據看板篇
    本篇包含了數據看板的幾個內容:什麼是數據看板?為什麼需要數據看板?數據看板分為哪幾類?數據看板包含哪些內容?數據如何可視化?如何布局?一、什麼是數據看板?提到「數據看板」就不得不先說「數據可視化」,百度對「數據可視化」的定義是:指將大型數據集中的數據以圖形圖像形式表示,並利用數據分析和開發工具發現其中未知信息的處理過程。
  • kaggle:NBA球員投籃數據分析與可視化
    鑑於目前小編的水平,不敢貿然去參賽,生怕做出來的結果排名墊底,於是盤算著先拿幾個kaggle題的數據集來練手,一方面鍛鍊自己的數據思維和分析能力,另一方面則是提升R或者Python的coding能力。小編經過幾天的探索,結合了kaggle上一幹數據大神們的分析方案,決定分兩篇推文展現對該數據集的分析挖掘。本文主要給大家展現對該數據集的探索性數據分析(EDA)和可視化,下篇將對數據擬合一些機器學習算法來預測球員們的投籃命中率情況。
  • 9款好用的BI數據可視化工具
    大數據、數據分析的興起和火爆,也帶動了數據可視化的廣泛應用。說起數據分析和可視化的關係,就好比你為一堆散亂的拼圖寫了一份說明,告訴他這個數據是什麼樣子,代表什麼。可以說,數據可視化雖然不是必不可少的,但卻是可以加快效率,為報告錦上添花的。