數據分析中,如何解讀條形圖和曲線圖

2020-12-18 騰訊網

通過數據解讀商業報告,很多情況下,我們看到的都是圖表的形式。有些同學們反饋希望再多介紹一些圖表類型的解讀,或者實例的解讀。所以本期我們會講條形圖和曲線圖的解讀。

千萬別以為條形圖和曲線圖很簡單,裡面也有不少學問哦。很多同學看圖只是一個形式,並沒有真正領會圖中作者要表達的準確觀點。還有部分同學基本不解讀數據報告,他們只會坐等報告提供者送上結論來。

話說,求人不如求己。自己會讀圖這也是一門手藝啊,判斷數據、理解數據、發現事實、產生見解這四個步驟,同樣適合針對數據圖表的解讀。注意,解讀數據報告並不只是單純的找結論,沒有過程哪來的結論?

01 條形圖解讀

條形圖的解讀:先看排名,再看數據,最後結合業務認知來發現更多的事實。

下圖是高德地圖發布的《2018春節十大「空城」》條形圖,現在大家嘗試解讀一下,從中可以發現有哪些事實?

只要求是事實就行了,暫不要求結論,比如北京排在第一,這就是這個數據報告中的事實(雖然這個事實有點簡單)

2018春節十大「空城」

這張圖,我之前在網上放過,網友們在上面有各種評論,各種先入為主,各種不顧事實......

網友的評論

大部分人的評論都是比較隨便、隨性的,只有極少數網友會認真思考回復。其實要找出圖中的事實也不難,我們要理解這個圖呈現的數據:

時間:2月16日-2月21日(年初一 ~ 年初六)

對象:10個城市

指標:擁堵裡程下降率,就是指春節期間的擁堵裡程,和之前的擁堵裡程作對比,得出的下降比率。下降比率TOP10的城市,就呈現在以上的圖表當中。

對圖表有了整體的了解後,我們再分別深入到時間、對象、指標中,去嘗試發現其中的事實。

時間和指標方面基本沒什麼問題,那我們就把重點鎖定在對象,通過觀察這10個城市,我們也就不難發現以下的事實:

1、北上廣深,深圳竟然不在榜?

平常我們都是說一線城市,北上廣深,既然北、上、廣都在圖上,很自然我們就會想到,為什麼沒有深圳,至於具體是什麼原因,我們就還要找更多的數據去找答案。

2、東北三省的3個省會城市全在榜

這也是一個很有意思的特點,平常我們在很多的地理分析中,東三省都是很常用的一個習慣。

3、東莞是唯一進前十的非省會城市

4、重慶是唯一上榜的西部城市

5、合肥排在第三超出了我的想像

先仔細看清楚每一個上榜的城市,然後再尋找多個城市間是否有同屬哪個區域等等,看看是否有什麼是出乎你意料的情況,而那個出乎你意料的點,就是你要關注的地方。一定要結合自己的認知去發現事實,特別是很多事實是藏在表面數據的背後的。

——————

問題來了:深圳為什麼不在TOP10?

從定義入手:

空城率 =(春節擁堵裡程數-平時擁堵裡程數)÷平時擁堵裡程數

=春節擁堵裡程數÷平時擁堵裡程數-1

要不在榜或排名靠後必須滿足:

1、春節不堵或有點堵,平時也不怎麼堵;

2、春節很堵,平時不怎麼堵(參考三亞)

3、春節堵,平時也堵。

而深圳今年的事實是:

1、平時擁堵下降:深圳2017治堵有成效,高德《2017年中國主要城市交通分析報告》中,深圳已成為第五的擁堵緩解城市,下降7.51%。並且深圳擁堵率排在全國30幾名了。

2、春節人車局部增加:深圳2018年春節旅遊接待人員在全國地級市中排名第6位,春運期間全國駕車跨城出行路線排在第一的是東莞-深圳。春節期間深圳還暫停「限行令」(允許外地車進城)。

而網上有媒體將「2017年,深圳全市年末常住人口1252.83萬人,比2016年增加了近62萬人」,這是不靠譜的,因為這62萬人不是春節才新增的,他是一個漸變過程。不是主因。此題重點是考慮數據的突變!

02 曲線圖解讀

曲線圖非常常見,是我們必須要學會解讀的圖表。接下來,我們來學習一下曲線的解讀方向:

曲線圖解讀

1、看趨勢

曲線圖一般與時間序列相關,它的橫坐標大部分都是年份、季度、月份、天,甚至時、分、秒,所以很自然的解讀方向就是看趨勢。

首先看總趨勢和局部趨勢(有時候總趨勢不明顯,但是局部卻異常明顯);其次看趨勢是向好還是向壞的方向發展;最後看趨勢的波動是變大還是變小?等等……

2、找極值

極值在我們讀大部分圖表時,都是要關注的一個點。從曲線圖當中,也很容易找到整條曲線當中,它的最大值、最小值是多少。找出最大值、最小值後,結合我們日常業務,可能就會繼續往下問,為什麼這個時間是最大值,那個時間是最小值,然後再從更多的數據中尋找答案。

3、算平均值

在曲線圖中,很多都是在一定時間周期內,呈現的波動趨勢。那在這個波動趨勢中,我們的大腦要知道平均值線在什麼地方(一般算個大概就行,腦補即可)。也就是說,哪些時間點的波動是大於平均值,哪些是小於平均值的?有無異常。

4、尋規律

找規律相對會難一點,可能要結合我們上述的1-3點,還要結合我們的業務實際,綜合進行分析,才可能找到其中的規律。

以下是某員工在連續30天的成交客戶數的趨勢圖,我們嘗試從中看是否能找到什麼規律:

某員工連續30天的成交客戶數

我們從上圖中,沒有明顯的趨勢,最小值就是0,那這個員工他的成交客戶最少的日子有什麼規律嗎?仔細觀察可以發現,他的最小成交客戶數,基本都出現在每周的星期五。為什麼呢?

是因為他是當天休息嗎?還是他負責的客戶有這個特點?還是其他什麼原因?

這就需要更多的數據,才能尋找其他的原因了。

5、比大小(2根曲線以上適用)

圖中如果有2根以上的曲線,我們就可以從中比較2根曲線值的大小,例如下圖:

雙曲線圖

從上圖可以看到,基本上藍色的線都是在橙色線之上,其中在16年8月、10月,17年2月,橙色線超過了藍色線。以上這些從曲線圖中發現的點,都會引發我們去關注,引發我們進一步去分析。

今天為大家介紹了條形圖的解讀,以及曲線圖讀的5個方向,大家可以在日常的工作中多點去練習,或者從網絡中多找些報告案例來進行演練,從不斷的實踐中吸收知識。

記住:圖表解讀不僅僅是找結論!

—— 近期重點文章 ——

相關焦點

  • 解讀2020數據分析技術十大趨勢,看DataFocus如何持續創新!
    解讀Gartner 2020數據和分析技術十大趨勢,看DataFocus如何持續創新! 新冠疫情對數據分析領域有什麼影響?新的技術又將帶來哪些機會?每個數據分析領域的創新者和從業者都在關注著這些問題。
  • 數據分析學習:手把手教你用直方圖、餅圖和條形圖做數據分析...
    對於定量數據,要想了解其分布形式是對稱的還是非對稱的、發現某些特大或特小的可疑值,可做出頻率分布表、繪製頻率分布直方圖、繪製莖葉圖進行直觀分析;對於定性數據,可用餅圖和條形圖直觀地顯示其分布情況。
  • 《穹頂之下》那些常見的數據圖表是如何使用的 | 網際網路數據資訊網...
    通過視頻網站、社交網絡等共同的力量,讓數千萬乃至上億人再次認識到霧霾的危害,並且形象化的對霧霾的構成做了解讀,並且通過柴靜的行為來告訴我們自己可以做些什麼。當然,這不是小兵博客今天要說的,除了重新認識霧霾之外,我同樣關心的是這段視頻中露出的數據分析圖表,簡單來說,視頻中的柱圖、餅圖、線圖我們在數據分析報告中經常見到,是最基礎、最多見的圖表,但就是這些簡單常見的圖表,卻帶給我們完全不一樣的易懂和震撼。
  • C#開發電子病歷功能及系統體溫曲線圖
    護士每天記錄病人的體溫等各項信息,錄入到資料庫中,系統自動生成電子體溫單,並繪製成曲線圖。體溫曲線圖直觀地顯示了病人的體溫等相關數據,這些數據與有關疾病和治療的知識相結合,可作為進一步診斷及確定治療方案的基礎。  筆者參與開發的電子病歷系統根據某大型醫院的實際需求,在.NET平臺下全程採用C#語言開發實現。
  • 統計數據分析軟體(NCSS-PASS 11)
    下載中心 統計數據分析軟體(NCSS-PASS 11) *使用豌豆莢官方商店能下載目標軟體,安裝更安全 統計數據分析軟體
  • 在網絡營銷中,如何建立數據分析思維?
    在新媒體時代的大浪中,數據分析思維越來越顯得越來越重要,能極大地提升我們的工作效率,那麼在網絡營銷中,如何建立數據分析思維呢?一、整理數據並發現問題在網絡營銷進行前、進行中、進行後都會有各種各樣的數據出現。
  • 數據可視化之旅(三):數據圖表的選擇(中)
    2.條形圖條形圖,可以視為是柱狀圖的一種變體,在大部分情況下,是可以互換的。那麼在哪些情況下,條形圖能比柱狀圖更好的展示數據呢?條形圖,相比柱狀圖而言,可以展示更多的數據條數,一般不要超過30條。面積圖,一般也是用於趨勢分析中。當需要分析各個系列,隨時間的變化趨勢時,此時使用「重疊對比型面積圖」比較合適;當既需要分析整體隨時間的變化趨勢,又要了解整體的各構成項隨時間的變化趨勢時,使用「堆砌對比型面積圖」比較合適。
  • excel圖表應用技巧:不同類型圖表對數據表現的意義和作用
    Excel2016內置的圖表有14大類:柱形圖、折線圖、餅圖、條形圖、面積圖、XY(散點圖)、股價圖、曲面圖、雷達圖、樹狀圖、旭日圖、組合圖等,每種圖表類型下還包含不同的子圖表類型。不同類型的圖表表現數據的意義和作用是不相同的,如下面幾種圖表類型,它們展示的是同樣的數據,但表達出的含義卻截然不同。 下圖主要展示了數據的趨勢和各過程。
  • 初一地理上:如何閱讀氣溫曲線圖降水柱狀圖
    氣溫曲線和降水柱狀圖觀察上圖:帶圓點的曲線為氣溫曲線。黑色的豎條為降水柱狀圖。這是某地的氣溫曲線和降水柱狀圖。根據這幅圖可以分析出某地的半球位置。溫差。氣候特徵。氣候類型。首先看氣溫曲線的偏向,得出,該地氣溫曲線往北偏,也就是七月氣溫最高,所以該地為北半球。(規律:曲線北偏,北半球,南偏南半球)其次看氣溫曲線彎曲輻度較大,說明該地溫差大。
  • 方差分析F檢驗結果如何解讀?
    我們在閱讀論文時,經常看到(方差分析)F檢驗的結果,比如F(3,19)=3.4,這是什麼意思?我們自己對照描述統計結果時,如何根據SPSS輸出的方差分析表,寫出F括號中的兩個數字? 這是本篇文章要解決的問題。
  • 521G數據:兩極分化嚴重 10月份頁遊開服數據分析
    一、10月份網頁遊戲開服數據分析 其實就增長比例來說,37wan的比例和其他部分平臺的增長比例是差不多的,但 37wan是一直穩定增長且本身開服基數大,導致其和其他平臺的開服數差距越來越大。37wan的王者地位是無人能撼動了。 二、10月份熱門頁遊開服數據分析
  • 愛數非結構化數據中臺賦能知識管理,入選愛分析中國數據智能應用...
    首頁 > 傳媒 > 關鍵詞 > 愛分析最新資訊 > 正文 愛數非結構化數據中臺賦能知識管理,入選愛分析中國數據智能應用趨勢報告
  • 如何對APP進行數據分析?
    日常數據運營指標的監控日常數據運營指標,如下載用戶數、新增用戶數、活躍用戶數、付費用戶數等,這些數據都是運營中最基礎最基本的數據,是大Boss們最關注的核心指標。這些指標對數據的準確性和及時性要求都比較高,所以你一旦進入一個新公司,或者接手一個新項目,第一任務就是要把這些數據梳理好。
  • 對比解讀五種主流大數據架構的數據分析能力
    隨著大數據技術的發展,數據挖掘、數據探索等專有名詞的曝光度越來越高,但是在類似於Hadoop系列的大數據分析系統大行其道之前,數據分析工作已經歷了長足的發展,尤其是以BI系統為主的數據分析,已經有了非常成熟和穩定的技術方案和生態系統,對於BI系統來說,大概的架構圖如下:
  • 什麼是 數據中臺,關於數據中臺最好的解讀
    所有企業主戰場不在線上而在線下,不管是網際網路巨頭還是產業巨頭都在思考如何利用網際網路、數據和相關技術的能力改變線下產業。而且,選擇合作夥伴應該遵循一個原則:願意真的開放數據,願意給實體產業賦能。二、什麼是 數據中臺數據中臺是指通過數據技術,對海量數據進行採集、計算、存儲、加工,同時統一標準和口徑。
  • 營銷人員該如何搞定數據分析
    2像搜索一樣簡單的數據分析工具但是,如何才能更快地學會數據分析,提升自己的營銷力,也成為了廣大營銷人員和營銷團隊的難題。畢竟,平時的工作時間緊任務重,想要做出好看實用的圖表,又需要花費大量的時間。幸運的是,數據分析工具已經取得了很大的進步,學習成本也越來越低,只需要找到正確的工具,營銷人員很快就能搞定數據分析。
  • 京東VP馬松解讀京東大腦、數據羅盤和大數據應用
    他們會基於大數據實驗室的算法、模型,以及大數據平臺、引擎研發組織的成果,結合應用層業務,開展研發工作。比如著名的「供應商數據羅盤」,就是大數據創新組研發出來的業務層面的產品。京東的促銷人員、倉儲管理人員等等,會專門使用應用層研發出來的大數據分析工具,分析業務的發展情況,指導業務的發展。
  • 數據分析和統計模型如何幫助警察緝毒?
    如何合理使用警力,提高警力利用效率就變成了一件十分重要的事情。今天咱們就以緝毒警的偵查工作為例,闡釋數據分析在提高警力利用效率上的作用,即提高判斷一個人是否為吸毒人員、販毒人員的準確率,據此派出合適的警力搜集證據,將其繩之以法。我們先看看緝毒警的工作流程:第一步:基礎信息搜集。
  • 社交網絡上的聲音如何影響上市公司定價?我們分析了海量的數據...
    這是我們發布的第二份年度上市公司情緒大數據觀察報告。  為了產出這份報告,我們分析了2019年9月-2020年9月這一時間跨度上社交平臺上不低於十億級的財經社交言論和百億級的社交互動量,以及超過6870萬條財經類相關新聞進入我們的數據分析池。最後由我們的數據分析師對數據進行了多維度的分析和歸納,梳理出市場層面情緒特徵和部分年度的核心事件。
  • 一名合格的數據分析師,統計基礎不可或缺!
    本文主要介紹了一名合格的數據分析師所應具備的統計基礎——統計描述。數據分析的前提就是要學會觀察數據,了解數據,統計描述包括對數據的圖表描述和統計量描述,它能讓我們對數據有一個直觀的認識,比如數據是否完整、是否存在異常、服從什麼分布、存在什麼規律等,為數據預處理和數據分析做準備。