如何發現數據報告中的事實:單指標模型

2020-11-23 騰訊網

解讀數據分析報告第一步是判斷數據,看看報告中的數據是否有邏輯錯誤、數據錯誤等。之前的兩篇文章已經說過了,今天說說發現事實。

發現事實就是去尋找數據報告中那些比較直觀,可以一目了然發現的事實。找出事實,是產生見解前的必要步驟,也是產生見解的重要基礎。如果沒有重視找出事實的步驟,那你後面出來的見解,可能會出錯、片面或一知半解,甚至所謂的見解,其實還是事實而已。

例如你下屬給你做好了圖表後,下屬告訴你圖上看到本月較去年同期下滑了25%,其實這就是在告訴你事實,而事實上我們要的是結論。再比如某日花店月匯報PPT上顯著寫著本月銷售最好的前三個品類是沐浴露、潔面乳、潤膚霜(其實在柱狀圖中已經顯然有top銷售品類的排名了),這也是事實而不是結論,你想知道的是同比或環比這些品類排名的變化已經變化背後的故事。

找出事實的常見方法有4種:

01 比較大小

數據之間通過比較它們的大小,往往很快就能找出事實來,俗話說:沒有對比就沒有傷害,確實對比很容易發現事實。

大家看看下面這張圖,你能發現哪些事實?

60

你找到了幾個事實?來看看我的答案:

銷售目標,東北區最高,華東區第二,華西區第三,……上海區最小;完成率,華中區最好,華北區第二,西南區第三,……東北區最差;同比增長率,西南區第一,華中區第二,華西區第三,……華東區最低;退貨率,利潤目標,完成率,利潤同比增長率,庫存金額,庫存同比,庫存周轉……

這些都屬於事實,絕對不是結論,然而我們看到的數據報告PPT中文字部分,很多其實在該寫結論的地方寫的卻是事實。如下面這張PPT中的「結論」,顯然這樣的結論其實毫無用處。

圖片來自網絡

所以通過比較同一指標的大小,其實很快就可以找出事實。但要切記是同一指標同一定義的基礎上,才有比較意義。舉個例子說,網絡上經常發布的各行業平均工資數據。

圖片來自網絡

如果大家把自己的月平均工資來對比,得出的事實就不一定是客觀的了。因為影響工資的因素很多,站在數據本身的角度看,跨行業對比意義不大(除非你看到後,有跳槽的計劃~),回到本行業對比,也仍然會有企業性質、企業盈利、職級水平、工作年限等因素在影響工資。所以對比工資時,儘量找接近自己的數據來對比,這樣更容易讓你找出事實。

通過比大小發現事實是數據報告解讀中常用的一種方法,這種方法特別適合看表格式數據報告的時候用。

02 趨勢分析

趨勢,通常是與時間關聯,同一指標在不同時期的數據會呈現一定的走勢。

大家看到最多的股票的分時圖,從9點30分開盤,到15點收盤形成的走勢圖,還有日K線、周K線、月K線、年K線等。例如這隻股票:

上市以來的,股價整體趨勢是上漲的,近期更是大幅上漲,通過看趨勢也能找出這個事實。同時你也可以使用比大小的方法發現上月創了新高719.96元,(圖中)歷史最低價是76.98元。(如果最低價你買了1萬股,現在你就是土豪了)

再來看看2006年-2016年深圳房價走勢:

圖片來自網絡

從圖看出,2008年、2012年的房價同比是下降的,自2012年開始房價一直呈上升趨勢,且2014-2016年房價大幅上漲,2016年到最高點。

這就是從圖表中的趨勢找出事實,同時大家也會發現,用圖表來看趨勢是非常直觀的,趨勢分析展示一般用折線圖比較多,當然柱形圖也可以看趨勢。

有的時候,別人給你的報告沒有做曲線圖或柱狀圖,此時你可以將對方的圖適當修改以便更方便的發現事實。如果不允許修改,則可以找張紙打個草稿,自己劃張趨勢線(草稿法),當然如果你技術足夠嫻熟,也可以不用草稿,直接在大腦中「生成」一條曲線(人腦法)。厲害了吧?

03 邏輯分析

找出事實,有時候還要結合日常邏輯,業務邏輯來看。看看以下的圖表,是某網絡平臺過去一年的男女線上花費數據:

圖片來自網絡

在這個圖中怎麼找出事實呢?(假定數據是正確的)

先看服飾,明顯看出女性比男性要高,按日常的邏輯,女生在服飾類消費比男性多,沒有問題;

再看嬰兒用品,發現男性居然比女性要高,這對我們日常的邏輯是一個衝擊,一般我們會認為嬰兒用品應該是媽媽買得多。但圖中展示的事實卻是:男性購買嬰兒用品的花費更多。

食品、非食品快消品、電子/數據類產品,男性比女性消費更多,這些現象和我們的日常邏輯也差不多,不會有大的衝擊。

但化妝品類別,居然看到男性還比女性略高一些,這也是對我們的常規邏輯有衝擊的。

所以綜合看完這張圖後,發現的事實就是嬰兒用品、化妝品,男性比女性在線上的花費要多。當然前提是我們已經假定數據是真實的。

04 藉助圖表

現在的數據報告中,無論是公司內部,還是網絡上,更多的以圖表的形式呈現的。最後再跟大家談談如何從常見的圖表中發現事實。會講一個指標、兩個指標、三個或多個指標時,如何更好的發現數據中的事實,本周講一個指標時的幾個場景。

1、餅圖

餅圖一般用來展示份額,在三俗圖表(曲線圖、柱狀圖、餅圖)中排行第三。

如果你看到以上的餅圖,證明作圖者是很業餘的。因為各產品的份額沒有進行大小排序,不容易發現更多的事實。像下面的這個才是合理的:

通過這個圖,我們一目了然就可以看出各產品的份額的事實,份額從大到小是:E、D、B、C、A。和前文描述的一樣,如果方便直接改圖表就自己動手,否則就使用草稿法或人腦法。

上面這個圖其實還可以根據業務場景進行優化,如果你的公司是E產品,你們最大的競爭對手是C產品,則可以弱化其它數據,突出E和C的市場份額。這樣受眾是不是更容易發現事實?

所以讀餅圖的思路就是要看出,各對象的份額對比情況是怎麼樣,說白了就是誰大誰小,這就是事實。

2、柱狀圖

這也是很多人愛不釋手的一種圖表。

從柱狀圖中找出事實,方法與讀餅圖的方法基本一樣,是通過比較各柱子的高低,來發現各對象差異的事實。首先圖標中如果是按照時間順序或邏輯大小(從大到小或相反)排列的,則重點看趨勢的事實,然後找大小。如果是按項目排列(如A公司、B公司、C公司......)的,則首先看最大值、最小值、平均值,不過一般人不會直接把平均值展示在圖表中,這是人腦法就起作用了,哪些高於平均值,哪些低於平均值......

3、曲線圖

這是三俗圖中的老大,出現頻率最高的一種圖。

通過上圖的曲線可以看到7月1-6日的點明顯低於6月底和7月7-10日的,這也是其中一個事實(下一步就是要找到背後的原因或洞察)。7月9日這天銷售最高(要問為什麼)。

通過曲線圖我們可以看到指標的變化趨勢,可以是整體的趨勢,也可以是局部的趨勢,然後再結合業務邏輯從中找出事實。曲線圖和柱狀圖的解讀方法大同小異。

當多曲線出現的時候,使用的解讀同樣是上面的方法,只不過是組合方法。如下圖,你們可以先試試。

這圖有如下一些事實:

1、幾乎每年銷售趨勢都從下往上走,注意這是事實不是結論

2、最大值:2015年的最高銷售在12月,2016年是12月,2017年是1月,這三個數據事實又能產生更大的事實,最大值規律在變化。

3、最小值:2015年在2月,2016年2月,2017年在5月,同樣規律在變化。

......

這些事實背後會有什麼見解或結論,那是另一個話題了,以後再說。好的,今天的內容主要跟大家分享了找出事實的方法,以及如何去從常見圖表中找出事實。大家也會發現,我們今天看的圖表都比較簡單,因為這些都是單指標圖表,只有一個指標呈現在圖表中,讀起來相對會比較簡單些。

相關焦點

  • 數據中臺實戰(二):基於阿里OneData的數據指標管理體系
    基於阿里OneData的數據指標管理體系數據指標的定義我們在梳理公司的數據指標時發現每個部門對同一個指標定義的不一致,就好比交易額這個指標在電商產品中就是一個模糊的指標,是下單金額、還是支付金額(無包含優惠)、或者有效金額(剔除退款),這樣沒有一個統一的標準,就很難對部門間做橫向的對比。
  • 教程| 如何為單變量模型選擇最佳的回歸函數
    選自FreeCodeCamp 作者:Bjrn Hartmann 機器之心編譯 參與:李詩萌、劉曉坤 本文介紹了為單變量模型選擇回歸函數時需要參考的重要指標如果你知道模型解釋數據的方式會很有幫助。 本文的其餘部分將解決前面提到問題的第一部分。請注意,我將分享我選擇模型的方法。模型的選擇有多種方式,可能會有其他不同的方法,但我描述的是最適合我的方式。 另外,這種方法只適用於單變量模型。
  • 如何撰寫一份優質的數據分析報告?
    當前數據研究已成常態,不論是企業進行市場調查,或者運營進行數據分析,也或者學術研究等,均會涉及到撰寫數據分析報告。1 三種類型的數據分析報告一般來說,數據分析報告可分為三種類型。分別是模型類報告、調研類報告和行業研究類報告。
  • 如何從航空業核心指標建立量化模型:一個重要的方法
    ◢ Part I ◣ 航空核心指標量化解析要分析研究航空行業,就必須要挖掘其相關的行業變量,即解釋變量。挖掘變量的過程中,首先要有經濟邏輯基礎,其次是構建模型,最後利用數據檢驗其相關性和邏輯性。在我們的研究中發現,客座率、匯率、原油價格和GDP與航空指數相對滬深300超額收益有顯著的相關性,同時,這幾類指標也有很強的經濟邏輯基礎。
  • SPSS如何使用一般線性模型中的單變量進行分析?
    s p s s 線性模型中的單變量主要是用來檢測數據的,下面讓我們來看一下如何檢測吧。1.首先打開s p s s 軟體,要檢測年齡性別與睡眠關係的這個數據有效性。2.點擊分析選項卡,彈出下拉菜單中找到單變量選項。3.我們將因變量設置為睡眠時間。
  • 如何建立零售行業的數據分析模型?
    建立分析模型搭建好應用框架之後,就要進行數據分析模型的建立,為此我嘗試用過很多數據分析工具,比如Tableau,但這些國外的廠商很難形成一套適用於國內企業的完整行業化解決方案,FineBI,如下圖所示。
  • 數據分析基礎思維之:指標思維
    內容分為事實和觀點,事實不可否認,觀點則各有表達。在數據分析工作中,數據必須呈現的是事實而不能是觀點,這樣才能保證每個人接收到的信息是相同的。而想要保持穩定的事實能力,指標思維是不可忽略的一個關鍵點。
  • 馬蜂窩數據中臺起步建設:數倉的架構、模型與應用
    主要從以下四個方面綜合考慮:面向主題:採用範式模型理論中的主題劃分方法對業務數據進行分類;一致性保證:採用維度模型理論中的總線結構思想,建立統一的一致性維度表和一致性事實表來保證一致性;數據質量保證:無論範式建模還是維度建模都非常重視數據質量問題,綜合使用兩個理論中的方法保證數據質量;效率保證:合理採取維度退化、變化維、增加冗餘等方法,保證數據的計算和查詢效率
  • 「報告」世界經濟論壇:聯合數據聯盟模型中共享敏感的健康數據——八步指南
    報告認為:建立聯合數據聯盟模型(Federated Data Consortium Model)能夠實現快速且安全的數據訪問,並通過數據驅動的方法為患者提供個性化的疾病診斷和治療方案。該模型遵循八步指南:建立並維持信任、發現數據聯合問題、採取激勵措施提高組織能力、確定資源、識別制度或政策差異、建立治理模型、結構化數據、部署API技術。
  • 什麼是數據分析的漏鬥模型?
    漏鬥模型,不僅僅是一個模型,更是一種可以普遍適用的方法論,或者說是一種思維方式。本文主要談談漏鬥模型的本質、漏鬥模型案例分析以及如何繪製漏鬥模型。漏鬥模型關於漏鬥模型,我認為本質是分解和量化。為什麼這麼說,這裡以營銷漏鬥模型舉慄。
  • 如何應用漏鬥模型輔助數據診斷與決策?
    漏鬥模型基本上是做所有分析時都或多或少會用到的工具,本文結合一些簡化的虛擬案例,來跟大家說說如何利用漏鬥模型輔助數據診斷與決策?先講個例子,來自肖恩埃利斯的《增長黑客》:一家食品商店App的增長團隊發現了一個問題:App上線後,通過各種推廣,短時間內就獲得了19萬用戶,但是到最終在App內完成購買的用戶只有不到7000人。
  • 體檢報告上的數據指標、專業術語,你真的看懂了嗎?
    原標題:體檢報告上的數據指標,你看得懂嗎?過半受訪者表示,看不懂體檢報告上的各種專業術語和箭頭指標。不過,深晚記者採訪我市多家綜合醫院體檢中心發現,大多數醫院重視檢後健康管理,除了儘量用通俗的語言給出解釋和建議,不少醫院還專門設立了「報告解讀室」或「保健專診」,為體檢中有疑問的市民提供專業解讀。
  • 實例解析:怎麼撰寫一份產品數據報告
    產品數據報告是產品和運營人必不可少的工作,無論是周報、月報,還是新版本表現的分析報告,都需要在圍繞報告目標的基礎上,對數據進行整理、分析並提煉要點,最後形成一份有指導意義、易讀且美觀的數據報告。本文從撰寫步驟的角度,總結如何從0開始撰寫一份產品數據報告。
  • 機器學習中評估分類模型性能的10個重要指標
    有些指標更適合但不是另一個,反之亦然。類似地,概率場景有不同於類標籤的模型性能度量。下面是流程圖,這是一個完美的總結,也是這篇文章的一個完美的前言,我們將在最後再次回顧這個流程圖,以確保我們了解所有的指標。Confusion Matrix我們從一個開發數據集開始,同時構建任何統計或ML模型。把數據集分成兩部分:訓練和測試。
  • 數據建模中分類與預測模型
    因此,本文基於上期數據預處理部分之後,介紹如何在清洗過後的數據基礎之上建立分類與預測模型,為此種模型的構建方法進行簡單介紹,輔助投資者對自身分析邏輯中的分析框架進行量化分析,方便其多元化的交易分析。  一、分類與預測的介紹  數據建模中分類與預測模型主要是尋求合適的分類模型並在此基礎之上進行未來預測。
  • 如何搭建數據歸因模型?
    業務模式的不同,所搭建的歸因模型也不同,所以數據分析師需要根據實際的業務情況來構建模型。本文作者依據工作實踐的所思所想,結合案例等分享了數據歸因模型搭建的關鍵步驟和思考,供大家一同參考和學習。要深度分析問題原因,不能只統計數字,流於表面!每次寫原因分析類報告,都有領導這麼咆哮道。而聽到這個要求,很多新手同學又是眉頭一皺眼睛一閉:媽耶,咋整啊。今天我們系統講解下。
  • 傳統行業如何建立數據倉庫?
    如何實施數倉項目,本文先以傳統行業的數倉切入,從整體上講下數據倉庫的實施方法論!例如,部門員工關係表,如果事實表包含部門編碼,則數據可以分析到部門。如果事實表又包含員工編碼,則數據既可以分析到部門,又可以分析到員工。一張事實表除了包含所要分析的維度編碼外,還包括需要分析的度量值。
  • 你的數據倉庫既要有「維度模型設計」也要看「分層架構」
    維度模型設計和分層架構都是數據倉庫必不可缺的。維度建模以分析決策的需求出發構建模型,構建的數據模型為分析需求服務,因此它重點解決用戶如何更快速完成分析需求,同時還有較好的大規模複雜查詢的響應性能。而分層架構的設計的主要是為在管理數據的時候,能對數據有一個更加清晰的掌控。這篇乾貨將帶你認清數據倉庫「維度模型設計」與「分層架構」。
  • 實操案例拆解:如何使用模型/理論進行數據分析和戰略定位
    編輯導讀:案例拆解是運營er們常常會用到的方法,當活動缺少新想法時,就會試著去關注一下相關的案例,進行拆解,進而復用到自己的工作中。運營人如何做案例拆解?需要用到哪些理論模型呢?本文作者從具體案例出發,對相關模型進行了講解,一起來看看~
  • 如何用線性回歸模型做數據分析?
    編輯導語:在日常工作中,很多時候都會用到數據分析的方法,線性回歸模型看起來非常簡單,但實際上它的十分重要;本文作者分享了關於如何用線性回歸模型做數據分析的方法,我們一起來學習一下。