指導行為--數據分析價值之源

2021-02-19 表哥有話講

我的問題：最近在某單位的崗位分類表中看到「會計」屬專業技術崗，而一字之差的「統計」屬專輔助技術崗，工資待遇的差距可是幾何級的，職業發展也是天壤之別。心中一萬匹羊駝跑過之後，出現了一個問題：統計有什麼用，數據分析的價值到底在哪裡？（標題就是答案，下面是小白的R實踐過程，大牛請自行跳過）

我的R實踐：還是我們熟悉的《朝陽醫院2016年銷售數據》，課上我們做出了《2016年朝陽醫院消費曲線》及月均消費次數、月均消費金額、客單價等三個KPI指標。現在想想，這個結果除滿足院領導的顯擺欲，順道搭訕一下業務部門美女小夢外，並沒有什麼卵用。

當我懷著然並卵的鬱悶，不斷的點擊著Environment的各種Data和Values時，timeSplit中一個曾被無情忽略的數據引起了我了注意，是不是可以拿它做點什麼呢？

排序面對雜亂無序的數據，第一個想法是排序，照葫蘆畫瓢，使用order()函數對excelDate排序，decreasing = TURE,還是FALSE返回的結果都是詭異的：「星期二」、「星期六」、「星期日」、「星期三」、「星期四」、「星期五」、「星期一」（或正好反過來）。

關鍵字 使用中文關鍵字「R語言數據排序」，無論是谷哥還是百度，得到的結果基本都是sort(),rank(),order()三個函數的內容。正當我無計可施的時候，想起英文版的R語言實戰。閱讀它雖然還是沒有找到答案，但找到了"sort data"和"in R"兩個關鍵字。（見笑了，奇葩英語學習之路。這也算是英文版的另類用法吧！）
谷哥「How to sort data in R"，我找到了提示，原來強在的R也有它小白的一面：想它給你排序，你得用factor()函數先告訴它」誰在先，誰在後「。

weekdaymoney$weekday <- factor(weekdaymoney$weekday,levels=c("星期一","星期二","星期三","星期四","星期五","星期六","星期日"),ordered = T)

匯總還是照葫蘆畫瓢，但這次我學乖了。在help(tapply)得知它不能計數之後，馬上翻譯計數（即：count）谷哥」How to count data in R"

安裝plyr包，使用count()函數，順利得到交易量周變化情況。

library(plyr)
COUNT <- count(timeSplit,"timeSplit[,2]")

同時還計算了交易額和客單價的周變化情況，過程很順利，代碼如下：

weekdaymoney <-tapply(excelDate$actualmoney,excelDate$wd,sum)
weekdaymoney$mean <- weekdaymoney$actualmoney/weekdaymoney$count

看圖說話 看到上面的表格，估計百分之九十以上的人都在懵逼。

如果你是病人：星期五最好就不要去就診了，等待你的只能是排隊、排隊、排隊……和人頭、人頭、人頭……；可以的話星期四去吧，等待你的是休息充分，心情輕鬆的醫護人員。

如果你是收費處的排班人員：星期五、星期六兩天最好按排多點同事上班。不然，排隊的群眾有意見，上班的同事也會有意見。

如果你是社保局的督查人員：星期四上班的醫院怎麼會事，都喜歡開大處方嘛？查

我的答案 首先聲明：上述解說純屬玩笑，但說明了一個意思：統計有什麼用？關鍵看是否使用統計結果指導行為。如果把統計結果與行為完全隔裂開來，那麼，統計真得沒有卵用。反之，統計就炸天了，它作用超乎你想像。同樣的數據在不同的人面前其價值是不一樣的。對於病人來說，可以指導更好地按排就診時間；對於一線排班人員，可以指導地安排人員作息；對於監查人員，可以有得放失高效開展督查……雖然價值各不相關，但它們產生價值的途徑卻是一至的，就是根據數據分析指導自己的行為。

我的代碼：

##第一大部分數據處理
#載入Excel數據
library(openxlsx)
readFilePath <- "C:/朝陽醫院2016年銷售數據.xlsx"
excelDate <- read.xlsx(readFilePath,1)
#處理缺失數據
excelDate <- na.omit(excelDate)
#數據框例重命名
names(excelDate) <- c("time","cardno","drugld","drugName","saleNumber","virtualmoney","actualmoney")
#切割數據
library(stringr)
timeSplit <- str_split_fixed(excelDate$time," ",n=2)
WD <- data.frame(wd=timeSplit[,2])
excelDate <- cbind(excelDate,WD)
##第二部分結果展示
library(plyr)
COUNT <- count(timeSplit,"timeSplit[,2]")
names(COUNT) <- c("weekday","count")
weekdaymoney <-tapply(excelDate$actualmoney,excelDate$wd,sum)
weekdaymoney <- as.data.frame.table(weekdaymoney)
names(weekdaymoney) <- c("weekday","actualmoney")
weekdaymoney <- merge(weekdaymoney,COUNT,by="weekday")
weekdaymoney$weekday <- factor(weekdaymoney$weekday,levels=c("星期一","星期二","星期三","星期四","星期五","星期六","星期日"),ordered = T)
weekdaymoney <- weekdaymoney[order(weekdaymoney$weekday),]
weekdaymoney$mean <- weekdaymoney$actualmoney/weekdaymoney$count
##第三大部分結果展示
attach(weekdaymoney)
layout(matrix(c(2,3,1,1),2,2,byrow=T))
weekdaymoney$Number <- c(1:7)
##生成一周客單價變化情況圖
plot(weekdaymoney$Number,weekdaymoney$mean,xlab="",ylab="客單價",main="一周客單價變化情況圖",las=2,type="b",xaxt="n",bg="blue")
axis(1,at=weekdaymoney$Number,labels=weekdaymoney$weekday,cex.axis=1.5)
abline(h=mean(weekdaymoney$mean),col="red")
#請左單擊滑鼠為紅線加標備
text(locator(1),"平均值")
##生成一周交易量變化情況圖
plot(weekdaymoney$Number,weekdaymoney$count,xlab="",ylab="交易量",main="一周交易量變化情況圖",las=2,type="b",xaxt="n",lty=1,pch=23,bg="green")
axis(1,at=weekdaymoney$Number,labels =weekdaymoney$weekday,cex.axis=1.5)
abline(h=mean(weekdaymoney$count),col="red")
#請左單擊滑鼠為紅線加標備
text(locator(1),"平均值")
##生成一周交易額變化情況圖 plot(weekdaymoney$Number,weekdaymoney$actualmoney,xlab="",ylab="交易額",main="一周交易額變化情況圖",las=2,type="b",xaxt="n",lty=1,pch=23,bg="yellow")
axis(1,at=weekdaymoney$Number,labels =weekdaymoney$weekday,cex.axis=1.5)
abline(h=mean(weekdaymoney$actualmoney),col="red")
#請左單擊滑鼠為紅線加標備
text(locator(1),"平均值")
detach(weekdaymoney)

感謝：

謝謝您花時間讀到這裡，尤其是作出評論的親。數據分析學習之路，有您真好！

公眾號後臺回復關鍵字即可學習

回復爬蟲            爬蟲三大案例實戰
回復 Python       1小時破冰入門
回復數據挖掘     R語言入門及數據挖掘
回復人工智慧     三個月入門人工智慧
回復數據分析師  數據分析師成長之路
回復機器學習     機器學習的商業應用
回復數據科學     數據科學實戰
回復常用算法常用數據挖掘算法

相關焦點

這是關於數據分析最有價值的方法論!

當你完成一份數據分析報告時，不知領導是否有問過你，「你的分析方法論是什麼？」。如果分析方法論不正確或不合理，那分析結果參考價值幾何呢？相信很多人在做數據分析時，會經常遇到這幾個問題：不知從哪方面入手開展分析；分析的內容和指標常常被質疑是否合理、完整，自己也說不出個所以然來。當然我也一樣，處在數據分析的學習階段，對這些問題常常會感到困惑。
計算機犯罪研究系列（十八）收購、轉賣非法獲取的遊戲原始碼行為的刑事風險分析

本文從遊戲原始碼的「流轉」環節入手分析「收購」、「轉賣」他人遊戲原始碼行為的刑事風險，對於為私服遊戲平臺提供資金支付結算服務的行為人的刑事責任建議參考本律師撰寫《》，此處不再詳述。一、收購、轉賣非法獲取的遊戲原始碼的行為定性遊戲原始碼本質上屬於計算機信息系統數據，收購、轉賣遊戲原始碼的行為就是收購、轉賣計算機信息系統數據。
數據分析實戰:數據分析的5大關鍵環節

他們往往指導企業內部積累了大量數據，但是不知道如何使用，如何通過數據分析形成有效的決策。外部客戶：這類用戶通常不具有某一領域或多個領域的行業數據，希望通過這些數據了解他的用戶或市場，而恰巧你的企業具備這樣的數據，這種情況下通過數據價值變現，形成對外的數據分析輸出，對外部用戶來說可以更好的了解市場，對於你來說也可以通過數據形成價值變現，為企業帶來收益。
數據分析報告怎麼寫?做數據分析報告不可不知的6大原則!

不要急，今天JINGdigital為大家帶來做數據分析報告不可不知的六大原則，掌握了這些原則，相信你可以做出一份有價值的分析報告。製作數據分析報告的前提：明確分析目的如果漫無目的地去做數據分析，那麼結論很可能是非常分散且比較淺顯的。
數據分析案例及新手如何學習數據分析

>數據分析常見作用之案例三：修正方向數據分析常見作用之案例四：輔助決策數據分析常見作用之案例五：了解現狀但是在大多時候，數據化運營的目的，並不是讓數據來直接帶給我們什麼價值，而是輔助我們已經存在的運營思維框架。用數據來指導決策、提升效率和解決問題。以及企圖在數據整理的過程中帶給我們一些啟發。
數據分析的目的 - 第2輯

，只有事物發生了才會有數據記錄，有了數據，我們才能了解過去發生了什麼，才能對這些現象進行分析，總結出一定的結論和規律，並指導我們的社會實踐活動。所以，數據分析的目的是為了對過去發生的現象進行評估和分析，找尋事物存在的證據，並在這個基礎上對未來事物的發生和發展做出結論並形成能夠指導未來行為的知識或者依據。2.1 洞察——探尋規律，掌握髮展的鑰匙所謂的洞察，就是理解事物為什麼會發生，找到事物發展的規律，並對未來事物的發展進行預測。
讓數據決策你的行為——拉勾網數據分析

前言我們每天都在產生數據，出行，社交，購物，吃飯等等，每一個行為伴隨著數據的產生，如果將這些數據收集起來，並加以處理分析便可以反過來影響你的行為。舉個最簡單的例子在各大電商網站搜索自己想買的商品，這一過程就產生了數據，電商網站會記錄你所搜的商品數據，並稍作處理分析，基本就可以計算出你所需要購買的商品，然後計算最合適你的商品，並以廣告形式推送給你，最後你很有可能會從他推薦的商品中選一個付款，這個例子就形像的解釋了，你是如何產生數據，而後數據又是如何影響你的行為的。
數據分析 | 基於統計學習的網絡異常行為檢測技術

為此，介紹了網絡異常行為檢測方法的現狀；分析了基於統計學習的檢測方法的技術路線和體系架構，並以命令控制通道、獲取行為等APT攻擊中的典型環節為例，介紹了相關的參數提取和統計分析建模方法；總結了基於大數據的異常行為檢測的特點，並指出了後續研究方向。
大數據的價值挖掘與聯想研究院的探索實踐

這個定義揭示出大數據是一種資產，但這個資產的價值不在於龐大的數據量本身，而在於對這些數據進行分析處理，發現數據中潛在的規律，從而創造價值。大數據在醫療、商業、金融、政治事件以及企業生產和運營中凸顯了巨大價值。隨著信息化和數位化系統的部署，生產製造類企業逐漸積累起產品相關的全流程、全生命周期的數據和信息。
可視化數據分析的價值是什麼?

一個完善的企業級數據分析平臺的價值是不可估量的，由於其數據來源於各個業務系統，所以其價值有時很容易和業務系統的價值混淆在一起，無法很好的量化。接下來小編給大家具體介紹一下datafocus可視化數據分析的價值是什麼？
人人都是數據分析師之統計分析

圖7-1-1 帕累託圖1.數據準備導入「採購數據.xls」數據源，在本案例中需要用到的欄位為「供應商代碼」和「購買金額」。2.創建帕累託圖進入搜索頁面，選擇數據源「採購數據.xls」。簡單算數平均數即為將數據集合中所有數據之和除以數據個數；加權平均數是計算具有不同權重的數據的算數平均數。在本節中我們使用「學生成績表」數據源，對學生的期末綜合成績進行評估。如圖7-2-1和圖7-2-2所示，得到兩種不同平均指標下的綜合成績排名前10的學生。其中，在加權平均分析中，小測成績權重為20%，期中成績權重為30%，期末成績權重為50%。
北大光華商業分析碩士項目全解析:洞察數據實現價值

■ 光華BA項目定位培養精通「數據商業價值」的高級專業人才。更加具體地說：商業分析就是讓數據產生價值的學問。為此，需要：良好的計算機基礎，紮實的經濟管理訓練，豐富的分析方法，以及紮實的產業實踐。這是光華BA項目的教學理念。項目目標：為中國數據產業培養培養精通數據商業價值、技術與管理兼備的優秀人才。本項目培養的畢業生，將諳熟從數據到商業價值的核心方法論。
神策數據第九大數據分析模型——間隔分析上線

在用戶行為分析領域，數據分析方法的科學應用結合理論推導，能夠相對完整地揭示用戶行為的內在規律。圍繞數據分析探索、應用場景拓展，神策數據始終走在領域前沿。近日，神策數據新上線的神策分析1.11版本再添行業力作——間隔分析。
美國華盛頓州立大學經濟學院副教授嚴佳:大數據,預測集體行為的新...

信息數據化後，具有很強的積累性，信息成為一種生產要素。那麼，數據在推進企業的戰略管理、產品定價、用戶挖掘等方面能夠發揮怎樣的商業價值？未來的大數據技術又將如何發展？帶著這些疑問，記者專訪了美國華盛頓州立大學經濟學院副教授嚴佳。　　大數據深度分析需專業理論指引　　記者：如今大數據產業越來越火，大數據企業也雨後春筍般成長起來。
數據分析圖書:《數據分析速成》Head First Data Analysis

內容介紹：今天對於企業和組織來說，數據分析已經成為決策制定的關鍵因素對於非數據分析專業人士而言，如果你的工作需要管理和分析各種數據，可以參考這本《數據分析速成》，通過該書可以快速學會如何收集和管理數據、在龐雜數據中披沙揀金、找到事實和有價值的模型、得出結論、預測未來，向同事展示你的分析成果。
用戶行為分析是什麼?怎麼做?

用戶行為是用戶在產品上產生的行為，實際表現為相關的用戶數據。產品經理運用不同分析方法對不同數據進行分析，進而為產品迭代和發展提供方向。一、用戶行為是什麼？1. 用戶行為用戶行為是用戶在產品上產生的行為。
64個數據分析常用語

15、方差是衡量隨機變量或一組數據時離散程度的度量。概率論中方差用來度量隨機變量和其數學期望（即均值）之間的偏離程度。統計中的方差（樣本方差）是每個樣本值與全體樣本值的平均數之差的平方值的平均數。在許多實際問題中，研究方差即偏離程度有著重要意義。方差是衡量源數據和期望值相差的度量值。
Python數據分析入門教程(一):獲取數據源

作者 | CDA數據分析師俗話說，巧婦難為無米之炊。不管你廚藝有多好，如果沒有食材，也做不出香甜可口的飯菜來，所以想要做出飯菜來，首先要做的就是要買米買菜。而數據分析就好比是做飯，首先也應該是準備食材，也就是獲取數據源。
數據分析的目的-第1輯

，才能對這些現象進行分析，總結出一定的結論和規律，並指導我們的社會實踐活動。所以，數據分析的目的是為了對過去發生的現象進行評估和分析，找尋事物存在的證據，並在這個基礎上對未來事物的發生和發展做出結論並形成能夠指導未來行為的知識或者依據。
【網絡文明微課堂】你要的所有數據源都在這裡了!

指數數據研究3 .1百度指數http://index.baidu.com/ (百度指數)大家都很熟悉的指數查詢平臺，可以根據指數的變化查看某個主題在各個時間段受關注的情況，進行趨勢分析、預測有很好的指導作用。除了關注趨勢之外，還有需求分析、人群畫像等精準分析的工具，對於市場調研來說具有很好的參考意義。

指導行為--數據分析價值之源

相關焦點

這是關於數據分析最有價值的方法論!

計算機犯罪研究系列（十八）收購、轉賣非法獲取的遊戲原始碼行為的刑事風險分析

數據分析實戰:數據分析的5大關鍵環節

數據分析報告怎麼寫?做數據分析報告不可不知的6大原則!

數據分析案例及新手如何學習數據分析

數據分析的目的 - 第2輯

讓數據決策你的行為——拉勾網數據分析

數據分析 | 基於統計學習的網絡異常行為檢測技術

大數據的價值挖掘與聯想研究院的探索實踐

可視化數據分析的價值是什麼?

人人都是數據分析師之統計分析

北大光華商業分析碩士項目全解析:洞察數據 實現價值

神策數據第九大數據分析模型——間隔分析上線

美國華盛頓州立大學經濟學院副教授嚴佳:大數據,預測集體行為的新...

數據分析圖書:《數據分析速成》Head First Data Analysis

用戶行為分析是什麼?怎麼做?

64個數據分析常用語

Python數據分析入門教程(一):獲取數據源

數據分析的目的-第1輯

【網絡文明微課堂】你要的所有數據源都在這裡了!

北大光華商業分析碩士項目全解析:洞察數據實現價值