你要是連這幾個數學術語都不清楚,恐怕很難用Excel做好數據分析哦

2021-01-16 騰訊網

數據分析涉及到一些統計學中的專業術語,理解這些術語不僅有助於打開分析的思路,還能在後期完成數據分析時,規範地寫作數據分析報告,體現分析者的專業性、嚴謹性,讓業內人士刮目相看。

1.平均數

平均數表示的是一組數據的集中趨勢量數,其計算方法是這組數據所有之和再除以這組數據的個數。

在數據分析過程中,查看不同項目的數據與平均值的大小關係,是衡量項目數據好壞的重要指標。

2.眾數

眾數是一組數據中出現次數最多的數值。

在統計學中,眾數代表著數據集中趨勢。有時在一組數值中,可能存在多個眾數。

具有一個眾數的數據集合叫單峰(unimodal),二個眾數的數據集合叫雙峰(bimodal),三個眾數的數據集合叫三峰(trimodal)。

還有一種極端情況下,數據集合中每種數值都只出現了一次,那麼這組數據沒有眾數。

在數據分析中,眾數是值得關注的統計量之一。

通過分析數據值重複出現的次數,可以發現數據的特定規律。

如下圖所示,是市場營銷人員統計的商品購物消費者的年齡數組,從中可以發現「25」歲出現得最多的次數,即這組數據的眾數的是25。

那麼可以初步推斷,這款商品受到了25歲消費者的青睞。

眾數還可以用來分析商品銷售最多的尺碼、單位中人數最多的工資數額、一個測試中出現次數最多的成績。

用眾數來分析一組數據的規律,其優點是方便計算,眾數出現的次數越高,代表性越強,越能說明問題。

缺點是有局限性,如果數組中的眾數出現不夠頻繁,就不能用眾數來判斷數據規律。

3.中位數

指一組數據按照從大小順序排列,處在最在中間的數據(或中間兩個數據的平均數)叫這組數據的中位數。

與眾數相同的地方是,中位數也能體現一組數據的集中趨勢,不同的是,眾數可以有多個,中位數只能有一個。

中位數的計算方法有兩個步驟:

第一步,先將數據按照大小排列X1、X2、X3、X4、X5……Xn。

第二步,根據數組數據奇偶個數進行計算。當數據為奇數個時,中位數=X(n+1)/2;當數據為偶數個時,中位數=【X(n/2)+X(n/2+1)】/2。

例如現在對某企業50位員工的工資進行統計調查,得到的數據組如下表所示。

表中的數據數量為50,是偶數,那麼中位數等於第25位數+第26位數除以2,即(4000+4500)/2=4250。

由此可見,該企業中,有一半員工的工資低於4250元,有一半員工的工資高於4250元。

4.絕對值與相對值

在進行數據分析時,將絕對值與相對值相結合進行分析是常用的一種分析模型。

例如分析A部門業務量時,先分析A部門在某時間段的業務量大小(絕對值),再分析A部門與其他B、C部門的業務量大小比較(相對值),從而綜合判斷A部門的業務表現。

絕對值反映的是客觀現象在特定時間段、環境條件下的規模數據指標。如「今年公司的營業額是6千萬元」、「第三季度消費者人數為10萬人」。

相對值是將兩個有關聯的數據進行比較後得到的指標,反映的是數據間的客觀關係。

相對值可以用倍數、百分比、成數(表示一個數是另一個數的十分之幾的數)來表示。

如「今年上海地區的營業額是北京地區的1.5倍」、「第一季度A產品的銷量比B產品多10萬件」。

5.百分比與百分點

百分比也稱為百分率或百分數,表示一個數是另一個數的百分之幾,用百分號%來表示。

而百分點指不同時間段百分比的變化幅度,1%的百分比變化幅度=1個百分點。

百分比和百分點的概念容易在闡述數據分析結論時混淆。

表示幅度變動不宜用百分比,而應該用百分點,如下圖所示。

6.比例與比率

在統計學概念中,比例表示總體中部分數值與總體數值的比較,反映的是部分與整體的關係。

而比率表示總體中一部分數值與另一部分數值的比較,反映的是部分與部分的關係。

例如數碼商場統計手機商品和IPad商品的銷售數據,手機銷量/(手機銷量+Ipad銷量)=手機的銷售比例,手機銷量/IPad銷量=手機與IPad的銷量比率。

7.同比與環比

同比,指今年某個時期與去年相同時期的數據比較。

如去年6月與今年6月相比、去年第一季度與今年第一季度相比、去年上半年與今年上半年相比。

周比數據說明了本期發展水平與去年同期發展水平的相對發展速度。

環比,指某個時期與前一時期的數據比較。

如今年6月與今年5月相比、今年第三季度與第今年第二季度相比、今年下半年與上半年相比。

環比反應的是現象逐漸發展的趨勢、速度。

同比和環比的概念總是被混淆,要想準確區分,可以使用聯想法。

環比有一個「環」字,聯想到圓環,將圓環的A段與B段進行對比,就是環比。

相關焦點

  • 考考你,這些數據分析常用術語你都分清楚了嗎?
    一般從事數據分析行業的朋友對這類詞並不陌生,但是像市場運營人員就會把這類些名詞概念搞混,導致結果不準確。數據分析相關概念多且雜,容易搞混。為了便於大家區分,今天小編就來盤點一下數據分析常用的術語解釋。建議大家收藏起來方便查看。按照以下三類進行匯總。
  • 數據分析最基礎的元素:數據指標
    先思考這幾個問題。01 什麼是數據指標數據指標是企業運營過程中,對已記錄歷史信息進行處理,轉化成為數字。根據特定商業目的:對相關數字按一定的業務邏輯,使用一定的技術手段進行加工處理後,成為描述、衡量、分析、預測業務結果的工具。這個定義是我自己的理解和經驗總結。1、數據指標核心是服務商業的。例如:讓你很清楚公司的經營狀況。
  • 如果你也基於pandas做數據分析,分享這幾個提高效率的小知識點
    本文基於數據分析庫pandas,分享我在工作中常常需要使用的幾個關於數據定位的常用語法以及幾個小知識點。01loc和iloc目前pandas的版本已經取消了ix和at等語法,推薦使用的是loc和iloc這兩種語法定位數據loc是location的縮寫,iloc是index_location的縮寫,前者是基於標籤(標籤是指通過列名或者索引名定位數據),後者是基於索引
  • 多年來Excel填報數據的各種不如意,終於現在用這個神器全部都解決了
    為了能夠解決這些麻煩,人們不斷的嘗試使用其他新的辦公軟體,希望能夠滿足自身在數據收集管理方面的需求,但是這些軟體自身又存在了其他的缺點,也不具備excel強大的計算能力,甚至還需要編程才能實現一些功能,導致不但解決不了原有的問題,甚至帶來了一些新的麻煩。那麼,到底有沒有一款軟體能真正解決excel填報數據過程中的各種問題呢?
  • 使用簡單而強大的Excel來進行數據分析
    使用Excel進行數據分析是使用R或Python進行數據科學的先驅我們應該要學習用於分析數據的基本的Excel函數介紹我一直都很佩服Excel強大的數據分析能力。Excel具有非常廣泛的功能:可視化功能、數組,使你能夠迅速的通過數據產生洞察力,否則這些數據將很難看到價值。當然Excel它也有一些缺點。比如它不能非常有效地處理大型的數據集。相信每個人都已經遇到了這個問題。當你嘗試對大約200,000個條的數據進行數據計算的時候,你會注意到excel開始出現問題。
  • 懂Excel就能輕鬆入門Python數據分析包pandas(十六):合併數據
    此系列文章收錄在公眾號中:數據大宇宙 > 數據處理 >E-pd經常聽別人說 Python 在數據領域有多厲害,結果學了很長時間,連數據處理都麻煩得要死。後來才發現,原來不是 Python 數據處理厲害,而是他有數據分析神器—— pandas前言本系列上一節說了拆分數據的案例,這次自然是說下怎麼合併數據。
  • 那些讓你「相見恨晚」的數據分析軟體,一般人我不告訴他
    CDA數據分析研究院原創作品,轉載要授權喲前段時間考研結束,衷心祝願那些奮鬥數載的小夥伴們可以考到自己夢寐以求的大學。人生短暫,人間美好,希望通過努力奮鬥你我都可以體會到生活的點點滴滴。SPSS裡有一套完整的統計分析模塊,菜單式的步驟操作也讓非統計學專業的人可以自己實現一套統計分析,另外數據結果輸出窗口、數據編輯窗口的分開式安排也讓我特別喜歡,不像excel全部放在一個sheet裡。中小型網站資料庫戀人:MySQLMySQL在過去由於性能高、成本低、可靠性好,已經成為最流行的開源資料庫,因此被廣泛地應用在Internet上的中小型網站中。
  • excel查重技巧:如何用組合函數快速統計重複數據(下)
    在前幾天的教程中我們通過學習公式求值和F9鍵,看懂了統計不重複數據的第一種套路。今天我們接著上回所說,繼續給大家分享第二種套路。趕緊來看看吧~*********數據源照舊,如下圖所示,要求統計出不重複的客戶數:在上期我們掌握了破解公式的方法後,今天我們再來看看計算不重複數據個數的第二個公式套路。
  • 十年數據分析經驗,總結出這三類分析工具最好用
    提及數據分析工具相信小夥伴們都不陌生,但是很多人都會有個疑惑?數據分析工具這麼多,它們有什麼區別?哪個更好?哪個更強?我應該學習哪個?雖然這個問題有點俗套,但是很重要,我也一直努力在追求這個終極問題的答案。如果大家在網上去搜索這方面相關的信息,你又很難看到一個公平的觀點。
  • 不用代碼,教你Excel構建數據分析預測模型!
    你可以在Excel中執行建模,只需幾個步驟。下面是一個教程,介紹如何在Excel中構建線性回歸模型以及如何解釋結果。Excel真的能構建預測模型?這通常是我提起這個話題時的第一反應。當我演示如何利用Excel的靈活性為我們的數據科學和分析項目構建預測模型時,接下來是一個令人懷疑的眼神。
  • excel函數應用技巧:按區間統計個數,就用Frequency
    編按:價格帶統計與按成績統計優良中差的人數是一樣的,都是按區間統計個數。最簡單、最快速的辦法是用高級函數Frequency。學習更多技巧,請收藏關注部落窩教育excel圖文教程。價格帶分析是一項基礎的數據分析,在某醫藥銷售公司工作的小王,最近就遇上一個這樣的任務……領導給了50個護肝類藥品的價格信息,讓小王統計出每個價格區間的品規數,數據要求如圖所示: 註:表中價格數據為模擬值並非市場實際價格。明確需求:A、B、C三列是50種同類藥品的明細,價格範圍在3~160元之間。
  • 機器學習與數據分析常用術語-基礎篇(一)
    前言 之前在給公司的程式設計師培訓機器學習專題實戰的時候,發現他們聽的認真,也非常想學,但是每當問他們有哪裡不懂的時候,他們總是回答不出哪裡不懂,識懂非懂的狀態,後來我總結了一下原因,1.機器學習領域跟程序開發的區別非常大,機器學習屬於一個交叉學科,即需要數學也需要計算機學,難度相對與單學科要大些,2.機器學習領域有很多專業詞彙與術語,之前程式設計師都沒聽說過和接觸過
  • 面試數據分析崗,怎麼提升一倍成功率?讓過來人給你支支招
    應屆生或者零基礎轉行數據分析的,沒有什麼工作經驗,在寫簡歷時經常犯難,很想湊點數據分析的項目經驗上去,有些人甚至去借鑑別人的簡歷,抄點項目經驗(這一點是萬不可取的,人家兩句專業性問題一問就原形畢露了)對於應屆生,HR一般都比較看重專業對口,學校倒不是那麼重要,但好學校肯定是加分的。
  • 懂Excel輕鬆入門Python數據分析包pandas(二十七):IF函數代替者
    此系列文章收錄在:數據大宇宙 > 數據處理 > E-pd轉發本文並私信我"python",即可獲得Python資料以及更多系列文章(持續更新的)經常聽別人說 Python 在數據領域有多厲害,結果學了很長時間,連數據處理都麻煩得要死。
  • 我用Excel發現了數據分析的本質:回歸分析
    最近很多人都問我,為什麼感覺數據分析越學越亂,經常是學了一大堆名詞,真正遇到問題的時候卻更多是直接套用模型,很難將這些理論聯繫起來。這其實就回歸到了一個至關重要的問題:數據分析的本質是什麼?事物都是萬變不離其宗的,一切外在的方法都是為了事物本質而服務的,數據分析自然也不例外,今天我們就來探討一下數據分析的本質。
  • excel數據處理技巧:組合函數統計產品批號
    最近小編收到一位群友的求助,他說自己被excel中的編號問題給難住了。這是這麼回事呢?編號不就是1、2、3、4、5嗎,直接下拉單元格就能搞定,這有何難?一起來看看下面這篇文章中excel數據處理技巧。近日看到一個群友的求助,覺得比較有意思,想和大家分享一下。學習更多技巧,請收藏部落窩教育excel圖文教程。
  • pandas數據處理:常用卻不甚了解的函數,pd.read_excel()
    人們經常用pandas處理表格型數據,時常需要讀入excel表格數據,很多人一般都是直接這麼用:pd.read_excel(「文件路徑文件名」),再多一點的設置可能是轉義一下路徑中的斜槓,一旦原始的excel表不是很規整,這樣簡單讀入勢必報錯!
  • 想成為數據科學家?你得先讀讀這篇文章
    A:我被問到這個問題很多次了——具體來說,許多公司高管問過我諸如「數據科學這事是否只是一時的風潮?」的問題。我想我們應該重新給這個議題劃個框架。我的觀點是,我們不需要具有深刻的分析能力的「19萬人」或「150萬管理者」。我認為每個人都需要有一定程度的分析技能。我認為基礎分析素養應該像閱讀、數學一樣成為我們的教育體系的基礎部分。
  • 數據科學50人·吳明輝:用數學思維,打破數據悖論
    也許接下來你所聽到的觀點,可能與傳統的數據故事有點「不一樣」,但是如果你了解吳明輝,了解了他對數據的看法,我想,你對於數據科學的認知,也會有點「不一樣」的改變。▍流動,才是悖論的最優解「我覺得數據和生意這兩個事從概念上就是矛盾的,數據是解決信息不對稱的,生意本質是什麼?是利用信息的不對稱。」
  • 如何用EXCEL線性回歸分析法快速做數據分析預測
    回歸分析法,即二元一次線性回歸分析預測法先以一個小故事開始本文的介紹。令我吃驚的是,本人以完整的數據推算做依據,做出的報告結果居然與僅入職數周,數據不齊全的Edwin制定的報告結果吻合度達到99%以上。仍清楚記得,筆者曾用得是標準的周轉天數計算公式反推法,而Edwin用的正是本文重點介紹的二元一次線性回歸分析法。二元一次線性回歸分析法是一種數據分析模型。