數據離散程度的衡量指標

2021-02-08 程式設計師備忘錄

    有些時候數據的離散程度能夠讓我們數據分析得出一些其他信息,理想情況下數據越集中那麼效果越好。那麼有沒有指標來衡量?答案是有得,今天主要學習一下數據離散程度的衡量指標。

    1.極差

     極差就是對一組數據的最大值減去最小值。但是因為極差是採用兩頭的數據,沒有考慮中間的數據,所以代表性差。

    2.四分位差

      即數據樣本的上四分之一位和下四分之一位的差值,放映了數據中間50%部分的離散程度,其數值越小表明數據越集中,數值越大表明數據越離散,同時由於中位數位於四分位數之間,故四分位差也放映出中位數對於數據樣本的代表程度,越小代表程度越高,越大代表程度越低。但是取四分位數據的時候會因為數據的偏向問題影響,有可能上四分位和下四分位數據值相差太大,所以做為離散程度指標也欠妥。

    3.方差

使用均值作為參照系,考慮了數據集中所有數值相對均值的偏離情況,並使用平方的方式進行求和取平均,避免正負數的相互抵消。方差是最常用的衡量數據離散情況的統計量。

      4.標準差

     方差得到的數值偏差均值取平方後的算術平均數,為了能夠得到一個跟數據集中的數值同樣數量級的統計量,於是就有了標準差,標準差就是對方差取開方後得到的:

基於均值和標準差就可以大致明確數據集的中心及數值在中心周圍的波動情況,也可以計算正態總體的置信區間等統計量

5.平方差

方差用取平方的方式消除數值偏差的正負,平均差用絕對值的方式消除偏差的正負性。平均差可以用均值作為參考系,也可以用中位數,這裡使用均值。

平均差相對標準差而言,更不易受極端值的影響,因為標準差是通過方差的平方計算而來的,但是平均差用的是絕對值,其實是一個邏輯判斷的過程而並非直接計算的過程,所以標準差的計算過程更加簡單直接。

 有時候因為標準差相同,我們無法判斷具體那組數據更加離散,比如標準差都為4,一組數據量是1000,而另外一組數據為10,那麼顯然第一組數據更加平穩。所以為了避免標誌差的沒有具體的衡量聯繫,所以使用標準差與均值的比作為變異係數。當然對於均值為0的數據,變異係數也是無能為了。

參考:https://blog.csdn.net/qsir/article/details/94619194?utm_medium=distribute.pc_relevant.none-task-blog-baidulandingword-6&spm=1001.2101.3001.4242


相關焦點

  • 數據的離散程度描述
    從上節內容可知(回顧:數據的集中趨勢描述),集中趨勢指標在表示數據集合的特徵時會有不同的缺陷,例如算術平均數會受到極端值的影響,不能完全展現數據集合的特徵,離散程度指標可以在一定程度上彌補集中趨勢指標的這個缺陷,展示出數據集合的離散情況。
  • 統計學原理 離散程度的度量
    離中趨勢分類數據:異眾比率異眾比率 (variation ratio)對分類數據離散程度的測度
  • MIEX米匯教您外匯中離散指標與價格的聯繫!
    MIEX米匯:離散指標作為外匯交易上的一種數據指標,對投資者可以提供很大的參考作用,進而使投資者進行更有利的投資選擇,下面MIEX米匯小編就帶大家來了解下關於離散指標更多的內容。  離散指標有什麼作用?
  • 第二節 離散趨勢指標
    第二節 離散趨勢指標   計量資料的頻數分布有集中趨勢和離散趨勢兩個主要特徵,只有把兩者結合起來,才能全面地認識事物,通過例18.8可進一步說明這一問題。   例18.8 有3組同齡男孩體重(kg)如下,其平均體重x都是30(kg),試分析其離散趨勢。
  • MIEX米匯講解離散指標對成交量影響
    MIEX米匯:接觸過外匯市場的朋友都知道MT4這交易平臺,而下面米匯小編要講的就是MT4平臺上關於離散指標的一些知識。感興趣的朋友可以跟隨米匯小編一起去了解一下。  什麼是離散指標?  MIEX米匯表示離散指標屬於MT4平臺成交量指標類型裡面的一種,英文名稱「Accumulation/Distribution」,指標函數「iAD」。從該指標的當前的積累值中添加或扣除一定份額的日交易量。收市價越接近當天最高的價格時,被添加的份額越大。收市價越接近當天最低的價格時,被扣除的份額越大。如果收市價正好在當天最高和最低價格之間,那麼這個指標值不變。
  • 6.4.1 數據的離散程度(第1課時)
    今天我說的這節課是義務教育北師大版八年級上冊第六章《數據的分析》第四節數據的離散程度。本節內容共計2個課時,主要讓學生在具體的情境中,逐漸理解極差、方差、標準差等概念及其計算方法,領悟極差、方差、標準差都是刻畫一組數據的離散程度,理解一組數據的穩定性與極差、方差、標準差等數值的大小相關.我要說的是第1課時。
  • 描述數據離散趨勢的特徵值
    (1)極差  極差是數據中最大值與最小值之差,是用數據變動的幅度來反映其分散狀況的特徵值。極差計算簡單、使用方便,但粗略,數值僅受兩個極端值的影響,損失的質量信息多,不能反映中間數據的分布和波動規律,僅適用於小樣本。
  • 八下數學——數據的波動程度
    人教版八下數學第二十章《數據的分析》輔導數據的波動程度前面我們已經知道,平均數,中位數和眾數都可以反映一組數據的集中趨勢,它們各有自己的特點,能夠從不同的角度提供信息今天我們要研究如何利用方差來刻畫一組數據波動(離散)的程度.請注意在後面的學習中認真體會「集中」與「離散」的含義.
  • 【連載】《大數據學習手冊》:常用統計指標(中)
    在統計分析中,經常使用的指標,一般有3大類:集中趨勢、離散程度、分布形態等。
  • 描述性統計分析指標介紹
    描述性統計分析對調查總體所有變量的有關數據進行統計性描述,主要包括數據的頻數分析、集中趨勢分析、離散程度分析、分布以及一些基本的統計圖形。下面介紹一些常用統計描述指標。2、描述集中趨勢的指標:均數:指在一組數據中所有數據之和再除以數據的個數。幾何均數:用於反映一組經對數轉換後呈對稱分布的變量值在數量上的平均水平(適用範圍:對數正態分布數據或等比數據)。
  • 時間序列分析法中,既看不出數據的離散程度,也不能反映近、遠期
    時間序列分析法中,既看不出數據的離散程度,也不能反映近、遠期   時間序列分析法中,既看不出數據的離散程度,也不能反映近、遠期數據變化趨勢的方法是(  )。
  • 教學研討|9.2.4總體離散程度的估計(2019版新教材)
    2.內容解析在統計學中,為了了解一組數據的特徵,我們可以從這組數據的取值規律、集中趨勢和離散程度等進行研究.一組數據的離散程度可以反映這組數據的波動情況或穩定性,刻畫一組數據的離散程度的統計量有很多,最常用的是極差、方差和標準差.極差是一種較為簡單的刻畫方式,它反映了一組數據的取值範圍。
  • 數據分析|數據分布特徵的描述
    拿到數據之後,首先要對數據要有個基本了解,可以從集中趨勢,離散程度及分布形狀出發,來了解自己的數據。
  • 大數據分析主要分析什麼內容
    01總規模度量:  總量指標又稱統計絕對數,是反映某一數據的整體規模大小,總量多少的指標。他是對原始數據經管分組和匯總以後得到的各項總計數字,是統計整理階段的直接成功。  比如鐵達尼號數據中總共有891條乘客數據,其中有342是倖存者。
  • 研究氣候變暖背景下我國降水特徵變化——降水集中程度是重要指標
    本期觀點:除了降水總量和強度以外,持續時間、降水的集中程度和集中時期也是衡量降水特性變化的重要指標。降水集中度指數是用來衡量年(季、月或候)內逐日降水的時間變化程度,可以正確反映一定時期降水集中的屬性。隨著全球變暖,極端事件頻繁發生,持續性極端降水和極端乾旱是中國乃至全球致災最為嚴重的極端天氣氣候事件之一。近50年來,我國總降水量雖然沒有明顯的極端化傾向,但平均降水強度呈增加趨勢。
  • 衡量PMF的有效指標:如何利用這些指標快速實現PMF?
    本文筆者將與大家介紹衡量產品與市場匹配度的常用指標,以及增長黑客之父Sean Ellis對PMF的衡量方法。同時,還與大家分享了其如何將Ellis的衡量方法運用到商業實踐當中的。Enjor~
  • 衡量產品增長的4個關鍵指標
    文章分享了4個衡量產品增長的關鍵指標,希望可以給大家帶來幫助。數據是用戶在產品上發出的回音。產品設計遵從以用戶為中心,那網際網路產品的數據分析也應以用戶為中心,用正確、精準的數據指標去衡量產品現狀是增長的基礎,在當前精細化運營的市場環境下,如果你仍然停留在關注一些流量指標,如每天的新增、留存和活躍,那你很難觸達到產品反饋給你的真實現狀,文章提供了4個指標,因業務不同,所以我們認為更多的是提供了深度洞察業務價值的幾個維度,供讀者參考,文章有編輯。
  • SPSSAU描述性分析指標如何選擇?
    在數據分析的時候,一般首先要對數據進行描述性分析,再選擇進一步分析的分析方法。常見指標分類描述性統計指標大致可分為三類:集中趨勢指標、離散趨勢指標、分布形態指標。常見指標離散趨勢指標離散趨勢是反映資料的變異程度,常用指標有極差、四分位間距、方差與標準差
  • 數據分析基礎思維之:指標思維
    許多指標已經約定俗成,即使你換一家公司,甚至換一個行業,這些指標依然沒有溝通成本。比如衡量用戶粘性就用留存率,反應產品的流量就用日活月活。這些基礎的數據指標知識,相信你或多或少都有了解。這種基礎的監控型的指標這邊就不多說了,下文會附上一些常見的數據指標。不僅指標能提升我們對業務的理解,單單是確定指標的過程,就能極大地提升我們對業務的理解。
  • 學統計:掌握統計數據描述指標,構建數據分析的基礎
    統計學是通過數據去發現規律(數據具有同質性,即規律),在這裡,數據是指統計學上變量的數值體現。 幾何平均數:描述等比資料(後面取值是前面數據的倍數),變量值的乘積後,開n次方。 眾數:出現頻數最多的那個數。 1 離散趨勢 極差:數據分布的最大區間——最大值減去最小值。