管理心理學之統計(5)變異性

2021-01-08 金碧輝煌姚小六

現在是上午十點鐘,王先生第10次走進衛生間洗手。在今晚睡覺之前,他的洗手次數會超過60次。這是正常的行為嗎?

心理學家們需要通過統計模型來區分正常和非正常行為。首先,他們需要取一個大樣本並記錄每個人在特定的一天中洗手的次數,結果如下圖:

要檢驗王先生的行為是否屬於極端的異常行為,我們需要用到統計中的兩個基本概念:集中趨勢(測量平均數)和變異性(偏離平均數值的測量)。如果王先生的分數處在平均的正常的行為這個區間中,那麼他的行為是正常的。說到這裡,也許你已經注意到了,集中趨勢和變異性是密切相關的。變異性是統計最基本的概念之一。它是對分布中的數據分散或聚集程度地數量的測量。一個好的變異性測量不僅能夠體現數據是集中還是分布在較大的區域還能夠讓我們了解到單個數據是否能很好的代表整個分布,即可以預期一個樣本代表總體時的誤差值。今天我們會介紹三種變異性的測量:全距,四分位距和標準差。

1. 全距和四分位距

全距是指一組數據最大的X值得上實限和最小的X值下實限之間的差值。也就是說僅僅由兩個極端值決定一組數據的全距。由於全距不考慮分布中的所有數據,它通常不能正確的描述整個分布。

為了避免極端值過度影響變異性的測量,我們會運用另一種方法:測量四分位距。它測量的是分布中間50%的數據的距離。即Q3-Q1。當用四分位距來描述變異性時,它常常會被轉換為半四分位距,即(Q3-Q1)/2。相比全距,半四分位距不易受極端值的影響。但是由於它不考慮單個數據之間的真實距離,不能給出數據是如何分散和聚集的全景,因此也被認為是簡略的變異性測量

2. 標準差和方差

為了克服全距與四分位距的不足,我們引入標準差這個概念。它是以平均數為參照點,考慮每個數據和平均數之間的距離來測量變異性。

2.1 測量標準差和方差的基本步驟

A. 找出離差,即數據到平均數的距離。

B. 確定總體方差,即離差的平方的平均數。

C. 確定標準差,即方差的平方根。用σ表示。

2.2 樣本的變異性與自由度

以上公式計算的是總體的標準差和方差,當我們選取一定數量的樣本進行計算時,我們會發現樣本方差給出的對總體方差的估計是有偏誤的,總是低估了總體值。因此我們需要考慮到樣本的變異性與自由度。一個有n個數據的樣本,最初的n-1個分數可以自由變化,但最後一個是被限制的。例如一個n=3,M=5的樣本,我們可以沒有限制的假設前兩個數的數值,比如X1=2,X2=9。在前兩個數確定的情況下,第三個數被限制了,只能是4。也就是說樣本自由度df為2(n-1)。自由度決定了樣本中獨立的和可以自由改變的數值的個數。因此樣本方差的計算公式如下:

3. 影響變異性的因素

A.極端值

全距受極端值影響最大,其次是標準差和方差,半四分位距影響最小。

B.樣本大小

全距受樣本大小影響,半四分位距與標準差不受影響

C.取樣的穩定性

標準差和方差在抽樣取樣時是穩定的,半四分位距也提供了合理的穩定測量,全距在取樣時被稱作是不穩定的。

D.開放性分布

唯一可求得的變異性測量是半四分位距

4. 對變異性測量的比較

4.1 標準差與描述性統計

標準差是一種描述性測量,它描述了分布中的數據如何變化如何散布。每個人都是不同的,當行為學家研究人的不同的行為時,需要計算這些變量的平均數,並通過測量個體分數與平均數的距離來描述變異性。如果大多數數據都集中在平均數周圍,我們認為這組數據變異性很小。如果數據以平均數為中心,分散在一個更寬的範圍內,我們認為這組數據變異性較大。

同時標準差也可以解釋單個數據。以智商為例,已知智商平均數為100,標準距離σ=15。那麼一個智商為110的人,他的分數高出平均分10分,在一個標準差以內,並不算特例。如果他的智商為135,高出平均分35分,在兩個標準差以外,那麼他可以稱為智商超高。

4.2 方差與推論性統計

推論統計的目的在於發現研究結果中存在的有意義的模式。研究者面臨的基本的問題在於樣本數據反映的到底是總體中存在的模式還是偶然產生的隨機變化?一般來說較小的變異性意味著現有的模式可以被清楚的看到,而較大的變異性會導致數據的模式難以被發現。方差就像是我們在接聽電話時的噪音幹擾。噪音越大,我們越難聽清對方所要傳達的信息。

至此我們介紹完了描述性統計的所有基礎概念。下一章開始,我們將進入推論性統計的學習。

參考書目:行為科學統計,現代心理與教育統計學

相關焦點

  • 管理心理學之統計(11)t分數
    當總體的變異性未知時,我們可以用樣本的變異性來代替。也就是說我們可以通過樣本來估計標準誤。當σ未知時,估計標準誤(SM)被用作實際標準誤的估計值,它提供了樣本平均數M到其總體平均數之間的標準距離的估計。M的估計標準誤公式為:之所以用方差來代替標準差的原因是樣本方差是無偏差的統計量,用樣本方差來估計總體方差是最準確的。
  • 管理心理學之統計(7)概率
    我們知道推論統計的目的在於通過樣本數據回答關於總體的問題。樣本和總體之間的關係通常是根據概率來定義的。在總體已知的情況下,我們可以通過概率來描述可能獲得的樣本。例如一個盒子中有十顆白色石子,十顆黑色石子,從盒子中任意取出一顆石子,我們可以知道有50%的可能性抽到黑色,50%的可能性抽到白色。顛倒概率規則的順序,我們就可以從樣本反推出總體的情況。
  • 統計學之描述性統計 | Descriptive Statistics
    「統計學就像比基尼,你所看到的就是真實顯露的,但隱藏起來的才是至關重要的」——無名氏統計是有一些枯燥,但同時也可以很有趣,不是麼?我們知道統計學包括描述性統計和推論統計,而今天的主題是描述性統計的介紹。什麼是描述性統計呢?
  • 管理心理學之統計(9)效應與效能
    在單尾檢驗中,統計假設H0和H1規定了總體平均數的增加或減少,臨界區域只位於分布的一個尾端。方向性檢測的不同之處在於:A. 在假設檢驗第一步中,方向性預測被加入到了假設的陳述中。B. 在步驟二中,臨界區域完全位於分布的一個尾端。依然以上一章我們提到的看護和刺激對兒童體重增長的影響為例。
  • 管理心理學之統計(12)獨立測量的t分數
    獨立測量的效應2.1科恩d值2.2方差百分比r2(解釋變異性與總體變異性之間的百分比)需要注意的是高的變異性使得到顯著結果的可能性降低。合併方差小,兩組數據重疊的部分小,差異性明顯。合併方差大,重疊部分大,兩組數據失去明顯界限,差異不明顯。3.
  • 管理心理學之統計(14)方差分析的定義和邏輯
    方差分析的邏輯方差分析的目的是測量變異性的數量(差異的大小)和解釋變異性的由來。首先需要合併所有單獨樣本的數據,從而確定整組數據的總的變異性。然後把總的變異性分成兩個部分,處理間方差和處理內方差來分析和解釋變異性。
  • 機器學習數學基礎:數理統計與描述性統計
    統計量與抽樣分布數理統計的任務是採集和處理帶有隨機影響的數據,或者說收集樣本並對之進行加工,以此對所研究的問題作出一定的結論,這一過程稱為統計推斷。從樣本中提取有用的信息來研究總體的分布及各種特徵數就是構造統計量的過程, 因此,統計量是樣本的某種函數。
  • 管理心理學之統計(22)回歸分析與多元回歸
    回歸方程的顯著性測驗:回歸分析回歸方程假設檢驗的虛無假設陳述了兩個變量總體間不存在關係,具體表述為:方程沒有對Y值的變異做出有顯著性的貢獻和解釋。或者說回歸方程中算出的b值不能代表任何X和Y之間的真正關係,只是由隨機或者樣本誤差造成的,總體真正的b為零。
  • 共同方法變異問題的多維審視
    共同方法變異是由於同時研究的多個變量用同一方法測量或測量方法之間有某些相似之處而共享的方法變異,是一種系統性測量誤差,可能使變量信度、效度和變量間關係的參數估計值產生偏倚。在行為科學實證研究中,共同方法變異被普遍認為是影響研究結論效度的重要因素,主要是因為它會導致變量間的觀測相關係數顯著偏離真實相關係數,產生共同方法偏差。
  • 管理心理學之統計(17)雙因素獨立測量方差分析
    A.總變異B.處理間變異 每個處理條件對應於矩陣中的一個元素。C.處理內變異3.2 第二階段將這三個部分的差異分開,組成三個F分數的分子。F分數的分母是處理內方差。測量雙因素ANOVA的效應大小5. 解釋雙因素ANOVA的結果雙因素方差分析包括三個獨立的檢驗,因此必須考慮總的結果,而不只是注意某一個主效應或交互作用。特別是存在顯著交互作用時,要謹慎考慮接受主效應的表面值,因為顯著的交互作用可以扭曲,隱藏或誇大主效應。
  • 管理心理學之統計(6)z分數
    這個將報告的分數轉化成標準化的一般人易於理解的分數的統計方法就是我們今天所要介紹的z分數。1. z分數的目的1.1 轉換用平均數與標準差把每一個分數(X值)轉變為z分數是為了確定和描述每一個分數在分布中的精確位置。
  • 描述性統計分析指標介紹
    描述性統計分析對調查總體所有變量的有關數據進行統計性描述,主要包括數據的頻數分析、集中趨勢分析、離散程度分析、分布以及一些基本的統計圖形。下面介紹一些常用統計描述指標。二、連續變量的描述分析1、製作頻數表操作步驟:確定組數,組數K=1+lgn/lg2(n為數據的個數),這只是一個經驗公式,實際應用時,可根據數據的多少和特點及分析的要求,參考這一標準靈活確定組數;確定組距,組距=(最大值-最小值)÷組數,為便於計算,組距通常取5或
  • 2020年自考《管理心理學》真題練習題
    自考管理心理學是自考的一門公共課,小編整理了一些模擬試題及答案,供大家參考。(       )A.發展性原則 B.客觀性原則C.具體性原則 D.聯繫性原則3.以亞當·斯密和大衛·李嘉圖為代表的理論是(       )A.早期管理理論 B.傳統管理理論C.行為科學理論
  • 反思統計方法在心理學領域的應用
    對於心理學實證研究而言,統計方法是一種極為重要的工具。但在這種工具被頻繁使用的背後,心理學研究工作者對這種工具的「源頭和底層」缺乏深入探究。這導致統計方法未能在心理學中回歸其本身的價值和意義。  統計方法是心理學的重要支撐  心理學作為一門獨立學科,其中一個重要的研究方法支撐就是統計方法。百餘年來,統計技術的發展不斷推動著心理學科的進步。
  • 小白快速上手數據分析模型10 | 描述性統計案例
    ○輸入:單列或者多列定量數據○輸出:對總體的各項統計指標(欄位)進行整體描述分析,包括樣本量、最大值、最小值等統計量描述性統計(又稱敘述統計)用於對調查總體所有變量的有關數據進行統計性描述。 ○ 集中趨勢中的主要統計指標有:中位數和幾何均數、算術均數(均數)等○ 離散趨勢中的主要統計指標有:分位數區間、方差、標準差、變異係數(CV)等○ 偏度和峰度可用於判斷數據正態性情況。
  • 管理心理學筆記之統計(3)百分位數,百分等級與內插法
    特定分數7.0位於6.5-7.5這個區間的0.5個單位處,因此對應著百分率的12個單位處。d. 44-12=32。可得出X=7.0對應的百分等級為32%。3.莖葉法莖葉法是頻數分布表或圖的簡單替代。1977年由J.W.Tukey發表。它將每個數字分為兩個部分,第一位或前幾位稱為莖,後幾位或最後一位稱為也。
  • 管理心理學之統計(25)獨立性卡方檢驗的效應假設限定與特殊應用
    B.期望頻數的大小任意一個單元的期望頻數小於5時,不應該使用卡方檢驗。較小的分母fe值會對總卡方值造成較大印象。避免的方法是使用較大的樣本。3.卡方檢驗的特殊應用卡方檢驗是一種非參數檢驗。3.1卡方與皮爾遜相關獨立性卡方檢驗與皮爾遜相關都是用來評估兩個變量間關係的統計技術。當兩個變量由等距或等比量表得到的數值組成時,應使用皮爾遜相關。如果數據是由將個體歸類到類別中得到的稱名或順序量表的測量數據,應使用獨立性卡方檢驗。這兩個統計過程的目的也不同。
  • 醫學英語:心理學詞彙4
    特質論 trait theory   類型論 type theory   人格心理學 personality psychology又稱「個性心理學」。   人格 personality又稱「個性」。
  • 2016心理學考研大綱【官方版】
    Ⅱ.考查目標 心理學專業基礎綜合考試內容涵蓋心理學導論、發展與教育心理學、實驗心理學、心理統計與測量等學科基礎課程。要求考生系統掌握上述心理學學科的基本理論、基本知識和基本方法,能夠運用所學的基本理論、基本知識和基本方法分析和解決有關理論問題和實際問題。
  • 2014年自考管理心理學考點:人性假設理論
    人性假設理論  西方管理心理學中提出了經濟人、社會人、自我實現人和複雜人四種與管理有關的人性假設。  (2)在批判這種人性假設的錯誤觀點的同時,還應指出,其中的一些管理措施還有合理之處,也值得借鑑。    編輯推薦:更多學員心聲>>  我《概率論與數理統計(經管類)》考試通過了,林老師講課很好,沒有高等數學基礎的我,居然2門高等數學都是一次通過的,太感謝林老師了。