在心理學研究中,我們需要在論文中呈現描述性統計的結果,即,需要呈現各變量的均值、標準差和相關矩陣。這些信息可供讀者進行後續分析。樣本相關係數可以用來對論文中建立的統計模型進行驗證,也可以用來進行元分析。相關係數的計算和顯著性檢驗是一個很輕鬆的工作——通常情況下,研究者會使用SPSS計算SPSS中各變量的相關,SPSS也直接提供了對相關係數的顯著性檢驗,研究者需要做的就是點點滑鼠,然後將結果抄寫在論文中。
但是,很多研究者忽略了一個問題——當相關變量存在缺失時,SPSS默認會採用配對刪除法對無效個案進行剔除,結果就導致了相關矩陣中每一個相關係數所基於的樣本量可能是不同的。更糟糕的是,作者根本沒有意識到這一問題,沒有在論文中報告更為準確的關於樣本量的信息,從而讓讀者跟著作者一起稀裡糊塗地犯了錯誤。看下面的例子。
在上圖中,樣本量是10。對於V1-V4之間的相關,其樣本量分別是多少呢?如果忽略了這一點,就會導致錯誤的報告。真實的樣本量在SPSS的輸出中是可以看到的,可見,樣本量有的是8,有的是9。如果研究者忽略了這一點,或者在論文中對此不加報告,則讀者會以為樣本量依然是10:
處理缺失值的方法不是SPSS默認的配對刪除法,我們可以採用Mplus等軟體提供的描述性統計,其採用全息極大似然法或多重插補對缺失值進行估計,此時的樣本量可以認為是10。
Mplus語句如下:
TITLE:Descriptive
DATA: FILE IS DATA.CSV;
VARIABLE:NAMES ARE V1-V4;
MISSING ARE ALL(999);
ANALYSIS:TYPE IS BASIC;
OUTPUT:SAMPSTAT;
可得相關矩陣如下:
只是,Mplus沒有直接給出相關係數的顯著性檢驗結果,即沒有報告相關係數的p值。這裡我提供一個Excel計算器,其功能有兩個:
可以對相關係數顯著性進行檢驗;
給出樣本量,則可以計算出與p=0.1, 0.05, 0.01, 0.001相對應的相關係數的臨界值。根據相關係數的臨界值,可以判斷相關矩陣中的係數的顯著性水平在哪個範圍內。
在t test for r中,在綠色單元格中輸入相關係數r和樣本量n,即可得出其顯著性p值。
在The critical values of r at different p levels中,輸入樣本量n,即可得到r在各個顯著性水平下的臨界值。
點擊「閱讀原文」,獲取Excel計算器, 密碼: yjrj。
【晚安】
請點擊「土豪打賞專用二維碼」支持作者。