內容摘自《SPSS常用統計分析教程(SPSS 22.0中英文版)(第4版)》
3.2.1驗證數據
在進行數據錄入時,有可能會造成錯錄或者漏錄某項數據或某個個案,造成數據文件中存在缺失值或者錯誤值,導致偏倚。讀者可以利用驗證(Validation)模塊來對活動的數據集中可疑或無效的個案、變量或數據值加以識別,並予以剔除。
〖例3-5〗在數據文件validation.sav中查找編號、性別輸入錯誤及月齡超出50-80此範圍的個案,並進行核對。
1)打開數據文件validation.sav。
2)選擇【數據(Data)】→【驗證(Validation)】→【加載預定義規則(Load Predefined Rules)】,打開加載預定義的驗證規則(Load Predefined Validation Rules)主對話框,見圖3-10。
圖3-10 加載預定義的驗證規則(Load Predefined Validation Rules)對話框
3)單擊【確定】,即可加載SPSS所預先設置的變量驗證規則。
4)選擇【數據(Data)】→【驗證(Validation)】→【驗證數據(Validate Data)】,打開變量(Variables)選項卡。將需驗證的變量(Variables):x1(編號)、x2(性別)、x3(月齡)選入分析變量(Analysis Variables)中,見圖3-11。
圖3-11變量(Variables)選項卡
5)單擊單變量規則(Single Variable Rules),打開單變量規則(Single Variable Rules)選項卡,見圖3-12。單擊分析變量(Analysis Variables)欄中的第1個變量x1(編號),由於x1(編號)在錄入過程中可能會漏錄,因此選擇規則(Rule)列表中應用(Apply)欄的標記缺失值(Flag missing values)。
圖3-12 單變量規則(Single Variable Rules)選項卡
6)同理,選擇x2(性別),由於x2(性別)是用1,2二分法來代表不同性別,在錄入過程中可能會錄入成其他數字造成錯錄,因此選擇規則(Rule)列表中應用(Apply)欄中的1,2二分法(1,2 Dichotomy)。
7)單擊第3個變量x3(月齡),由於研究對象是在50-80月齡之間的幼兒,因此需要自定義該驗證規則。此時,單擊【定義規則(Define Rules)】,打開定義驗證規則(DefineValidate Rules)對話框,單擊【新建(New)】,在規則定義(Rule Definition)中名稱(Name)為月齡驗證、類型(Type)為數字(Numeric)、有效值(Valid Values)為在範圍內(Within a range)、最小(Minimum)為50、最大(Maximum)為80,見圖3-13。
圖3-13 定義驗證規則(Define Validate Rules)選項卡
8)單擊【繼續】完成月齡驗證規則的自定義,並返回單變量規則(Single Variable Rules)選項卡。在規則(Rule)欄中選擇剛才建立的月齡驗證規則,參見圖3-12。
9)單擊【確定】,即可驗證活動數據集的結果(略)。
10)結果分析
從結果可以看出,第10、26和48號個案存在x1(編號)缺失的情況;第38、43、66和67號個案存在x2(性別)不符合二分法規則的情況;第3、4、38和52號個案存在x3(月齡)不符合規則的情況。
相關文章
SPSS常用統計分析教程:3.1.1插入變量
SPSS常用統計分析教程:3.1.2 定義變量屬性
SPSS常用統計分析教程:3.1.3複製數據屬性
您的支持是我們寫作的動力,各位小夥伴記得分享本文,以幫助更多的朋友哦。
【「一起學SPSS」傾情整理統計學習資源包】
內含《SPSS常用統計分析教程(SPSS 22.0中英文版)(第4版)》配套免費電子書及數據文件;各種統計及數據管理免費軟體;各種統計學習素材。(不定期更新)
註:資源包提供部分免費工具和試用版軟體下載,但不提供盜版軟體。見諒!
【資源包下載方法】
回復關鍵詞「SPSS」即可獲取下載地址。
回復「文章」或「art」可獲取訂閱號文章目錄。
郵箱:mchgz@163.com