在一個研究或實驗中,主要包括兩種變量:由自身變化而引起結果變化的變量被稱為 自變量。由自變量或其他因素的變化引起變化的變量被稱作 因變量。
統計分析時也可以將變量區分為自變量X和因變量Y。比如研究性別和收入水平的關係,性別是自變量,收入水平是因變量。
不同的領域,自變量和因變量的名稱各不相同,但其實際意義是一樣的。
控制變量是什麼
現實研究中,一個問題往往與多個因素有關。但在任何實驗或研究,都不可能考慮到所有可能影響實驗結果的變量,我們往往只會關注一兩個研究變量。這就留下一個問題:可能存在其他的因素影響著研究結果。為排除其他因素影響,使分析結果更加科學,因此分析時也需要將這些因素考慮其中。
比如,想了解卡路裡攝入量如何影響體重。卡路裡攝入量是自變量,體重是因變量。研究對象的年齡不同代謝能力也不同,進而可能影響體重的變化。如果不能確定年齡是否會影響研究結果(體重),就無法確定結果的變化是否是由自變量的變化引起的,因而,將年齡作為控制變量納入研究。
如何選擇控制變量
控制變量可以是定量數據也可以是定類數據。一般來說更多是定類數據,如:性別,年齡,工作年限等人口統計學變量。
控制變量一般是依據主觀判斷,結合研究目的進行選擇,或過往的研究中曾使用過該變量作為控制變量,或有理論依據支持。
如何處理
控制變量實質上就是自變量,分析時一般不會過多的關注在控制變量上。分析時一般直接放入回歸模型中即可。同時也可以使用分層回歸分析,「第一層」全部放入控制變量。「第二層」放入核心自變量。
使用路徑:SPSSAU>進階方法>分層回歸
若顯著性檢驗P<0.05,說明該變量對因變量有明顯的影響,分析時保留此變量。反之,P>0.05,說明該變量不屬於控制變量,則剔除該變量再分析。
其他說明
一般在報告無需分析控制變量結果。對於定類的控制變量也可以處理成啞變量再放入分析。