上一篇文章已經探討過如何建立數據分析思路素養,如果對定性數據和定量數據的鑑別還是一知半解,推薦先區分清兩者再往下閱讀,畢竟數據類型是一切研究的基礎。或者參考SPSSAU中的幫助手冊都有詳細說明。
那麼在基本的數據類型確認之後,接下來再討論下問卷研究中常見的研究目的,以及數據研究的一些關係情況。
常見研究目的
問卷研究中常見目的:數據基本描述、影響關係研究、差異關係研究及其它關係。下表格列出研究目的與研究方法的對應關係。
上表中列出數據基本描述使用到的研究方法:最常見的為頻數和描述分析,分別針對定類數據計算百分比,定量數據計算平均值。除此之外,正態性檢驗或者正態圖可以查看定量數據的正態性特質,箱盒圖可以查看定量數據的分布、異常離群值情況;詞雲可以查看定類數據的分布特徵情況。
上表中列出常見的關係研究涉及方法;相關分析是比較基礎的關係研究,以及可以使用散點圖直觀展示數據關係情況。回歸分析研究X對於Y的影響關係,並且Y為定量;同時還有兩個方法即逐步回歸,分層回歸;其實質上均是回歸;逐步回歸是指讓軟體自己找出對於Y有影響的X;分層回歸是指一次性運行多個回歸。
Logistic回歸分析時Y均為定性數據,並且可拆分為二元logistic回歸,多分類logistic回歸。區別在於二元Logistic回歸時,Y僅包括0和1兩個數字;多分類logistic回歸時,Y包括的數字超出2個。
上表中列出常見的差異關係研究方法。結合數據類型即可選擇出對應的研究方法。方差和T檢驗的區別在於,如果X的個數僅為2個則可以使用T檢驗,如果X的個數超出2個只能使用方差分析。
方差分析更深入的研究時,會涉及方差齊性檢驗,正態性檢驗等;如果不滿足條件則使用非參數檢驗較好。而且再進一步的深入分析時,可以在方差分析後,進行事後多重比較進一步研究。
雙因素方差通常用於實驗研究,2個X對於Y的影響情況。如果研究中有多個X,此時稱作多因素方差(也稱多元方差)。
聚類分析是將樣本分類,因子分析與主成分分析的功能類似,可用於數據信息濃縮,也可以計算權重,同時還可以利用「綜合得分」計算競爭力等。同時還有熵值法,可用於權重計算。
如果研究數據為問卷,則可能涉及到信度和效度研究,記住此兩種方法僅針對量表數據。同時對於量表數據可使用項目分析,了解量表的區分性情況,刪除掉不合理量表項等。同時如果研究中涉及多選題,則有對應五個研究方法可以使用,包括單獨的多選題分析,單選與多選的交叉關係研究,多選與單選的交叉關係研究,多選和多選的交叉關係研究等。多選題的分析有時也稱作多重響應。
數據間的幾類關係情況
接下來著重來討論一下其中有關數據間的幾類關係的部分。
數據間的關係大致可以分成以下三類:差異關係、相關關係、其他關係。
差異關係通常是研究不同類別的差異性。提到了不同類別,那就涉及到定性數據,差異關係可以包括定性和定量數據的差異性,定性和定性數據的差異性。自然地也就對應到幾類研究方法中。
相關關係是指變量的數值之間存在著非嚴格的依存關係,比如越如何越如何之類的關係。包括相關關係,還有影響關係等。X對於Y的影響關係情況如何等,此時影響關係又拆分出幾種分析算法。
其它關係比如數據的濃縮,聚類,權重計算等。
在進行數據研究時,首先需要想到的是「我想做什麼?」,來回就只有三種關係,那麼這種關係有著明顯的區分性,對應確認關係情況,加上數據類型的判斷,對應就會找出合理的數據研究方法。
總結
在掌握了數據類型識別的基礎上結合自己所做研究的目的,就可以選擇出適合的分析方式。當然了不同分析方式也有不同使用條件,具體如何選擇會在下一篇文章中具體說明。或者也可以直接訪問SPSSAU,每個研究方法具體的內容都有詳細的說明及注意事項,直接使用SPSSAU的智能分析即可。