在前面的學習中我們了解到,卡方檢驗和Logistic模型族可用於研究分類變量間的聯繫。(如探究白羊座和天蠍座在性格內向或外向上的差異或聯繫)
但當所涉及的分類變量比較多,或者分類變量個數較多時,精細建模的思路往往難以應用。(如研究12個星座性格規律,其中性格有固執、理性、知性、感性、癲狂……等n個類別,如果設置啞變量、建立Logistic模型,結果雖然精確,但操作過程和結果解釋都非常複雜)
對應分析可以很好地解決這類問題。由於不涉及假設檢驗,其結論不那麼精確,但操作過程更為簡單,結果也更直觀簡明易懂。
對應分析的實質是將行、列變量的交叉錶轉換為一張散點圖,從而將表格中的變量間關係信息用各散點的空間位置的關係表現出來。
根據所分析變量的數目,對應分析分為簡單對應分析和多重對應分析兩種。顧名思義,簡單對應分析用於分析兩個分類變量間的聯繫,多重對應分析用於分析多個分類變量間的聯繫,可將多個分類變量的關係在一張圖中表現出來。
(1)當卡方檢驗結論有統計學意義時,對應分析才會在分類變量各類別間找到較明顯的類別關係。具體P值的界值為多少才合適並無統一的標準,一般如果P值大於0.2,則沒必要進行對應分析;如果在P值在0.05~0.2之間,可以考慮進行對應分析,但對結果的解釋仍需要慎重。
(2)對應分析作為一種描述方法,對應分析的結果越穩定越好,故進行對應分析時樣本量不能太小,具體樣本量大小參考卡方檢驗的要求。
1. 操作簡單,結果直觀易懂。其輸出主要的結果是對應分析圖,非常直觀易懂。
2. 適於分析多分類變量。分類變量的類別數越多,對應分析的優勢越明顯。
3. 適於研究較多分類變量。當變量數較多時,該優勢尤其明顯。
1. 不能對具體聯繫進行檢驗。其本質仍然只是一種描述方法,無法在統計上對變量間聯繫加以確認。因此在結果解釋上需要謹慎,正式分析之前一定要採用卡方檢驗等方法進行預分析,篩除實際上無關的變量。將得到的圖形結果和原始數據反覆對照,以確保結論的正確性。
2. 不能自動判斷最佳維度數。需要研究者對提取的維度數量進行制定。一般提取二維或三維最為常見,能夠較好的平衡信息量和易讀性,如果解釋困難,則需要考慮加入新維度來完善結果解釋。
3. 對應分析的結果對極端值敏感。
下節將以一篇實例來講解對應分析的具體應用,敬請期待哦~
作者簡介
姓名:夏睿
院校:鄭州大學
擅長方法:最優尺度回歸、對應分析、典型相關等