因子分析已經被各行業廣泛應用,各種案例琳琅滿目,以前在百度空間發表過相關文章,是以每到4至6月,這些文章總會被高校畢業生扒拉一遍,也總能收到各種魅惑的留言,因此,有必要再次發布這經典案例以饗讀者。
什麼是因子分析?
因子分析又稱因素分析,傳統的因子分析是探索性的因子分析,即因子分析是基於相關關係而進行的數據分析技術,是一種建立在眾多的觀測數據的基礎上的降維處理方法。其主要目的是探索隱藏在大量觀測數據背後的某種結構,尋找一組變量變化的共同因子。
因子分析能做什麼?
人的心理結構具有層次性,即分為外顯和內隱。但是作為具有同一性的個體來說,內隱的方面總是和外顯的方面相互作用,內隱方面制約著外顯特徵。所以我們經常說,一個人的內在自我會在相當程度上決定他的外在行為特徵,表現為某些行為傾向具有高度的一致性或相關性。
反過來說,我們可以通過對個體進行系統的觀察和測量,從一組高度相關的行為傾向(可觀測)中,探索到某種穩定的內在心理結構(潛存在),這就是因子分析所能做的。
具體來說主要應用於:
(1)個體的綜合評價:按照綜合因子得分對case進行排序;
(2)調查問卷效度分析:問卷所列問題作為輸入變量,通過KMO、因子特徵值貢獻率、因子命名等判斷調查問卷架構質量;
(3)降維處理,結果再利用:因子得分作為變量,進行 聚類 或其他分析。
案例描述:
高中大家都讀過吧,那是一個以成績論英雄的時代,理科王子、文科小生是時代標籤。為什麼我們會將數學、物理、化學歸併為理科,其他的歸併為文科,有沒有數據支持?今天我們將用科學的方法找到答案。
100個學生數學、物理、化學、語文、歷史、英語成績如下表(部分),請你來評價他們。
這是一個有趣的案例,你可以客觀的觀測到每一科目的成績,但你可以直接看到理科、文科的情況嗎?6個科目的成績是我們觀測到的外在表現,隱藏在其中的公共因子你找到了嗎?如果我們針對6科目做降維處理,會得到什麼結果,拭目以待。
SPSS分析過程
6科目成績作為6個原始變量,利用SPSS進行因子分析,具體步驟請參照各 因子分析教程 ,默認亦可,不在討論範圍之內。
公共因子命名:解釋的清楚、有無實際意義
經過SPSS降維,由公因子方差表看出,默認提取兩個公因子,能夠解釋差異的81%,似乎暗合文科和理科。
我們試圖通過旋轉後進行因子的命名與解釋,這似乎一點也不難,因子1與語文、歷史、英語三科最相關,均在0.8相關度以上,因子2與數學、物理、化學相關,也基本達到0.8以上,這正好與我們經常說的文科和理科不謀而合,沒有理由不這樣命名。
因子得分排序:綜合評價
為公共因子合理命名之後,因子分析並沒有結束,一般可以將因子得分作為變量,用於後續分析步驟。
本例:100名學生按照文科和理科因子得分進行排序,可以用(語文+歷時+英語)及(數學+物理+化學)平均值驗證因子得分排序是否合理,同時,也可以觀測因子得分為負值時是否影響排序。
中國統計網專欄作者:數據小兵 (微信公眾號:數據小兵 、 ID:datasoldier)
中國統計網-數據分析從這裡開始,更多文章請點擊「原文閱讀」
數據分析師學習交流公眾號:中國統計網; ID:cntongji