SPSS、EXCLE——偏相關分析
原始數據:
一、為什麼要使用偏相關分析
相關分析用於分析兩個事物之間的關係情況,在現實分析中,相關分析往往有第三變量的影響或作用,而使得相關係數不能真實地體現其線性相關程度。比如本題研究「排序」與「入鏈數」之間的關係,此兩者都和相同關鍵詞數有一定的關係,當存在可能會影響兩變量之間的相關性因素時,就需要使用偏相關分析,以得到更科學的結論。
二、操作步驟:
1、SPSS
用SPSS完成對排序和入鏈數兩個變量之間的關係進行分析,操作過程如下
(1)樣本錄入
先在SPSS數據透視圖中錄入樣本數據
(2)分析窗口
先調出偏相關分析的窗口界面,把「相同關鍵詞數」作為控制變量,剔除其對「排序」、「入鏈數」的相關分析的影響。
(3)參數勾選
偏相關性-「選項」中勾選「零階相關係數」--相關係數,
(4)輸出報告
繼續點擊「繼續」---「確定」後,輸出「偏相關」分析報告
(5)結果分析
本操作分析檢驗的是控制「相同關鍵詞數」,觀察「排序」和「入鏈數」兩個變量之間的相關關係。可以看到在不控制變量時,「排序」和「入鏈數」顯著(P=0.01<0.05)負相關(相關性=-0.766<0)。當控制「相同關鍵詞數」的影響時,「排序」和「入鏈數」相關性為-0.834,顯著性為0.005<0.01,認為顯負相關。所以得出結論,當控制控制「相同關鍵詞數」不變的前提下,「排序」和「入鏈數」之間存在更加顯著的負相關關係,「入鏈數」越「大」,「排序」越「小」越靠前。
2、excle
用excle完成對排序和入鏈數兩個變量之間的關係進行分析,操作過程如下
(1)計算相關係數
l 通過斜率計算:
計算以」排序」為因變量,「入鏈數」為自變量的斜率,SLOPE是計算斜率的函數,第一個參數是y向量,第二個參數是x向量,斜率1=SLOPE(A2:A11,B2:B11)。
再計算以」入鏈數」為因變量,「排序」為自變量的斜率,斜率2=SLOPE(B2:B11,A2:A11)
計算偏相關係數斜率1與斜率2的幾何平均數,SQRT(F2*F3),符號與係數保持一致「-」
l 通過CORREL計算
計算「排序」與「入鏈數」的相關係數 =CORREL(A2:A11,B2:B11)
同樣可以,計算入鏈數&相關關鍵詞數、排序&相關關鍵詞數的相關係數
l 通過「數據分析」工具實現
選擇區域、分組方式、標誌位於第一行打勾,點擊確定後 輸出相關結果,
(2)T值計算
同樣可以利用相關係數計算T統計量;最後計算99%,95%和90%的置信區間水平下的T臨界值(用函數T.INV),如=T.INV(0.99,COUNT(A2:A11))
(3)結果分析
綜合三者兩兩之間的相關係數分析,「排序」和「入鏈數」之間存在負相關關係,「入鏈數」越「大」,「排序」越「小」越靠前。通過比較T統計和臨界值,T值不在90置信水平的T臨界值內(-1.37<T<1.37),在90%的置信水平下兩列數據存在顯著負相關。