實證分析主要包括描述性分析、信度效度分析、相關分析、假設檢驗(回歸分析)。在分析之前我們首先要懂得SPSS的分析原理。學過高數的基本都知道假設檢驗的原理,SPSS軟體的基本原理就是假設檢驗,即先假設H0:A對B沒有影響條件成立,分析得出的結果P(sig.)<0.001/0.01/0.05,則假設不成立,即A對B具有顯著性影響。
用SPSS分析的問卷必須是李克特五級量表或七級量表,生手建議設計五級單因素的量表。問卷數據收集完成後,首先要剔除無效問卷(所有問題答案全選一種選項的或存在矛盾的答案等問卷),保證數據的準確性。分析步驟如下:
錄入問題及數據
打開SPSS軟體,在變量視圖界面內輸入問題及設置值,一般設置值為1非常不同意,2不同意,3不一定,4同意,5非常同意。同理輸完一篇問卷即可。
二、描述性分析
描述性分析主要是對被調查者的基本信息進行描述,如性別、學歷、年齡、工作年限、居住地等等,這類問題一般放置在一份問卷的開頭(也有放置在結尾,個人設計問卷時比較喜歡放置於開頭)。描述性分析主要對問卷的均值、標準差進行分析,均值相同時,比較標準差,標準差越小,表示越穩定。
步驟如下圖:1、點擊分析描述統計----描述----選擇變量----點擊選項----選擇你需要描述的項(平均值、方差…..)。
2、分析----描述統計----頻率---選擇項,則可以得出頻率頻數。
最後將自己需要的數據進行匯總了列成表格或圖表(餅圖/柱形圖等)的表示,圖表的項有頻數、頻率、均值、標準值等,並輔以文字說明,使結果一目了然。(註:以下圖表及數據僅作為案例解釋說明,數據不具有準確性和真實性)
二、信度分析
信度分析主要是通過SPSS分析驗證設計的問卷是否可靠,問卷題目之間是否具有良好的相關性進行分析,被調查者的答案是否存在矛盾,是否可靠等等。
問卷分析的步驟如下:點擊分析----標度----可靠性分析選擇項----確定即可
得出的結果如下:
結果分析:一般來說,問卷是否可靠主要看Alpha(a係數),a<0.7則表示設計的問卷信度不可靠,0.7<a<0.8則說明問卷具有一定的可靠性,0.8<a<0.9則說明問卷信度很好。上面的項數則是選擇分析的問卷題目的數目。
在進行下面分析時先說一下問卷的設計。實證分析的論文中比較簡單的模型大概可能是:研究對象的影響因素(自變量)會影響研究對象的效果(因變量),A H B ; 即論文假設H為自變量A對因變量B會產生一定的影響。一般可以找出四五個影響因素設計為自變量,每一個影響因素可以設計3—7個問題進行調查。所以在進行可靠性分析的時候可以對每一個影響因素(自變量)的題目數(項數)分析一次,看是否每一個自變量的設計的問題都具有較好的信度。(若某一因素項數信度不夠好,首先可以通過調整題目中的表達措詞、修改或增加關鍵詞來提高信度,若某道題目修改調整後信度仍然過低則可以刪除這一道題目達到提高整篇文章的信度)。
三、效度分析和因子分析
通俗來說,效度分析是檢驗問卷題目與研究目的是否相一致,即不能研究顧客對某產品的滿意度,問卷設計的問題則是調查某產品的市場覆蓋率。一般分為內容效度和結構效度,內容效度是指題項與所測變量的適合性和邏輯相符性(我們在設計問卷時一般都要參考或引用前人的問卷,因此內容效度不存在問題,當然如果設計的一份全新的問卷則需要重點分析內容效度)。結構效度是指題項衡量所測變量的能力,實證分析一般著重分析結構效度,可以通過進行探索性因素分析(Exploratory factor analysis,EFA)檢驗來證明量表的結構有效性。
分析步驟如下:分析----降維----因子----將左邊所有變量選到右邊變量框中----描述---選擇初始解和KMO---點擊繼續提取在提取裡選擇主成份和碎石圖---繼續----旋轉----選擇最大方差法。如下圖:
得出結果如下:
結果分析:效度分析結果主要看KMO值和sig.(顯著性),若KMO>0.7,則說明問卷中設計的自變量之間具有一定的聯繫,問卷是有效的;sig.<0.001說明該問卷符合做因子分析,下一步則可以進行因子分析(EFA)。
因子分析結果如下(僅抽取部分比較重要的圖解釋):
看碎石圖的關鍵就是找拐點,也就是找圖中陡坡和緩坡的臨界點(特徵值明顯較大的因子),趨於平緩前的點有幾個則說明這份問卷可以分為幾個因子(當然還要結合特徵值、總方差解釋等圖考察)。如上圖看出從第7個點開始趨於平緩,即前面有6個點屬於陡坡上的點,初步可以說明這份問卷設計的因素可以分為6個因子。
旋轉後的成分矩陣的作用是知道那幾道題可以歸為一個因子,上面截取一部分作為說明(左側的數字為問卷中的題項,題目內容已刪除)。上圖可以看到一共6個成分因子,其中問卷題目5、6、7、8、9、10、26可以第一個因子(成分1對下的數字0.769、0.571、0.714…….均大於0.5,即各個測量題項的最大因素負荷均大於0.5,且交叉載荷均小於0.4則可作為一個因子);同理題目27、28則可以作為一個因子,成為4對下的數字為0.797、0.793…….。
總方差解釋圖主要看累計百分比的項。如上圖6個因子在整份問卷中的總解釋能力(累計百分比)達到了72.938%(總解釋能力>50%可以說明篩選出來的因子有良好的代表性,當然實際操作中一般>80%的問卷因子解釋能力比較好)。所以整份問卷基本可以提取出6個因子作為主要變量,其餘的為次要變量。
通過上面三個圖的分析,可以確定這一份問卷一共可以提取出6個因子(6個自變量)。
五、相關分析
在進行相關分析前首先要取各個因子的平均值(如上面7道題目作為因子1,因子1的平均值就是取7道題目的維度平均。得出6個因子的維度平均值後進行相關分析。
步驟如下:分析----相關----雙變量將左邊的變量選到右邊在皮爾遜和雙變量前打勾----確定。如下圖
得出的結果如下:
上圖中,假設前面兩個為因子1、因子2(自變量),第三個為因變量。相關性是檢驗自變量與因變量的關係。可以看出因子1與因變量的相關係數為0.779,且sig.<0.001,說明自變量(因子1)與因變量呈正相關。(相關係數的取值範圍介於-1~1之間,絕對值越大,表明變量之間的相關越為緊密)。
六、回歸分析
回歸分析需要看的圖有模型摘要圖、ANOVA、係數圖等等
步驟如下:分析----回歸----線性選擇自變量和因變量----點擊統計----選擇德、共線性等(看自己需要知道什麼就選什麼,不一定要選共線性診斷等)---繼續----圖----選擇XY變量繼續---保存----繼續---確定。如下圖:
得出結果為:
模型摘要圖主要看R方和德賓值(D-W),調整後的R方為0.684說明自變量對因變量的可解釋程度為68.4%(R方代表的是自變量對因變量的解釋能力,R方與調整後的R方越接近說明數據越穩定)。D-W值是檢驗自變量之間是否存在自相關,上圖中D-W>2表示問卷中的幾個自變量無自相關性,(D-W值的範圍記得不是很清楚了,見諒…..)。
即方差分析表,ANOVA表的一個作用就是驗證假設(A對B不產生影響)是否成立,一般只看sig.值即可,上圖sig.<0.01,說明拒絕原假設,至少有一個對因變量產生顯著性影響。
下一步看係數表,係數表則說明有幾個自變量對因變量產生顯著性影響。如下圖:
上圖中回歸係數b是通過樣本及回歸模型通過SPSS計算得出的,是反映當自變量x的變動引起因變量y變動的量。主要看顯著性,因子1、2、3的sig.<0.05,說明3個因子均對因變量產生顯著性影響。
從上面可以看出,相關性分析是檢驗自變量與因變量之間是否具有相關性(正向或反向相關),回歸分析則說明了自變量對因變量是否具有顯著性影響。
當然上面提到的步驟和圖大部分是我感覺論文需要用的,還有很多像散點圖等一些小細節很多也沒有寫,一個是因為篇幅有限,一個也是因為時間也過去大半年了,有很多也記得不是很清楚了,上面寫的內容基本是我去年寫論文後學到的,很多都是個人的理解,僅供參考。希望大家畢業季順利!
——————————————-—— 更新一下——————————————————
最近電腦借給別人了,本來想等拿回電腦再跟新一下,想想還是趁著這兩天閒一點回答一下各位的問題。
在寫這一篇文章的時候我想我已經說得很清楚了,本人非SPSS專業,大學期間也沒有開設過這門課程,僅僅是寫論文的時候涉及了單因素分析的一點皮毛,多因素及多元回歸分析並未涉及,可以說我會的基本已經在文章中寫出來了。我的畢業論文也僅僅是構建簡單的模型和簡單相關回歸分析得出簡單的結論。所以說畢業涉及關聯分析,卡方檢驗,中介變量和多元回歸分析,數據有問題等比較深入的知識的小夥伴也不要為難我了,不是不想回答,實在是問了我也不懂啊。
以下整理了一些簡單的問題回答一下:
一、錄入問卷數據的具體步驟:
第一種方法:打開SPSS軟體,可以看到SPSS左下角有兩個視圖界面----數據視圖和變量視圖,點擊變量視圖,可以看到「名稱、類型、寬度、值」等一些列,在「名稱」那一列輸入問卷題目,「類型」那一列設置為數值、在「值」的那一列賦值,具體怎麼賦值看個人問卷的設計,一般情況下可以設置為1非常不同意,2不同意,3不一定,4同意,5非常同意。(具體能不能反方向設置,我覺得要看分析結果,怎麼設置能得出有效的信度效度分析結果數據就怎麼來,論文答辯也不可能要你用電腦一步一步來操作,並且像賦值這麼簡單的問題也不可能會問,只要能把一篇論文從頭到尾圓潤起來,其他的細節沒必要那麼較真)。
第二種方法:現在問卷數據收集一般是在問卷星或其他網站上發布,數據收集完成後可以在問卷星或別的網站上將自己的問卷下載成excel格式的文件,打開SPSS直接導入excel文件(點擊文件---打開---數據---選擇excel數據類型--導入)。
二、如何求每個維度的平均?
在做相關性分析前首先求維度平均,打開Spss,在窗口欄點擊「轉換--計算變量」,在裡面輸入每個因子對應的題目和公式就可以得出維度對應的均值平均。如下圖:比如說維度1對應的題目有3道題,在目標變量的框中填上維度1,在數字表達式的框中寫上公式:=(題目1+題目2+題目3)/3。
求出各個維度的均值,然後就可以進行相關分析了,直接將均值得分的各個維度選到相關分析的變量框中就可以,接下來的步驟看以上文章。
三、對自變量進行效度分析,這個時候是不是在抽取裡應該選特徵值大於4的,然後才能出來4個公因子?
不是,特徵值選大於1就行了。因子分析的目的是降維,篩選出能解釋題目數量比較多的因子。這就是說明為什麼一個因子維度能對應幾道題目。如果一個因子只能解釋一題目甚至連1道題目的方差都不能解釋,那麼這個因子在這份問卷中也沒有什麼意義了,可以直接忽視。所以說提取特徵值大於幾和公因子的數量沒有很大的關係,一般來說,提取特徵值大於1是比較公認的標準。特徵值大於1的意思是提取出的因子能解釋1道題以上的方差,如果選大於4的話則說明接下來提取出的因子則可以解釋4道題以上的方差。
四、在信度分析時,那個值該怎麼寫,問卷信度總是0.5多 ,不懂那個值怎麼寫?
信度分析主要看Alpha(a係數),a<0.7則表示設計的問卷信度不可靠,0.7<a<0.8則說明問卷具有一定的可靠性,0.8<a<0.9則說明問卷信度很好。0.5小於0.7說明問卷信度不可靠,接下來的分析也用不到了,建議調改問卷或數據。
五、如果兩個變量的sig值為0.531,說明了什麼?
SPSS的原理是假設A對B不產生影響,分析得出的結果P(sig.)<0.001/0.01/0.05,則假設不成立,即A對B具有顯著性影響。如果sig.=0.531大於>0.05,說明假設成立,A對B(或B對A)不產生影響,任何一方變動都不會影響另一方。
六、如果要做多個因素對一個結果的影響程度,應該使用什麼分析?
多個自變量對一個因變量的影響分析,參考我的文章,一般信度效度分析,相關分析,線性回歸分析即可。
七、為什麼我的相關性分析出來沒有星號?
有沒有星號這個什麼原因我也不清楚,你可以看一下你使用的版本,我用SPSS24.,相關分析有星號,回歸分析沒有星號。星號對數據有什麼影響我也不清楚,去年我寫論文的時候也沒有關注個這個問題。
八、這些數據得出來了,怎麼運用到論文中呢?
這個問題我真不知道怎麼回答.數據得出來了,就說明你的實證分析那一章也寫好了。結論建議那一章就可以根據分析結果提出來。前面的緒論、文獻綜述這些純理論性的也不用說了,數據分析前模型假設/問卷設計這一章寫完了才可以進行實證分析也不用考慮了.
九、一個維度至少3-7個題目是在哪本書上看?
沒有在哪本書看到的,大概是在知網的期刊和論文上看到的,參考的論文一般也是3到7個問題,維度對應的4、5個問題的居多。
十、中文版在哪下載:
去年我是在淘寶花的十幾塊錢買下載的,現在很多人反映已經安裝不了了,大家可以在微信搜索安裝包,很多公眾號可以免費領取噢
更新更新更新更新!!!!!!!!
還是有很多小夥伴問維度平均怎麼求,今天特意用SPSS操作了一遍,回答一下之前的問題。
第一:有人問維度是什麼,怎麼來的,簡單的說,維度就是因子,一個因子就代表一個維度,在做因子分析的時候,我們就能把問卷的所有問題歸類,哪幾道題歸為一個因子,就說明這幾道題屬於一個維度,一份問卷有幾個因子就說明有幾個維度。所以維度就是做因子分析得出來的結果。
第二:維度平均的操作步驟
上面也多多少少說過怎麼算,不過還是有很多小夥伴算不出,今天我就具體說一下。
1.在SPSS的窗口欄上點擊轉換----計算變量,如下圖:
2.在計算變量界面上命名目標變量和輸入公式,公式之間點擊界面鍵盤上的數字及符號輸入,如下圖:
3.點擊確定後SPSS輸出界面如下:
4.返回SPSS數據視圖和變量視圖在問卷數據旁邊會增加一列均值數據,如下圖:
且在計算變量界面下的類型和標籤框中也會增加維度平均的標籤,如下圖:
這樣一個維度平均值就算出來了,每個維度平均算出來之後,就可以進行相關分析和回歸分析了。