SPSS數據分析心得小結分享

2021-02-15 學術志

經管學苑

(ID:jingguan100)

由南開大學數量經濟研究所所長王群勇教授及其學術團隊主辦,旨在定期與大家分享計量經濟學的相關理論及軟體使用技巧,覆蓋經濟學、管理學、社會學、政治學等學科,為廣大學友提供優質學術內容

掃碼關注

▲長按二維碼關注

文章來源:經管之家(ID:jgjgedu)

作者:徐定德


學習數據分析之spss分析工具,可真的不是一般的功夫,真的要很認真和很細心才能做得好spss。下面我來和大家分享一下關於SPSS數據分析心得小結,希望大家從這數據分析心得分享中能得到一些啟示和指導。


拿到一份數據,或者在看到國內外某個學者的文章有想法而自己手裡的數據剛好符合這個想法可以做時,在整理好數據後不要急於建模。一定要對數據做缺失值處理、異常值處理。在數據預處理的基礎上再進一步建模,否則可能得到錯誤的結果。

承接心得1,數據預處理怎麼做。一是缺失值的處理。我個人有幾個看法:一是數據樣本量足夠大,在刪除缺失值樣本的情況下不影響估計總體情況,可考慮刪除缺失值;二是數據樣本量本身不大的情況下,可從以下兩點考慮:1是採用缺失值替換,SPSS中具體操作為「轉換」菜單下的「替換缺失值」功能,裡面有5種替換的方法。若數據樣本量不大,同質性比較強,可考慮總體均值替換方法,如數據來自不同的總體(如我做農戶調研不同村的數據),可考慮以一個小總體的均值作為替換(如我以一個村的均值替換缺失值)。2是根據原始問卷結合客觀實際自行推斷估計一個缺失值的樣本值,或者以一個類似家庭的值補充缺失值。

承接心得1,數據預處理第二點異常值的處理。我大概學了兩門統計軟體SPSS和Stata,SPSS用的時間久些,熟悉一下,Stata最近才學,不是太熟。關於這點我結合著來說。

關於異常值的處理可分為兩點,一是怎麼判定一個值是異常值,二是怎麼去處理。判定異常值的方法我個人認為常用的有兩點:

1是描述性統計分析,看均值、標準差和最大最小值。一般情況下,若標準差遠遠大於均值,可粗略判定數據存在異常值。

2是通過做指標的箱圖判定,箱圖上加「*」的個案即為異常個案。

發現了異常值,接下來說怎麼處理的問題。大概有三種方法:一是正偏態分布數據取對數處理。我做農戶微觀實證研究,很多時候得到的數據(如收入)都有很大的異常值,數據呈正偏態分布,這種我一般是取對數處理數據。若原始數據中還有0,取對數ln(0)沒意義,我就取ln(x+1)處理;二是樣本量足夠大刪除異常值樣本;三是從stata裡學到的,對數據做結尾或者縮尾處理。這裡的結尾處理其實就是同第二個方法,在樣本量足夠大的情況下刪除首尾1%-5%的樣本。縮尾指的是人為改變異常值大小。如有一組數據,均值為50,存在幾個異常值,都是500多(我這麼說有點誇張,大概是這個意思),縮尾處理就是將這幾個500多的數據人為改為均值+3標準差左右數據大小,如改為100。

總結而言,我個人認為做數據變換的方式比較好,數據變換後再做圖或描述性統計看數據分布情況,再剔除個別極端異常值。

如何做好回歸分析。經過多次實戰,以及看了N多視頻,上了N多課,看了N多專業的書。我個人總結做回歸的步奏如下:

1是承接心得1-3,對數據進行預處理,替換缺失值和處理異常值;

2是將單個自變量分別與因變量做散點圖和做回歸,判定其趨勢,並做好記錄(尤其是係數正負號,要特別記錄);

3是自變量和因變量一起做相關係數,看各個變量相關關係強弱,為下一步檢驗多重共線性做準備;

4是自變量多重共線性診斷。若變量存在多重共線性,可採用主成分回歸,即先將存在多重共線性的變量做主成分分析合併為1個變量,然後再將合併成的新變量和其餘自變量一起納入模型做回歸;

5是做殘差圖,看殘差圖分布是否均勻(一般在+-3個單位之間均勻分布就比較好);

6是報告相應結果。

看到論壇上有網友問為什麼他(她)老師不建議採用後向步進法處理變量多重共線性。記得張文彤老師說過他有個同學做過一個研究,即採用後向步進法剔除變量的方式去做回歸,得到的結果犯錯的機率比較大。張老師也不建議用這個方法處理多重共線性。處理多重共線性比較好的方法是做主成分回歸。

有個朋友問我在報到回歸結果時用未標準化的回歸係數好,還是用標準化後的回歸係數好。我個人覺得這個問題仁者見仁智者見智,要看想表達什麼。具體而言,如果想表達在其它條件不變的情況下,自變量X每變化1個單位,因變量變化多少個單位,這種情況用未標準化回歸係數就好;如果想比較各個自變量對因變量影響的相對大小,即判斷相對而言,哪個變量對因變量影響更大。這時需要消除量綱的影響,看標準化後的回歸係數。

這是投稿一篇SSCI外審專家提出的意見。我做的是無序多分類logistic回歸模型。因變量分了5類,有一類個數比較多,達到300多,有1-2類個案比較少,只有30左右。專家提到了要做穩健性檢驗。這個用stata軟體編程加一個robust即可解決問題。不知道在SPSS裡面怎麼做。歡迎知道的朋友一起討論下。我個人認為這是一個好問題的。不做穩健性檢驗模型可能受一些極端值的影響,結果不穩定。可能本來顯著的變量剔除1-2個樣本後就變得不顯著了。所以做回歸分析穩健性檢驗也比較重要。

如果有可能,我希望在後面的心得中附上實際操作的步奏圖和解釋的。看看有沒有人需要這個。不然可能說的一些東西需要的人能看明白,但還是不清楚怎麼做。希望和大家一起交流學習。

相關焦點

  • 基本數據統計分析--spss
    在數據分析工作中,描述性統計分析是我們日常使用率最高的,主要的基本統計分析維度包括但不限於均值、 中位數、眾數、方差、百分位、頻數、峰度、偏度、探索分析、交叉聯列表分析、多選項分析、基本統計報表製作等。而這些功能操作在spss中是可以直接使用的。當然我們也需要理解相關定義。
  • 學會spss就能找到數據分析工作嗎
    大學課堂上學習了spss,老師也講了很多知識,但是現在準備畢業了,我做的實習工作就是用業內的數據進行最新的行業研究。現在真正需要用到spss進行分析了,我卻看不懂老闆給的數據和分析要求,難道這就是理論與實際的脫節嗎?不敢去問我的上司,具體要怎麼操作,我怕給他留下一個不靠譜的印象,我只好去問一個辦公室的師姐。她比我早兩年入職,儼然已經是辦公室裡的熟練工,幸好還有同校同專業的她在。
  • 數據分析基礎相關性分析,SPSS實操
    一般根據研究的目的不同、或變量的類型不同,採用不同的相關分析方法。 常用的相關分析方法:二元定距變量的相關分析、二元定序變量的相關分析、偏相關分析和距離相關分析等。二、SPSS相關性分析操作spss相關性分析操作流程
  • 「spss數據分析系列」t檢驗
    一、t統計量及t檢驗本人介紹spss數據分析中的t檢驗,我們平時分析數據時經常對比均值,其中兩分類的均值對比採用的t檢驗,這裡強調一下的是兩分類的對比,其他還有獨立樣本t檢驗,配對t檢驗,我們在下面spss軟體部分再做說明
  • spss怎麼分析因子?spss因子分析法詳細步驟
    spss不僅可以分析主成分 ,還可以分析因子哦,但是很多朋友不知道spss怎麼分析因子?小編下面有一個spss因子分析法詳細步驟哦,只要大家按照spss因子分析法詳細步驟一步步操作就知道spss怎麼分析因子了哦,下面就和小編一起來看看吧!
  • spss主成分怎麼進行分析?spss主成分分析法步驟
    spss 這款軟體功能非常多哦,還可以分析主成分哦,但是很多朋友不知道spss主成分怎麼進行分析?小編下面準備了spss主成分分析法詳細步驟,大家安裝 詳細步驟一步步操作就知道spss主成分怎麼進行分析?
  • 一份SPSS回歸分析與數據預處理的心得體會
    一定要對數據做缺失值處理、異常值處理。在數據預處理的基礎上再進一步建模,否則可能得到錯誤的結果。心得1:數據預處理怎麼做。一是 缺失值的處理。心得2:數據預處理第二點異常值的處理。如有一組數據,均值為50,存在幾個異常值,都是500多(我這麼說有點誇張,大概是這個意思),縮尾處理就是將這幾個500多的數據人為改為均值+3標準差左右數據大小,如改為100。總結而言,我個人認為做數據變換的方式比較好,數據變換後再做圖或描述性統計看數據分布情況,再剔除個別極端異常值。關於SPSS回歸分析心得1:如何做好回歸分析。
  • 數據分析之主成分分析,spss主成分分析實例
    一、主成分分析概要主成分分析,在進行有多個指標的綜合評定時,客觀全面的綜合評價結果非常重要,然而往往多個指標之間通常存在信息不統一或者重複等眾多因素,各指標的權重往往很難確認。主成分分析方法能夠解決以上問題,主成分分析法是一種降維的統計方法,是考察多個變量間相關性一種多元統計方法。二、spss主成分分析操作流程導入數據。
  • SPSS數據分析問卷信度檢驗陳金文老師手把手教學
    陳金文老師手把手教學SPSS數據分析問卷信度檢驗調查問卷(或稱量表,常用的有李克特量表),其調查的結果的可靠性對於研究而言是起著成敗作用的
  • 「spss數據分析系列」方差分析
    上一課我們講的是t檢驗,t檢驗是用於2個類別的均值對比,如果是3分類以及以上的分類的均值對比,則採用方差分析。t檢驗是用的t分布來檢驗時候接受假設,方差分析則用的F分布,如下圖。方差分析的適用條件:1、個樣本的獨立性(指每個單元格內的數據相互獨立):這樣才能保證數據變異的可加性。2、正態性:單元格內的所有總體都是從一個正太總體來面抽出來,這個時候一般由於單元格數量比較少,所以沒法直接分析和觀察,這時候一般採用殘差分析來看。
  • 【每天學點應用軟體】SPSS數據分析:語法應用之數據處理(一)
    讀取數據文件/保存數據文件(1)讀取數據文件Get FILE='F:\SGM CSI 09Q4\BuickCSI\spss\09Q4 Buick CSI SPSS.sav'/KEEP=A1 A2.*這裡的F:\SGM CSI 09Q4\Buick CSI\spss\09Q4Buick CSI SPSS.sav為文件讀取路徑; /keep=A1 A2指讀取文件中只保留A1和A2兩個變量,此句可以不要,便是保留所有變量.
  • 數據分析難?教你spss使用的正確姿勢
    軟體不會用,各種數據傻傻搞不清楚,尤其是怎麼分析數據更是暈頭轉向,當然跟著靠譜的老師學習,一邊看實操一邊自己做,這樣肯定事半功倍。本次我們整理出了spss的數據分析教程,都是有實操的,只要跟著做,絕對沒問題!
  • SPSS因子分析案例
    【二、簡單實例】現在有 12 個地區的 5 個經濟指標調查數據(總人口、學校校齡、總僱員、專業服務、中等房價),為對這 12 個地區進行綜合評價,請確定出這 12 個地區的綜合評價指標。【三、解決方案】1、spss因子分析同一指標在不同地區是不同的,用單一某一個指標難以對12個地區進行準確的評價,單一指標智能反映地區的某一方面。
  • 「spss數據分析系列」卡方檢驗-2x2
    前面的t檢驗都是對均值的分析,這類分析主要是針對於連續性變量,比如身高,溫度,降雨量等,但是如果針對於分類變量的差異分析怎麼分析呢,這裡就用到了我們所說的卡方檢驗,但是卡方檢驗對應的情況有很多種,這裡我將第一種,就是2x2的表格,2x2意思就是兩個變量都是2分類的變量。
  • 左手SPSS,右手EXCEL——數據分析工具入門
  • spss是什麼軟體?spss軟體是用來做什麼的?
    很多人看到有人在用spss,好奇spss是什麼軟體?spss是用來做什麼的? spss是一個非常好用的統計分析軟體, spss用於統計學分析運算、數據挖掘、預測分析和決策支持任務的軟體產品及相關服務軟體哦,下面小編就來詳細介紹一下吧!
  • spss聚類分析功能怎麼使用?spss聚類分析教程
    spss 是一個非常好用的統計分析軟體,spss有一個聚類分析的功能哦,但是很多人不知道spss聚類分析功能怎麼使用?spss聚類分析是一個將case分析的數據的功能哦,下面小編就來告訴大家spss聚類分析使用教程吧!
  • spss聚類分析步驟
    spss是一個非常好用的統計分析軟體,spss有一個聚類分析的功能哦,但是很多人不知道spss聚類分析功能怎麼使用?spss聚類分析是一個將case分析的數據的功能哦 spss聚類分析使用步驟教程: 1、依次點擊:analyse--classify--hierarchical cluster,打開分層聚類對話框。
  • spss25數據分析軟體免費下載,詳細圖文安裝教程,附上自學視頻教程
    小圈圈同學給你慢慢道來,小圈圈同學已經把安裝步驟和下載方法還有一套spss軟體自學視頻教程,現已經整理好出來了,可以直接拿走,SPSS軟體集數據錄入、資料編輯、數據管理、統計分析、報表製作、圖形繪製為一體的一個常用軟體,統計功能囊括了《教育統計學》中所有的項目,包括常規的集中量數和差異量數、相關分析、回歸分析、方差分析、卡方檢驗、t檢驗和非參數檢驗;也包括近期發展的多元統計技術,如多元回歸分析、聚類分析
  • 在線教育平臺應用與spss數據統計分析師在線直播培訓
    企業 :企業的知識庫體系通常是企業的核心競爭力,使用「在線教育培訓系統」,企業能夠創建自己的知識庫體系,並允許企業內部員工隨時隨地學習和分享這些知識。不斷提升的員工素質和不斷積累的企業知識庫是企業能夠保持長久的競爭力的關鍵。對於大型企業,還可以為合作夥伴及客戶創建遠程學習平臺,提升和考核合作夥伴的專業技能並降低服務和支持成本。