基礎準備
回歸分析根據自變量與因變量關係的不同,可以分為線性回歸,曲線回歸和非線性回歸等形式。關於回歸分析的具體介紹請回顧下面的文章:
數據分析技術:回歸分析;自己作的擬合曲線,哭著也要跟著走完?沒有必要;
今天介紹的是曲線回歸的具體應用。
曲線回歸
在實際生活中,散點圖往往不能判定數據之間是否呈現很好的線性相關關係,因此就需要對數據加以轉換使之符合線性模型要求,或對模型加以改進使之能處理相應數據。SPSS軟體提供了線性回歸衍生模型用於處理違反線性回歸某些數據,其中最簡單常用的方法是選擇恰當的曲線方程將變量進行轉換,實現曲線直線化,從而將曲線方程轉化為直線回歸方程進行分析。
SPSS曲線估計要求自變量和因變量均為數值型變量。曲線估計模塊能夠自動擬合線性模型、對數曲線模型、二次曲線模型、指數曲線模型等多種曲線模型,而輸出的統計量包括模型的回歸係數、復相關係數、調整的擬合係數及方差分析結果等。SPSS的曲線估計模型包括以下這些類型:
曲線估計步驟
案例分析
現在有一份汽車行業的銷售數據,數據記錄了不同汽車廠家的155個汽車型號的銷售價格及銷售量。對該數據進行分析,不同售價同銷售量之間的函數關係。
(例題數據文件已經上傳到QQ群中,需要的朋友可以前往下載)
分析步驟
1、作散點圖,觀察變量關係;選擇菜單【圖形】-【舊對話框】-【散點/點狀】;選擇【簡單分布】,在跳出的對話框中,將價格選為X軸,將銷售量選為Y軸,點擊確定。
結果解釋
從散點圖可知,自變量和因變量之間不存在線性關係,因此線性回歸分析來構建售價和銷量之間的函數關係,嘗試使用選擇曲線函數來找出汽車銷售量與汽車銷售價格之間的關係模型。
2、轉換變量;選擇菜單【分析】-【回歸】-【曲線估計】,在打開的對話框進行變量選擇,如下圖所示。這裡要強調的是,如果你不確定那個曲線模型適合散點圖展現出來的關係,可以多選擇幾個模型進行嘗試,系統會自動選擇最合適的模型進行回歸分析。點擊【保存】選項,將預測值和殘差選中,結果將保存在新的變量中。
結果解讀
從分析結果來看,在所有曲線模型中複合曲線的R方最大,為0.305,卡方檢驗的概率P值為0.000,說明擬合得到的回歸係數有效,由此可知複合曲線較好地擬合了汽車價格和銷售量之間的關係。同時,散點圖也顯示複合曲線更符合變量點的分布情況,擬合效果更好。
3、用複合曲線再次擬合數據;重複步驟2的過程,在模型中只選擇複合曲線,同時選中顯示ANOVA表格,點擊確定。數據結果如下:
結果解釋
複合曲線的擬合度的R方為0.305,調整後的R方為0.301,說明該模型可以解釋因變量的30.1%的差異,與1相比,效果不是非常的理想。複合曲線模型的方差分析F檢驗的顯著性和回歸係數t檢驗的顯著性均為0.000,達到顯著水平。綜合以上結果,說明複合曲線對這份數據的擬合情況不是非常的理想,但是可以作為今後銷售的參考。從擬合曲線與散點的分布情況可知,當售價大於30000美金時,擬合效果更好,所以用該模型預測售價大於30000美金的型號更為準確。該模型的回歸方程為:
用回歸方程進行預測忌諱迷信擬合指標結果,應該將擬合的指標結果與擬合圖形結合,觀察那個區間的自變臉擬合的因變量比較好,機動靈活的使用回歸分析。
所有例題的數據文件都會上傳到QQ群中,需要對照練習的朋友可以前往下載。
溫馨提示:
SPSS教學視頻,請點擊:《SPSS入門基礎》視頻教程;
生活統計學QQ群:134373751,用於分享文章提到的各種案例資料、軟體、數據文件等。支持各種資料的直接下載和百度雲盤下載。
生活統計學微信交流群,用於各自行業的數據研究項目及其成果交流分享;由於人數大於100人,請添加微信possitive2,拉您入群。
數據分析諮詢,請點擊首頁下方「互動諮詢」板塊,獲取諮詢流程!