SPSS,全稱Statistical Product and Service Solutions 。最權威的標準統計軟體之一,最初為社會科學統計軟體,後更名為統計產品與服務解決方案,面向商業化。SPSS 在全球全球 25 萬用戶,涉及行業遍及金融、醫藥衛生、生產、運輸、通訊、政府、教育、地理、天文等多個領域,擁有市場研究 80% 的佔有率。
那麼該如何用SPSS進行數據分析呢?SPSS數據分析的流程是如何的?下面簡單來進行說明。
首先,我們要了解數據分析的一般流程是什麼?
CDA數據分析師將一個完整的數據分析項目分為以下五個流程:
外部數據主要有三種獲取方式,一種是獲取國內一些網站上公開的數據資料,例如國家統計局;一種是通過爬蟲等工具獲取網站上的數據。還有一種是通過企業內部的資料庫,SPSS有豐富的資料庫接口,可以便捷地從資料庫中讀取數據。
對於數據量不大的項目,可以使用excel來處理數據,但對於數據量過萬的項目,使用資料庫來存儲與管理會更高效便捷。
SPSS也有自己的用作數據儲存的數據格式,sav文件。用戶可以將經過SPSS處理的數據保存為sav格式,同時也可以非常方便地將sav文件轉換為其他數據格式文件。
數據預處理也稱數據清洗。大多數情況下,我們拿到手的數據是格式不一致,存在異常值、缺失值等問題的,而不同項目數據預處理步驟的方法也不一樣。CDA數據分析師認為數據分析有80%的工作都在處理數據,可見數據預處理在數據分析的重要性。
這一階段首先要清楚數據的結構,結合項目需求來選取模型。
常見的數據挖掘模型有:
數據分析最後一步是撰寫數據分析報告,一般包括數據可視化分析。
其次,掌握了數據分析的一般流程後,便要以SPSS為工具,根據以下流程對一個完整項目進行以下細分並掌握:
介紹完流程,我們以一個例子來簡單認識一下SPSS吧。
其實 SPSS 是一個傻瓜界面化操作軟體,只要認識了軟體的基本界面和功能,然後把你的數據準備好,輸入進軟體系統,點擊需要進行分析的功能,軟體會自動給出分析建模的結果,並不需要寫代碼或者程序。
看到軟體的界面,左下角有兩個視圖,「數據視圖」和「變量視圖」。首先你需要在「變量視圖」定義好你的變量,其中包括名稱、類型、標籤、值、測量等。定義好變量之後,切換進「數據視圖」,「數據視圖」是一個長的類似於Excel表格的界面,在這裡你可以輸入你需要進行分析的數據,你也可以直接從 excel 中複製過來,前提是格式需要一致。
數據準備就緒後,根據你想要分析的方法,在軟體界面上選擇分析的功能。
數據準備就緒後,根據你想要分析的方法,在軟體界面上選擇分析的功能。比如,這裡我準備了一個購買力的數據集,變量涉及區域、總體消費、家庭規模、家庭收入、每次消費額、孩子數、大學以上比例、購買力等欄位。我想分析購買力的影響因素。這裡輸入自變量、因變量數據後,因為因變量是三分類變量(低購買力、中等購買力、高購買力),進行回歸分析。
接著,彈出這樣的窗口。
將對應的數據選入進自變量和因變量,再根據需要設置一些參數信息,再點擊「確定」就可以得到分析結果了。
一切看起來這麼簡單。
然而...別著急開心,接著軟體給出的一堆分析結果。
這時候,沒有學過統計學知識的同學就一臉懵逼了...
所以,問題的重點來了。學習 SPP 的重點不在於軟體本身,而是與統計建模和業務相關的知識,你需要學會數據分析的思維方法,同時學會解讀軟體輸出的結果。學習 SPSS 也給了我們更多地沉澱數據分析真正技能和思維的時間,而不是花時間在一些在無謂的編程上。
好吧,想要讀透 SPSS 給出的分析結果不是一件容易的事情。
在這裡,不得不推薦 SPSS 學習的利器,學習的最好方法當然是讀書,推薦張文彤老師的:
1. 張文彤 鄺春偉 SPSS 統計分析基礎教程(第 2 版)
2. 張文彤 董偉 SPSS 統計分析高級教程(第 2 版)
獨學而無友,則孤陋而寡聞。
CDA數據分析師推出「業務數據分析師」課程,內容包含Excel商業分析、Tableau商業智能、可視化技能、資料庫管理(Mysql)、統計理論方法、數據分析軟體應用(SPSS)、SPSS建模在內的內容,結合銀行、電商、零售等行業需求,採用實際案例教學來提高課程的實用性。
停止猶豫,邁出第一步,無需編程基礎,挑戰商業分析實戰項目!
時間:2019.11.09日開課(三個月周末集訓)
地點:北京現場& 全國直播
授課安排:現場班9800元遠程班7800元
1. 在線填寫報名信息
電腦端:
https://www.cda.cn/kecheng/82.html
微信端(掃碼訪問):
2. 給予反饋,確認報名信息
3. 網上繳費
4. 開課前一周發送電子版課件和教室路線圖
聯繫課程顧問,獲取詳細課程大綱和課程案例、試聽視頻。
13121318867(微信)