一文帶你快速學會回歸分析

2020-12-06 SPSSAU

還記得在上一篇(一篇帶你學會相關分析)文章中,我們向大家介紹了關於相關分析的內容總結。編寫的過程讓我想起曾見到過的一個問題「為什麼要同時使用相關分析和回歸分析?」

相信很多人也有這樣的疑問,既然都是研究變量間的關係方法,已經進行過相關分析為什麼還要使用回歸分析呢?

相關與回歸的區別

其實,相關分析與回歸分析的研究目的並不相同。相關分析用於描述變量之間是否存在關係,而回歸分析則是研究影響關係情況,反映一個X或者多個X對Y的影響程度。

相關與回歸區分

相關分析只能研究變量之間相關的方向和程度,卻不能得到變量之間相互關係的具體形式,也無法從一個變量的變化來推測另一個變量的變化情況,而這些都可以通過回歸分析得出的。

因而分析時首先應該確定研究變量之間是否存在關係,即先進行相關分析。當兩個變量之間存在顯著的關聯時,再進行回歸分析。有了相關關係,才可能有回歸影響關係,如果沒有相關關係,那麼也不應該有影響關係。

清楚了相關與回歸的區別,我們開始對本文的主角「回歸分析」進行具體說明。

01 回歸分析概念

回歸分析用於研究變量之間的影響關係情況。比如,消費者對某產品購買意願的影響因素研究;或者員工敬業度與工作績效之間的關係研究等。同時回歸分析也可用於估計與預測。

02操作步驟

案例:為研究在線學習課程滿意度的影響因素,收集300份數據,將平臺交互性、教學資源、課程實施、課程設計共四個因素作為自變量,將學生滿意度作為因變量,利用回歸分析方法進行分析(涉及題目均採用李克特五級量表)。

首先,通過相關分析得出平臺交互性、教學資源、課程實施、課程設計共四個因素與滿意度均有著顯著的正相關關係

因此,將4個變量均納入模型分析。

SPSSAU分析界面

這裡可以選擇是否保存殘差和預測值,可用於檢驗回歸模型構建情況和預測分析

如果X為定類數據,直接放入模型時,一般是不會對其進行分析,而僅僅是作為控制變量(可能對模型有幹擾因而放入的項)納入模型。

如果X為定類數據,且想分析X對Y的影響;比如相對於男性,女性有沒有滿意度更高。此時則需要進行虛擬變量設置。(操作路徑:數據處理→生成變量→虛擬變量)

03 結果分析

線性回歸分析結果

第一步:首先對模型情況進行分析

包括模型擬合情況(R),是否通過F檢驗。

由上圖可知,模型R值為0.402,意味著平臺交互性,教學資源,課程設計,課程實施可以解釋學生在線學習課程滿意度的40.2%變化原因。回歸模型通過F檢驗(F=49.628,P<0.05),說明至少一個變量會對滿意度產生影響關係。

第二步:分析X的顯著性

分析X的顯著性(P值),如果呈現出顯著性,則說明X對Y有影響關係。如果不顯著,則應剔除該變量。

可以看到,四個解釋變量對滿意度的顯著性分析P值均小於0.05。

第三步:判斷X對Y的影響關係方向及影響程度

結合回歸係數B值,對比分析X對Y的影響程度。B值為正數則說明X對Y有正向影響,為負則說明有負向影響。

通過回歸係數來看,模型中四個解釋變量的B值分別為0.110、0.150、0.271、0.079說明

平臺交互性,教學資源,課程設計,課程實施對滿意度均呈現出顯著的正向影響關係。

第四步:寫出模型公式

模型公式為:滿意度=1.600 + 0.110*平臺交互性 + 0.150*教學資源 + 0.271*課程設計 + 0.079*課程實施

04 其他指標說明

(1)VIF值:用於檢驗模型共線性問題,如果全部小於10(嚴格是5),則說明模型沒有多重共線性問題,模型構建良好;反之若VIF大於10說明模型構建較差。如果出現多重共線性問題,可使用使用逐步回歸分析或嶺回歸分析進行分析;或者進行相關分析,手工移出相關性非常高的分析項。

(2)D-W值:用於檢驗變量自相關性,一般在2附近(1.7~2.3之間),則說明沒有自相關性,模型構建良好,反之若D-W值明顯偏離2,則說明具有自相關性,模型構建較差。

(3)殘差正態性分析:用於檢驗模型構建情況,使用「正態圖」檢測殘差正態性情況,如果殘差直觀上滿足正態性,說明模型構建較好,反之說明模型構建較差。如果殘差正態性非常糟糕,建議重新構建模型,比如對Y取對數後再次構建模型等。

使用路徑:SPSSAU→可視化→正態圖

(4)異方差性:將保存的殘差項,分別與模型的自變量X或者因變量Y,作散點圖,查看散點是否有明顯的規律性,比如自變量X值越大,殘差項越大/越小,這時此說明有規律性,模型具有異方差性,模型構建較差。

使用路徑:SPSSAU→可視化→散點圖

上圖是回歸分析保存的殘差值與自變量作散點圖,用於檢測異方差性,上圖可以看出,X變化時,Y並不會變大或者變小,因而說明無關聯性,也即說明沒有異方差性。

05 其他說明

如果回歸分析出現各類異常,可通過比如描述分析、箱線圖、散點圖等查看數據中是否有異常值,找出異常值,並且處理掉異常值。也或者使用穩健回歸。

在進行相關分析時,不需要特別區分自變量X(解釋變量)和因變量Y(被解釋變量)。但在做回歸分析時,首先要確定X和Y。有時由於問卷沒有設計對應的問卷題項(比如上面的滿意度對應題目),那麼建議可以將X所有題項概括計算平均值來表示Y。

怎麼樣,是不是讀完這篇文章,以後再也不怕做回歸分析了。

相關焦點

  • 一文讀懂多元回歸分析
    一、多元回歸分析簡介用回歸方程定量地刻畫一個應變量與多個自變量間的線性依存關係,稱為多元回歸分析(multiple linear
  • 廣義線性回歸分析模型Logistic,一文讀懂它!
    作者:丁點helper來源:丁點幫你前文我們已經講解了相關與回歸的基礎知識,並且重點討論了多重線性回歸的應用與診斷分析。今天的文章,我們來看看日常學習和科研中應用同樣廣泛的另一類回歸分析——Logistic回歸。Logisti回歸與多重線性回歸的區別多重線性回歸,一般是指有多個自變量X,只有一個因變量Y。
  • 毒醫被拋屍懸崖,攜空間帶三子回歸,治病救人富可敵國!空間文
    喬妹比較喜歡空間文哦,所以今天喬妹給大家帶來是4本空間文,毒醫被拋屍懸崖,攜空間帶三子回歸,治病救人富可敵國!第一本:《空間嫡女:一品世子妃》——木沐蘇劇情簡介:前世過勞死的葉瑾,穿越之後過得滋潤的很。 空間、靈泉、妙藥通通在手!施毒、治病、經商不在話下! 庶妹想要渣男?行行行,都給你。
  • 一文帶你全方位了解與投遞EI
    一文帶你全方位了解與投遞EI(上大畢業發EI可行嗎)一、EI簡介EI全稱叫做The Engineering Index,中文叫:工程索引。它的資料庫主要收錄工程技術領域的期刊、會議和書籍。按收錄類別來說,我們所說的EI包括EI源刊和EI會議。其實我們說EI的時候一般就是指EI會議。雖然EI分為EI源刊和EI會議兩種。
  • 一文詳述:觀察性研究中的logistic回歸分析思路
    病例對照研究中的logistic回歸 從數據分析的角度來看,病例對照研究大致有兩大類目的:一是探索危險因素,二是驗證危險因素。共線性是大多數回歸模型都需要考慮的一個問題,一旦發現該問題,需要採取不同措施來解決。常見的解決方案包括刪除某一自變量、主成分分析、Lasso回歸等。 例2:某研究分析乳腺增生的危險因素,自變量同時包括妊娠次數(三分類變量,用1、2、3表示相應次數)和流產次數(三分類變量,用0、1、2表示相應次數)。
  • 一文輕鬆看懂線性回歸分析的交互作用!
    作者:丁點helper來源:丁點幫你前幾天的文章,我們聚焦在回歸分析,今天來看看在回歸分析中常常要研究的一類難點問題——交互作用的探究。交互(interaction),字面上不太好理解,但是從數學表達上卻很簡單。
  • SPSS統計分析案例:一元線性回歸
    微信號後臺有非常之多的關於回歸分析的留言,作為最常見的統計分析方法,在工作生活中的應用需求量巨大,這兩天已經為大家選好了案例數據,先從一元線性回歸分析開始。一元線性回歸,顧名思義,僅有一個自變量的回歸模型,研究的是一個因素對結果的影響,可以用於預測,也經常被稱之為簡單線性回歸分析。
  • 如何用EXCEL線性回歸分析法快速做數據分析預測
    回歸分析法,即二元一次線性回歸分析預測法先以一個小故事開始本文的介紹。二元一次線性回歸分析法是一種數據分析模型。在EXCEL函數公式是FORECAST(英文意思是:預測),其用途是根據一條線性回歸擬合線返回一個預測值,此函數使用可對未來銷售額、庫存需求或未來數據趨勢進行預測分析。
  • 新手如何快速入門數據分析?
    CDA數據分析研究院原創作品, 轉載需授權隨著網際網路迅猛發展,各大公司沉澱了很多的數據,如何找出藏在這些數據背後的規律,利用這些數據來給公司創造價值,作為一個新手面對這些問題的時候,你是不是考慮怎麼快速學習數據分析呢?
  • spss多變量回歸分析 - CSDN
    上圖SPSS分析結果,更詳細的內容可以學習Cox回歸的推文初學者如何理解Cox回歸和HR值這裡只介紹啞變量的分析結果。總的來說廣義線性模型相對於簡單的線性回歸來說,過程雖複雜,但少了設置啞變量的過程,而且結果成列更容易閱讀,同時可以快速處理多個啞變量的場景,是推薦的處理方法。
  • 手把手帶你零基礎 7 晚學會 SPSS 統計分析,搞定高分 SCI
    想要運用到文章裡也可以總結適用於論文的模板,數據直接往裡面套發文更快速。但是這些便捷方法也都需要耗費很長時間去學習總結,對於時間寶貴想要快速發文章的科研人都是很困難的。  如果有專業的老師運用豐富的經驗幫著梳理理論知識,傳授口訣記憶,手把手教導操作並總結模板,那一定能快速的將統計分析運用到文章裡,獲得投稿人的認可!
  • 從協方差分析看回歸與方差分析的聯繫
    文章來源: 丁點幫你微信公眾號作者:丁點helper無論是單因素還是雙因素方差分析,我們可以發現,它們都有一些共性,比如研究的因變量(如前文的硒含量、滿意度得分),都是定量變量;而自變量,即分組變量(如地區、教育程度、性別)都是定性變量。
  • 一文讀懂線性回歸和梯度下降
    (點擊上方公眾號,可快速關注)轉自:BYRanshttp://www.cnblogs.com/BYRans/
  • 【從入門到高手:回歸分析】多元回歸分析:如何求解多元回歸方程
    在前面的章節中我講到,實際需求預測場景中,通常,影響需求的因素不止一個,對需求影響的因素可能多種多樣,也就是說自變量多種多樣,很少能用單一的變量(也即一元回歸分析)來做好需求預測。這時,我們需要用到多元回歸分析。回歸分析在需求預測的應用,也主要是多元回歸分析。對需求預測而言,多元回歸更具有適用性和有效性。
  • 一文讀懂條件Logistic回歸
    病歷對照研究或者傾向得分匹配研究(一種將研究數據處理成『隨機對照實驗數據』的方法)中常使用條件Logistic回歸進行分析。其與普通的二元logistic回歸區別在於,多出配對ID,即將配對組納入考慮範疇。1、案例背景某北方城市研究喉癌發病的危險因素,使用1:2匹配的病例對照研究方法進行調查。共有25對配對數據(每對3個,即25*3=75行數據)。
  • 學會用多元回歸分析武裝頭腦
    回歸分析是在體育博彩中應用最廣泛的統計方法,在影響比賽結果的因素和結果之間建立定量的聯繫。邏輯回歸又稱logistic回歸分析,是一種廣義的線性回歸分析模型,常用於數據挖掘,疾病自動診斷,經濟預測等領域。邏輯回歸的因變量可以是二分類的,也可以是多分類的。所以特別適合於疾病和體育博彩領域!
  • 一文掌握多分類logistic回歸
    Logistic回歸分析(logit回歸)一般可分為3類,分別是二元Logistic回歸分析、多分類Logistic回歸分析和有序Logistic回歸分析。logistic回歸分析類型如下所示。Logistic回歸分析用於研究X對Y的影響,並且對X的數據類型沒有要求,X可以為定類數據,也可以為定量數據,但要求Y必須為定類數據,並且根據Y的選項數,使用相應的數據分析方法。
  • 學會這一招,超快速抓到稀有海洋生物!
    關注動森研究所,讓我們帶你浪。大家好!我是今天的實習研究員hana大皮皮!
  • CNS 一作大神:這個生信分析方法帶你不做實驗快速發論文!
    如果你想快速發論文,如果你是: 臨床醫生科研本就薄弱,做實驗攢數據勞心勞力。 夢想升主治醫師,評職稱拿基金全要拼 SCI 文章? 好不容易得到測序數據,聚類分析,富集分析還是不會做?
  • 想學會如何測試射頻微波元器件嗎?本文教你快速學會
    打開APP 想學會如何測試射頻微波元器件嗎?本文教你快速學會 發表於 2018-03-29 14:01:25 * 特別提醒:學當以致用,看完文章別忘了答題喲~ 矢量網絡分析儀作為射頻微波元器件性能評價的一個基本工具,有著廣泛的應用