一篇帶你學會相關分析

2020-12-07 SPSSAU

在很多研究中,研究者都把數據的相關性放在一個非常重要的位置上。甚至專門寫上一整篇的文章闡述其研究變量之間的相關關係,足見其重要性。

通常,我們所說的「相關」都是一個較為模糊的概念,好像直覺告訴我們,這個事和那個人應該有關係,這個數字和那個現象似乎有聯繫,卻始終沒有辦法得到一個明確的結論。

而相關分析則讓這種模糊的直覺有了理論支持。如果想要考察兩個變量之間是否存在相關性,我們第一個就會想到相關分析。

本文將從概念、散點圖、相關係數、應用舉例、結果分析、其他說明,共6個部分進行介紹。

相關分析

相關分析是一種簡單易行的測量定量數據之間的關係情況的分析方法。可以分析包括變量間的關係情況以及關係強弱程度等。

比如,身高和體重的相關性;降水量與河流水位的相關性;工作壓力與心理健康的相關性等。

散點圖

相關分析前,首先通過散點圖了解變量間大致的關係情況。

如果變量之間不存在相互關係,那麼在散點圖上就會表現為隨機分布的離散的點,如果存在某種相關性,那麼大部分的數據點就會相對密集並以某種趨勢呈現。

SPSSAU散點圖分析

例如上圖,直觀地展現了平時成績與能力評分之間的關係情況:X增大時,Y會明顯的增大,說明X和Y之間有著正向相關關係。

同時,SPSSAU還支持添加線性趨勢線,用於分析預測變量可能的走向。

SPSSAU散點圖

使用路徑:SPSSAU->可視化->散點圖

相關係數

雖然散點圖能夠直觀展現變量之間的關係情況,但並不精確。因此還需要通過相關分析得到相關係數,以數值的方式精準反映相關程度。

相關係數常見有三類,分別是:Pearson相關係數、Spearman等級相關係數和Kendall相關係數。

SPSSAU整理

其中,最常使用的是Pearson相關係數;當數據不滿足正態性時,則使用Spearman相關係數,Kendall相關係數用於判斷數據一致性,比如裁判打分。

應用舉例

例如,為研究平時成績與能力水平之間的關係,調查收集了85位學生的平時成績和能力測試成績數據。

首先,用散點圖對數據進行初步分析,上面已經展示出散點圖結果,這裡就不再展示。通過散點圖分析大致可知,X增大時,Y會明顯的增大,平時成績和能力水平之間有著正相關關係。

然後,對變量進行相關分析。

使用路徑:SPSSAU->通用方法->相關

這裡可以選擇任意一種格式,結果都是一樣的。

相關分析結果表格

分析步驟:

第一:首先看Y與X是否有顯著關係,即看P值大小。第二:接著分析相關關係為正向或負向,也可通過相關係數大小說明關係緊密程度。

一般相關係數在0.7以上說明關係非常緊密;0.4~0.7之間說明關係緊密;0.2~0.4說明關係一般。

可以看到,平均成績和能力評分之間的相關係數值為0.491;同時,相關係數右上角有兩個星號,代表p<0.01,因而說明平均成績和能力評分之間有著顯著的正相關關係。

出現變量間相關係數很低,但是依然呈現出顯著性的情況,此時說明關係較弱,但依然是有相關關係。也可能存在以下幾種情況:

(1)異常值影響

如果數據中存在很明顯的異常值(或離群值),會影響數據的分析結果。

解決方法:通過繪製散點圖,查看數據是否存在異常值。並使用[ 數據處理 ]→[ 異常值 ]剔除異常值。

(2)分析方法選擇錯誤

相關分析是研究定量數據與定量數據之間的關係情況。對於定類數據,相關分析並不適合。

變量類型和其對應分析方法的示意圖,如下所示:

SPSSAU整理

其他說明

對於相關分析,分析時並不會區分X和Y,X與Y的相關係數等同於Y與X的相關係數。如果多個量表題表示一個維度,可使用「生成變量」的平均值功能。將多個量表題合併成一個整體維度。

相關焦點

  • 一文帶你快速學會回歸分析
    還記得在上一篇(一篇帶你學會相關分析)文章中,我們向大家介紹了關於相關分析的內容總結。編寫的過程讓我想起曾見到過的一個問題「為什麼要同時使用相關分析和回歸分析?」相信很多人也有這樣的疑問,既然都是研究變量間的關係方法,已經進行過相關分析為什麼還要使用回歸分析呢?相關與回歸的區別其實,相關分析與回歸分析的研究目的並不相同。
  • 相關分析「一篇概全」
    相關分析是最基本的關係研究方法,也是一些分析方法的基礎,研究中我們經常會使用到相關分析,所以今天咱們就來說一說相關分析的那些「事兒」。相關分析是用於研究定量數據之間的關係情況,包括是否有關係,以及關係緊密程度等,通常用於回歸分析之前。
  • 如何寫一篇有說服力的競品分析報告?
    編輯導讀:對產品經理來說,學會做有效的競品分析並撰寫易讀的競品分析報告是必備技能之一。但在實際工作中,大部分人的報告都停留在套用模板和堆砌信息的階段,看似框架完整、五臟俱全,實則重點不清、價值不高。具體該怎麼做呢?本文作者從自身實踐出發,分享了撰寫競品分析報告的相關方法經驗,供大家一同參考學習。
  • 產品認知的U型曲線:帶你學會產品分析
    對產品經理來說,做產品分析是一件家常便飯的事了,不過你有思考過產品分析到底是在分析什麼嗎?做這件事情的目的又是什麼呢?本文將為你解答這些問題。01這要先從一道問題聊起:到底怎麼做產品分析或者競品分析?在面試時,經常出現的一個問題就是:請分析一款你最喜歡/印象最深刻/最近經常用的一款產品。不管問法是什麼,換湯不換藥,本質都是對一款產品的觀察與思考。
  • 健康筆記丨如何讀懂一篇薈萃分析
    健康筆記丨如何讀懂一篇薈萃分析 2020-08-25 13:33 來源:澎湃新聞·澎湃號·湃客
  • 如何寫好一篇文獻綜述?師兄給你劃重點
    文獻綜述作為一篇文章的第一部分被稱為龍頭,萬事開頭難,是最難寫的,也是審稿專家最關注的地方。那麼,當你確定一個好的研究選題之後(可參考往期文章:如何進行論文選題?發現和轉化兩步搞定),最關鍵的就是寫出一篇完美的文獻綜述了。
  • 如何讀懂一篇薈萃分析
    - 如何讀懂一篇薈萃分析 - 對科研工作者而言,「薈萃分析」是很常見的研究類型。那麼,我們為什麼需要薈萃分析?它能解決哪些問題呢? 在研究中,循證醫學往往面臨著重重困境。
  • 厲害的人是怎樣分析問題的:三個方法幫你學會分析問題
    我們的身邊總是會存在那麼一種人,在你看來非常難的問題,在他那裡只需要一眼就能得到答案。比如課堂上,老師題目還沒有讀完,他就能知道問題以及答案;工作中,PPT的內容還沒有講完,他一下就能發現問題的關鍵,這種人在學校裡叫學霸,在社會上則叫成功人士,他們通過自己的方法分析問題,用更簡便的方法解決問題,從而快速的達到成功。
  • CNS 一作大神:這個生信分析方法帶你不做實驗快速發論文!
    近期看到一篇發在《Experimental Eye Research》影響因子 3.152 的文章 ,從投稿到接收並發表共 2 個多月。 這是一篇完全基於生物信息學分析的文章,文章的思路:分析 TCGA 資料庫中的數據——利用 R 語言的 WGCNA 包——結合在線工具——發表文章。
  • 甘肅省分析測試技術與儀器學會成立
    中國甘肅網11月30日訊據甘肅日報報導(新甘肅·甘肅日報記者 李滿福)為促進甘肅分析測試技術的普及、推廣、繁榮和技術人才成長,發揮分析測試技術在科技創新中的重要支撐作用,今天上午,甘肅省分析測試技術與儀器學會在蘭州成立。
  • 一文帶你全方位了解與投遞EI
    一文帶你全方位了解與投遞EI(上大畢業發EI可行嗎)一、EI簡介EI全稱叫做The Engineering Index,中文叫:工程索引。它的資料庫主要收錄工程技術領域的期刊、會議和書籍。按收錄類別來說,我們所說的EI包括EI源刊和EI會議。其實我們說EI的時候一般就是指EI會議。雖然EI分為EI源刊和EI會議兩種。
  • 手把手帶你零基礎 7 晚學會 SPSS 統計分析,搞定高分 SCI
    ,比如:  有些基礎性概念會理解偏差,甚至搞不清楚哪寫數據應該用哪些方法;  有的時候甚至自己也會混淆單樣本 t 檢驗與兩獨立樣品 t 檢驗;  在面對數據關係分析的時候,就連以前學過的最簡單的 Person 相關性分析也會出現紕漏;  SPSS 軟體摸索不明白,輸出的圖標怎麼才符合投稿要求  ......
  • 全流程總結相關分析,讓你條理清晰完成分析
    不會分析的同學可以按照圖中的流程一步步操作,就能得到準確可靠的結果。本文將介紹的是相關分析的分析流程,即SPSSAU通用方法中的「相關」。相關分析我們使用相關分析,通常是在研究兩個變量的相關性情況,包括是否有關係,以及關係緊密程度等。比如聽課質量和學習成績的關係;員工敬業度與薪資的相關性等。1. 數據類型相關分析的適用範圍很廣,理論上講,凡是考察變量間相關性的,都可以叫做相關分析。
  • 一篇文章帶你全面了解蛋白粉!
    其中對蛋白粉簡單一筆帶過,那麼今天就跟大家科普下蛋白粉。今天這一期主要講講蛋白粉的分類以及相關介紹,明天咱們再詳細聊聊蛋白粉的是是非非。所以還是我之前的建議:如果你既不增肌也不減脂,同時平時飲食當中可以攝入足夠的蛋白質,這個比例為1g*體重kg,那麼你就不用補充蛋白粉;如果你正在努力減脂或者增肌,那麼蛋白粉一定是你需要去攝入的,因為減脂期你需要攝入足夠的蛋白質來維持肌肉,不至於掉脂肪的時候流失肌肉;而增肌期就更需要加大對蛋白粉的攝入。
  • 一篇META分析文章的悲催投稿經歷 - 丁香園
    我們實驗室截止到目前一直在做某個基因在精神分裂症發病中的作用,包括遺傳學分析和目前正在進行的動物模型研究,這個基因的一個SNP(用rs1234表示)在2008年歐洲的精神分裂症GWAS研究中首次被報導。
  • 【審稿快】一篇純生信分析的「基礎文章」是怎麼樣設計的
    方法:本研究分析了5種胃腸道(GI)癌症患者的TCGA數據。使用來自cBioPortal的數據,研究了GI癌症中9種已知的與m1A相關的酶的分子特徵。使用多種生物信息學方法,研究了m1A調節劑對其下遊信號通路的影響。為了進一步證實該調節,使用來公開資料庫的RNA-seq數據研究了m1A作家ALKBH3敲低的效應。
  • 詳聊「相關分析」(二)---偏相關、典型相關 | 醫學方統計學專題
    我們之前講到的直線相關、秩相關都只是分析兩個變量間的相關,並沒有考慮當兩個變量同時與第三個變量相關時的情況。所以這就引出了「偏相關分析」。偏相關分析是指當兩個變量同時與第三個變量相關時,將第三個變量的影響剔除,只分析另外兩個變量之間相關程度的過程。
  • 想寫好一篇作文,要先學會寫好一段話,從兩個方面入手
    字詞組成句子,句子構成段落,段落又形成一篇作文。之前我們講過了句子的重要,今天我們來講一下段落的重要。寫好一段話有多重要我們先從寫作文的角度講。作文由一個個段落組成,段落之間又存在一定的聯繫,通過聯繫構成一篇作文,形成整體性。
  • 一篇畢業論文,怎樣寫更加出色完成呢?
    摘要是一篇論文的濃縮和精華。內行的人看摘要就知道你的主要發現和結論,外行的人也能了解你做了什麼,得到了那些重要發現。因此,選題的意義(理論和應用),用什麼方法(尤其是先進設備和技術)做了哪些工作?獲得了哪些主要結果和結論?是摘要的主要內容,但不需要羅列很多。一篇學位論文不可能有很多重大發現,但是一篇學位論文沒有一點閃光的地方也是不可能的。因此要下功夫挖掘自己結果的重要性和結論的重要性。
  • 只看一篇文章就可學會選股票的技巧
    皮爾森相關係數(Pearson correlation coefficient)也稱皮爾森積矩相關係數(Pearson product-moment correlation coefficient) ,是一種線性相關係數。是用來反映兩個變量線性相關程度的統計量。