全流程總結相關分析,讓你條理清晰完成分析

2021-01-10 SPSSAU

上周SPSSAU做了一個小調查,結果讓我們十分意外。得到最多的反饋是大家對於常見分析方法,不知道如何選擇,如何分析。

雖說越實用的方法,往往也越簡單。但剛開始接觸數據分析時,確實就是會因為一些奇奇怪怪的術語不理解,讓大家產生很難懂學不會的挫敗感。

為了幫大家快速度過新手期, 我們整理了一份常見分析方法的流程總結。

其中包括每種分析方法的分析流程,以及每個環節中可能出現的問題及應對方法。不會分析的同學可以按照圖中的流程一步步操作,就能得到準確可靠的結果。

本文將介紹的是相關分析的分析流程,即SPSSAU通用方法中的「相關」。

相關分析流程總結

為了便於理解,我們先簡單介紹下相關分析,然後按照分析流程順序,對每一步可能會涉及的問題進行簡要說明。

相關分析

我們使用相關分析,通常是在研究兩個變量的相關性情況,包括是否有關係,以及關係緊密程度等。比如聽課質量和學習成績的關係;員工敬業度與薪資的相關性等。

1. 數據類型

相關分析的適用範圍很廣,理論上講,凡是考察變量間相關性的,都可以叫做相關分析。

但依據習慣,我們通常說的相關分析,多指的是兩個定量數據之間的簡單相關分析,這就要求兩個變量都是定量數據,即選項數字大小要可比較,且有實際意義。

如果兩個數據均為定類數據時,則不可以直接用相關分析,而應該使用卡方分析測量相關性(準確說應該是差異分析)。

如果一個是定類數據,一個是定量數據,則應該使用方差分析。

這種誤用常見於分析背景信息題與核心研究題項的相關情況。

2. 正態性

相關分析要求數據服從正態分布,因此分析前需要檢驗數據的正態性。

正態性有多種檢驗方法,常見方法如:正態圖、正態性檢驗、P-P圖/Q-Q圖等。正態性的判斷標準可以查看之前的推送:多種判斷正態性的方法詳細說明

由於相關分析對正態性要求比較寬鬆,即使違反計算結果也比較穩健,只要數據基本滿足正態即可。如果數據完全不正態,則可以用Spearman相關係數。

3. 查看線性趨勢

當兩個定量數據在散點圖上的散點呈現直線趨勢時,就可以認為兩者存在直線相關趨勢,這也是相關分析的一個基本前提。

SPSSAU-散點圖
散點圖

例如上圖,當X增大時,可以比較明顯地看出Y會隨著增大,說明X和Y之間有著正向相關關係。如果是負相關,散點圖會呈現隨著一個變量值的增加,另一個變量值降低的趨勢。

非線性關係

如果數據呈現非線性的趨勢,可以選擇對變量進行數據轉換(如對數轉換),或是使用Spearman相關係數進行分析。

4. 檢驗異常值

相關分析對極端值較為敏感,異常值會影響分析結果。需要在分析前查看是否存在異常值,保證結果的可靠性,此步可以和上一步一起通過散點圖查看。

存在異常值

如果存在異常值,需要在分析前進行剔除。使用方法:SPSSAU數據處理->異常值。

散點圖

這是上一步中得到的散點圖,有一個明顯的離群值,研究者需要根據情況選擇保留或刪除。建議按照SPSSAU異常值幫助手冊的說明,對異常值進行處理。

5. 相關係數類型

當完成以上步驟且滿足相關分析的分析條件後,即可進行相關分析。

點擊『通用方法』-『相關』。

這時又出現一個問題。SPSSAU提供了三種相關係數,分別是Pearson、Spearman,Kendall相關係數,該選哪一種呢?

多數情況下,SPSSAU建議使用pearson相關係數。如果數據不滿足正態性或不滿足線性關係的情況下,可以考慮使用Spearman相關係數。

Kendall相關係數用於判斷兩個變量的等級相關性,是否具有一致性,比如評委打分,數據排名等。

關於三種相關係數的比較具體可以查看相關分析幫助手冊。

6. SPSSAU操作

終於到了分析這一步了。相對於其他分析軟體,SPSSAU的操作相對簡單,將變量從左側拖拽到分析項處,點擊『開始相關分析』即可。

分析項X可選

需要特別強調的一點是,相關分析通常不會特別區分哪個變量是X,哪個變量是Y。因此分析時,常常是直接把分析項都放入「分析項Y(定量)」裡即可。

如果有明確的X、Y可以分開放置,兩种放置方法只在表格的展示格式上有區別,結果是一樣的。

指標解讀

分析步驟可參考SPSSAU輸出結果中的「分析建議」及「智能分析」。

需要注意的是相關係數代表變量之間的相關程度,相關係數越大,說明相關程度越緊密。

P值用於判斷相關係數是否有統計學意義,P<0.05即說明變量間有相關關係,P值並不代表相關關係的強弱。

A1、A2交叉處的數字代表相關係數,而星號代表P值。一個星號代表P<0.05,兩個星號代表P<0.01。如果沒有星號,則說明P值>0.05。

7. 後續分析

相關分析的結果並不能代替回歸分析,而相關分析通常是作為回歸分析的基礎,保證在有相關性的前提下,才可能有回歸影響關係。

因此後續可以通過回歸分析,進一步得到影響關係和具體的函數表達式。

最後

以上就是相關分析的分析流程梳理。理論上都應該按照上述步驟進行分析,但在實際過程中,即使忽略其中的步驟,也能得到穩定的結果。

因此即使不按照步驟分析,也沒有很大問題,而對於沒有分析經驗的研究者,SPSSAU建議按所提供的步驟按部就班進行分析,才是最保險的做法。

相關焦點

  • 全流程總結方差分析,就靠它了!
    方差分析是一種分析調查或試驗結果是否有差異的統計分析方法,也就是檢驗各組別間是否有差異。本文我們就一起來梳理下方差分析的分析流程。方差分析流程圖Step1:數據類型方差分析用於分析定類數據與定量數據之間的關係情況,可以比較2組或多組數據的差異。分析前首先應根據數據類型判斷使用的方法是否正確。
  • 一個案例帶你了解市場分析全流程
    這就引出了我們下面重點要分析的家電服務卡。首先,我們來說一個市場容量是什麼?通俗點說,就是你做的這個事情市場有多大。具體分析的方法如下:目標用戶全體體量多大?有多少市場潛力?針對目標用戶,其對應的用戶群的需求點有哪些?目標用戶痛點如何?在當前用何種方式解決?獲取目標用戶全體體量和市場潛力,我們需要從一些權威市場報告網站去搜索。
  • 全流程總結卡方檢驗,幫你理清分析思路
    SPSSAU操作(1)交叉卡方如上圖,分析不同性別的人群,使用理財產品的情況是否有差別。這裡Y項也可以放入多個標題,一起分析。分析時先看P值情況,P值小於0.05或0.01即說明X與Y之間呈現出顯著性,然後可以再進一步比較括號中的百分比,對每一項進行描述。如果P>0.05了,則代表沒有統計學意義,通常就不再進行深入分析。具體分析步驟可參考SPSSAU輸出的「分析建議」及「智能分析」。
  • 效度分析完整總結!你一定要知道的分析流程
    設計問卷你還缺這一步2.(2)效標效度效標效度是以經典量表的測量結果作為「金標準」,與當前數據得到的結果進行相關分析,如果相關係數值較高,則說明效標效度良好。操作方法:首先確定效標,計算問卷得分,使用pearson相關分析,考察實測得分與效標得分兩組數據的相關性。判斷標準:相關係數越大,代表相關性越高,效度越高。
  • 信度分析完整流程總結,一定有你需要的
    本文嘗試從分析思路角度進行梳理,希望能夠讓大家對信度分析有更深入地理解。1. 為什麼要做信度分析在進行信度分析前,首先需要了解什麼是信度,以及為什麼要做信度分析。結果展示:最終可將各個維度對應的分析結果整理匯總成一個表格進行展示。(2)折半信度折半係數是將所有量表題項分為兩半,計算兩部分各自的信度以及相關係數,從而估計整個問卷的信度。
  • 十年數據分析經驗,總結出這三類分析工具最好用
    提及數據分析工具相信小夥伴們都不陌生,但是很多人都會有個疑惑?數據分析工具這麼多,它們有什麼區別?哪個更好?哪個更強?我應該學習哪個?雖然這個問題有點俗套,但是很重要,我也一直努力在追求這個終極問題的答案。如果大家在網上去搜索這方面相關的信息,你又很難看到一個公平的觀點。
  • 芝麻大規模全基因組關聯分析完成
    由中國農科院油料所張秀榮研究員領銜的芝麻與特色油料遺傳育種創新團隊,與中科院國家基因研究中心等單位合作,在國際上率先完成了芝麻高密度單倍型圖譜構建、主要農藝性狀大規模全基因組關聯分析
  • 「競品分析」的理念、流程、方法、工具
    本文將對競品分析的「道、法、術、器」(即競品分析的理念、流程、方法、工具)做系統性介紹,可以為你解答以下關鍵問題:競品分析與市場分析有什麼區別?為什麼要做競品分析?對於個人來說,不論是產品運營還是產品經理,競品分析都是職業技能的重要組成部分,多做競品分析還能提升我們的「產品感」。一份優秀的「競品分析報告」甚至有可能成為你職業生涯的轉折點。
  • 復盤分析的方法論&應用技巧
    類似兩個數字之間的比大小,情況可分為三種:「大於」,結果大於目標,就是指完成的情況比設定的目標要好;「等於」,結果等於目標,就是指完成的情況剛好達到設定的目標;「小於」,結果小於目標,就是指完成的情況比設定的目標要差。
  • 關聯性分析最全總結
    下面給你答案.兩隨機變量X、Y 之間存在一定的線性趨勢,稱為線性相關。線性相關係數:Pearson積矩相關係數,相關係數的取值介於-1~1之間,越接近於1或-1,關聯程度越大。資料類型:變量X與Y 均為隨機連續型變量且均滿足正態性一般步驟:先作兩變量之間的散點圖,判斷變量之間是否存在線性趨勢,再作相關分析。
  • 一個真實案例教你運用數據分析
    比如經過分析,發現訂單履約率下降的原因是成品生產不出來,無法完成交付;預測性分析,基於上述兩個層次的分析,我們發現了其中的規律,即原材料供應商的送貨及時率會影響成品訂單的履約率。假如上月某原材料供應商A送貨及時率只有70%,通過建模,我們可以預測本月該供應商會使我們的訂單履約率下降2%;處方性分析,有了預測性分析的結果後,我們無需再做事後諸葛亮,而可以運籌帷幄,在事前就採取措施。
  • 如何利用漏鬥地圖,讓轉化分析更精準
    以下是筆者根據所做的視頻付費產品,總結的關於提升整體轉化率的方法。提到轉化率,就一定要說產品和運營日常都會使用的漏鬥模型,用於分析各個步驟的轉化情況,但是,我們通常所做的漏鬥模型會相對簡單,只是起到分析最後結果的作用。實際上,當我們建立起精細的漏鬥地圖時,它能幫助我們清晰的了解產品的每個細節並使我們在進行產品優化時,做到有的放矢。
  • 安捷倫科技推出用於生物製藥分析的流程 HPLC-晶片
    安捷倫科技推出用於生物製藥分析的流程 HPLC-晶片 2010 年 5 月 24 日,北京——安捷倫科技公司(紐約證交所:A)在全美質譜大會(ASMS 2010)推出了一種新型 HPLC-晶片技術以應對生物製藥市場中新興的 N-糖鏈分析。
  • 10月產品總結|全面復盤分析,開展規劃Workshop
    分析依據:《網絡貨運平臺管理制度》中運輸過程監控部分強調,網絡貨運平臺應驗證訂單裡的車輛和駕駛員一致,並且在裝卸貨地獲取駕駛員位置。因此,即便是司機提交資料後置,我們也必須限制司機在接單前就完成人和車輛的認證及綁定。所以,為了保證運輸協議籤訂是真實的,現在產品是先完成駕駛員認證後接單的途徑是唯一合規的方式。
  • 元素分析相關文章總結篇(含226個原吸實用問答)
    4.原子螢光實用技能(1)——使用步驟(粗略版)5.原子螢光實用技能(2)樣品溶液配製注意事項6.原子螢光實用技能(3)光路的調節7.原子吸收故障排除(1)8.原子吸收故障排除(2)燃燒頭的清潔原子發射光譜(ICP/AES)理論知識總結篇
  • 相關分析「一篇概全」
    相關分析是最基本的關係研究方法,也是一些分析方法的基礎,研究中我們經常會使用到相關分析,所以今天咱們就來說一說相關分析的那些「事兒」。相關分析是用於研究定量數據之間的關係情況,包括是否有關係,以及關係緊密程度等,通常用於回歸分析之前。
  • 事業單位D類-綜合應用能力揭秘「案例分析題」
    相較於考查的比較簡單、分析維度也不是很多的案例分析題,現在事業單位教師崗位的案例分析題更偏向考查考生的綜合分析能力,材料本身也更加貼近實際的教學情境。要求考生不僅要能夠從多個維度分析材料(如「請根據教育學,心理學的相關知識對案例一中英語老師的備課行為進行評析。」),更要提出解決策略(如「假如你是這位教師,接下來,你打算如何改變現在的狀況?」)。這種問法比較開放,難度也比較大。
  • 6個方法有效提高你的分析能力
    一個擁有強大分析能力的人,往往能夠一眼看透事物的本質,快速找到問題的關鍵,抓住重點,高效地達成目標。 玩遊戲時,你需要分析敵我雙方,把握戰機,贏得最後的勝利。 工作時,你需要明確目標與現狀,搜集信息,拆解步驟,高效地完成任務。
  • 從零開始數據分析:一個數據分析師的數據分析流程
    數據分析百科給出準確定義:指用適當的統計分析方法對收集來的大量數據進行分析,提取有用信息和形成結論而對數據加以詳細研究和概括總結的過程。簡而言之就是有目的的收集數據、分析數據,使之成為信息的過程。
  • 數據分析模型:歸因分析
    於是,「歸因分析」便最早應用在了廣告投放行業。(歸因分析能最先應用在廣告行業還有一個原因,就是廣告的目標是單一的。比如:無論多少個渠道商,最後推的都是同一款 App;但是若將在產品內部的運營位進行歸因,就需要考慮這個廣告位和商品是否有關係。)舉個例子:一款 App,投放了三個推廣渠道,最後 App 通過某個渠道商完成了下載。