R語言卡方檢驗|問卷的交叉分析

2021-02-20 南工程狗熊會數據科學研習社

讓我們以狗熊會精心整理的脫單情況問卷中「社交小團體和自己單身情況之間的關係」為例,來演示一下吧!

整體思路:首先將要分析的兩個變量用列聯表整合;其次對其進行卡方檢驗,得到檢驗結果顯著後,再對各單元格的狀況進行殘差分析,最後得出結論。

列聯表就是兩個分類變量的頻數分布表。計算出列聯表後,觀察各個單元格的頻數。根據單元格的頻數,選擇正確的檢驗方法和函數參數設置。

當樣本容量n> 40且理論頻數 < 5時,要使用Yates校正的卡方檢驗。R代碼:chisq.test(x, correct = T))。

當n < 40 或理論頻數<1的時候,使用fisher精準檢驗更加穩妥一些。R代碼:fisher.test())。

棘狀圖可以由vcd包的spine()函數或者基礎自帶的spineplot()函數繪製。通過棘狀圖可以直觀的觀察到兩個變量間的差異。

R語言中的卡方檢驗十分便利,只需要一個函數即可計算出卡方檢驗需要的參數值。

由卡方檢驗的結果可知:卡方值=5.8026,自由度=1,p值=0.016<0.05

因此我們可以得出結論:個體單身情況與其所在社交小團體單身情況顯著相關。

在得出卡方檢驗結果顯著後,進行殘差分析可以檢驗各單元格的狀況。

這裡的殘差是Pearson殘差。它等於(觀測值-期望值)/期望值的平方根。在殘差分析表格中,單元格的值為正表示觀測值高於期望值,為負表示觀測者低於期望值。

由殘差分析可知:社交小團體脫單率越高,個體的脫單率也就越高。也就是說混跡在非單身的社交小團體的人更容易脫單,單身狗抱團取暖往往形成了單身聯盟,想要脫單更加不易。當然這也只是脫單原因的其中一個因素,大家不要因為自己脫不了單而責怪單身朋友啊。

這樣一個小小案例分析結束後,有沒有對卡方檢驗簡單掌握了呢?當然了,想要更加熟練的運用卡方檢驗,還需要更多研究和練習。趕快去拿自己以往的調查問卷數據練練手吧!

相關焦點

  • 用簡單的分析發現運營的秘密之交叉分析
    比較對照是進行數據探索與分析的基本手段之一。對於數值型(定量)的數據,進行比較對照時可以用均數檢驗、方差分析等方法。
  • SPSS預測問卷分析——項目分析
    項目分析的主要目的在於檢驗編制的量表或測驗個別題項的適切或可靠程度,它與信度檢驗的差異在於信度檢驗是檢核整份量表或包含數個題項的層面或構念的可靠程度。預試問卷施測完後,要進行預試問卷項目分析效度檢驗、信度檢驗,以作為編制正式問卷的依據。項目分析的檢驗就是探究高低分的受試者在每個題項的差異或進行題項間同質性檢驗,項目分析結果可作為個別題項篩選或修改的依據。
  • 問卷數據的效度與信度分析
    對於這種量表數據,我們一般會先對其進行信度、效度的分析,然後判斷得到的數據是否能夠進行下一步的因子分析。下面以一個實例講解如何對李克特量表進行信度與效度的檢驗。某同學通過問卷調查的方法對遊客的旅遊動機及其影響因素進行研究,結合國內外關於民族節慶遊客動機的研究和對節慶期間的遊客進行訪談,運用因子分析從20項旅遊動機顯變量中挖掘出具有較強信服力的旅遊動機,部分問卷數據如下所示(微信後臺回復「問卷數據分析」,可獲得數據下載連結):問卷信息 受訪者一般信息
  • 問卷設計與統計分析----問卷預評估
    通常認為,專題小組能幫助問卷預評估體現在以下2方面:①檢驗人們被問及現實的預設。②評估問卷中的詞語,比如專業術語或者概念的界定。因此,能幫助研究者認識到受訪者在填寫問卷時的現實複雜性、研究者沒有意識到的用詞的模糊性等等問題。專題小組在預評估問卷時,也會針對性地整個問卷的初稿集中進行評審。2.
  • 教您用R語言畫直方圖!| 繽紛燦爛R語言 | 醫學方R語言高階課程
    see you~既往「繽紛燦爛R語言(R語言作圖高階課程)」推文1.R語言作圖!R語言作圖!R語言作圖!說三遍!!| 【繽紛燦爛R語言】| R語言高階課程2.基礎包中的降龍十八掌:par函數詳解(上)| 【繽紛燦爛R語言】| R語言高階課程3.par函數詳解(下)| 繽紛燦爛R語言 | 醫學方R語言高階課程4.如何用R語言畫出漂亮的盒形圖(上)| 繽紛燦爛R語言 | 醫學方R語言高階課程「醫學方」始終致力於服務「醫學人」,將最前沿、最有價值的臨床、科研原創文章推送給各位臨床醫師
  • 實踐反思 | 問卷分析中如何減少人為誤差
    要完成一個問卷報告的數據輸出,主要有如下四個階段:STEP1:問卷數據導出及合併這個階段主要是從問卷系統中下載問卷原始數據,並將不同發放渠道的問卷數據進行統合。作為後續分析的基礎數據,數據的合併與處理要格外小心,特別要留意區分不同渠道或人群返回的數據結果,避免混淆。
  • 問卷、量表信效度
    問卷調查存在誤差,因此在進行數據分析之前,需要監測問卷的信效度。
  • 【R函數學習】R語言時間序列函數整理
    ( m2=arima(prop, order = c(1,0,0),method="ML", include.mean = F) ) #用AR(1)模型擬合,不含截距項。——說明:Box.test(r,type="Ljung-Box",lag=6,fitdf=1)fitdf表示p+q,number of degrees of freedom to be subtracted if x is a series of residuals,當檢驗的序列是殘差到時候,需要加上命令fitdf,表示減去的自由度。
  • R語言時間序列函數大全(收藏!)
    tsdiag(m1) #對估計進行診斷,判斷殘差是否為白噪聲summary(m1)r=m1$residuals #用r來保存殘差Box.test(r,type=」Ljung-Box」,lag=6, fitdf=1)#對殘差進行純隨機性檢驗,fitdf表示殘差減少的自由度AutocorTest(m1$resid) #加載FinTS包
  • R數據分析:如何繪製回歸分析結果的森林圖
    今天給大家寫寫如何把你做的模型係數畫出來,就是你的模型中自變量都有一個係數和置信區間嘛,那麼我們把係數和其置信區間畫出來的樣子就像是meta中的森林圖差不多,所以我把文章起了個繪製回歸分析結果的森林圖
  • 問卷數據分析步驟1——如何確定問卷的有效性
    這裡就拿問卷分析舉例首先我們要根據研究目的設計問卷獲得我們想要的數據。現在就有一個疑問,我們拿到的數據是不是真實反映了我們想要了解的問題。這個時候就需要對問卷的信度和效度進行分析。問卷的信度就是用來衡量問卷填寫的時候是不是客觀,認真填寫的,而不是問卷填寫人隨意亂填的,即問卷獲得的數據是可靠的,認真獲得的。問卷的效度就是用來衡量問卷的有效性,即問卷是不是能夠真實反應你想研究的事物。
  • 職位分析問卷法PAQ
    職位分析問卷的項目包括六個項目:採用職位分析問卷法工作分析時,有以下幾個步驟:第一、準備工作(一)初步調查了解公司的大致情況和工作崗位情況,與高層管理者進行溝通協調,對人力資源部進行人員分配,成立工作小組,分工協調工作。
  • 乾貨 | 如何設計調查問卷更吸引人?
    問卷設計的好壞會直接影響分析的效果,想像問卷一旦完成,數據收集完成,最終卻無法按照預期進行分析,是多麼糟糕的事情。然而多數人首次設計問卷沒有經驗,不知從何下手,也不知道需要設計什麼樣的問題,多少個問題合適,事實上問卷要加多少問題,設計成什麼類型,這些重要性都較低,最核心在於你的思路是什麼,有了思路,一切都會有解決方案。
  • 用R語言進行Cox回歸生存分析
    在生存分析中,探究生存時間的影響因素是一個重要的研究內容,通過KM和log-rank test檢驗的方法,只能夠處理單個二分類因素的生存數據。當想探究多個因素或者離散型變量對生存時間的影響時,我們就需要藉助於cox回歸方法。
  • 如何入門R語言
    我就利用這個機會,掌握了R語言的數據清洗、面板建模、模型結果可視化等技術。同時,我還給很多做畢設的同學提供了技術支持(沒錯,大部分是女生),順帶自己也學習了一下各種統計檢驗,簡單的時序模型和廣義線性模型等。既幫助了別人,又提高了自己,還認識了不少妹子。可謂一舉多得,一石三鳥。學習感悟個人心得方面,我覺得首先應該做到的一點就是堅持。
  • 我的R語言學習方法
    我為什麼要學習R語言?利用R語言做數據分析的工作;我怎麼學習R語言?在快速學習R語言基礎後,採用邊學邊做,不斷強化的策略學習和應用R語言;我學習R語言的什麼,我主要學習了R語言做數據整理,數據分析、數據建模和數據可視化這四方面的內容,並且對幫助我有效完成數據工作非常有幫助。第二點,我談一下自己在學習R語言的具體方法和做法。
  • 挑戰杯專題篇 | 調查問卷分析方法
    根據統計分析原理來劃分,對調查問卷的分析可分為兩種,即:定性分析和定量分析。一,定性分析定性分析具有探索性的特徵。是為了對問題啟動和定位能有一個深入的認識和理解,或者是對問題進行定義,以達到更好的處理問題的目的。但這種分析是依靠參與工作的人員或具有一定前瞻眼光的人對數據的特殊解釋,這種解釋是有特殊性的,理解也是不同的,可見定性分析的結果可能讓你難以捉摸。
  • 如何用Excel軟體幫你做統計分析?
    近來,身邊一直有同事及朋友跟我求救:幫我做個t檢驗唄,幫我做個方差分析可行?行,行,當然ok。我們往往用SPSS軟體或者R軟體很快的給出結果,我也很疑惑,如果說R軟體等編程軟體你不會情有可原,可是對我的同事們已經多次培訓過SPSS如何做簡單的統計分析,並且SPSS是一款很簡單的非編程軟體。為什麼,為什麼還是一遍一遍的來問我?
  • 經典工作分析問卷設計(示例)
    一、工作分析問卷 填寫日期: 20**/06/______
  • 評分卡建模—單變量分析
    主要是逐步選擇後對特徵進行單變量分析,我主要是rank分組之後進行單變量分析,以下是代碼:代碼很簡單,看看就明白了。。