OMG:我直接用t檢驗,竟然被拒稿了?

2021-01-07 言爸說育兒

01

為什麼不能直接用t檢驗?

辛辛苦苦收集數據寫文章,如果因為錯誤的統計方法,而被拒稿,豈不太冤了?

可能有人會問:統計有那麼重要嗎?我拿來數據直接用t檢驗分析,多簡單暢快了,怎麼還被拒稿了?

統計真的是很重要的,一般好一些的研究機構都會有專門做統計分析的人員。

如果用錯了統計方法,還可能得出錯誤的結果,「南轅北轍」之類的也時有發生。

舉個形象點的例子:

比如小轎車在平地上開很舒服,但在野地裡開,會非常辛苦,甚至是舉步維艱;在野地裡就得開越野車,但越野車在平地上開,又會比較費油。

對於非正態的數據,t檢驗可能得出錯誤結果,這時候就需要非參數檢驗;但對於正態數據,非參數檢驗效能比較低,所以又要用t檢驗。

至於選擇用t檢驗,還是非參數檢驗,確定數據是否是正態分布,就變得很關鍵。

下面我們一起看一下如果通過SPSS實現簡單快速的正態性檢驗。

02

如何進行正態性檢驗?

查看數據集:

共四個變量

sex性別 1男 0女

Age 年齡

Bmi體質指數

Disease 疾病狀態 1患病 0未患病

分析-描述統計-探索,打開探索對話框。

Disease進入因子列表框,age進入因變量列表,然後點擊統計模塊,在統計對話框中,勾選描述和離群值,點繼續;然後點擊圖模塊,勾選因子級別並置、直方圖、含檢驗的正太圖,點繼續,最後點確定。更直觀的操作步驟如圖所示。

結果:

03

正態性檢驗結果解讀

常見的統計學檢驗有Kolmogorov-Smirnov檢驗(KS檢驗)和Shapiro-Wilk檢驗(SW檢驗),當檢驗結果的p值小於0.05,則認為數據不滿足正態性。

本例中,因為SPSS軟體使用的是中文版本,結果解讀如下:

柯爾莫戈洛夫-斯米諾夫:即KS檢驗,適用條件為樣本量≥100。本例中,選擇KS檢驗,兩組年齡正態性檢驗的p值均為0.2,均大於0.05,故認為兩組年齡均符合正態分布。

夏皮洛-威爾克:即SW檢驗,適用條件為樣本量<100。

寫在後面

其實,細心的朋友可能會發現,在進行正態性檢驗的同時,也進行了離群值的檢驗。

如果大家對離群值感興趣,可以在文章下面點擊「在看」告訴我,如果此文「在看「數超過20個,有時間給大家聊聊離群值的快速識別與處理。

- END -

相關焦點

  • 正態性檢驗,容易被忽略,但又很重要,如果不知道這些內容,有被拒稿的風險
    辛辛苦苦收集數據寫文章,如果因為錯誤的統計方法,而被拒稿,豈不太冤了?可能有人會問:統計有那麼重要嗎?
  • NeurIPS「提前拒稿」直接刷掉11%,投稿人質疑:像是為了完成KPI隨機...
    原創 Synced 機器之心機器之心報導參與:澤南、蛋醬看完摘要,領域主席:我覺得你這篇論文不太行。「我收到了 NeurIPS 發來的拒稿郵件,感到有苦說不出。」
  • 假設檢驗、Z檢驗與T檢驗
    幾天前,我讀到一篇新聞文章,其中提到這次疫情「可能是季節性的」,在溫暖的環境下會有所緩解:所以我開始想,關於冠狀病毒,我們還能假設什麼呢?成人是否更容易受到冠狀病毒爆發的影響?相對溼度如何影響病毒的傳播?
  • 資深審稿人:這就是我拒你稿的11個理由
    在此把我建議拒稿的原則說明如下。01、關於語言不一定要多好,但別太爛。如果低級錯誤(比如標點符號格式和錯別字)出現兩次,我會認為作者並沒有好好的準備投稿,或者說是不具備基本專業素養的人所寫。04、關於消毒副產物消毒副產物一般是飲用水問題,但目前也有很多廢水回用過程考慮副產物,這都合情合理。但我不喜歡那種降解某痕量汙染物時發現的所謂消毒副產物研究。
  • SCI論文投稿狀態直接變成了'Decision in Process' ,是拒稿嗎?
    例子我2016年10月21日,在ELSEVER中提交了一篇稿件,在2017年01月18日變為了
  • t檢驗的效應量
    t檢驗的效應量,我們用Cohen's d表示,簡寫為d,反映兩個均數之間的標準差異:其中分母是兩個獨立樣本的聯合標準差,計算方法為兩個樣本標準差的平方平均數,即不過注意了,這是獨立樣本的計算方法,配對樣本中共同標準差採用配對數據差值的標準差即可,不用這一公式。
  • 第七章 t檢驗與u檢驗--第一節 t檢驗
    第七章 t檢驗與u檢驗   抽樣研究包含參數估計與通過假設檢驗作統計推斷這樣一些重要內容。前者在第六章最後一節中已經涉及,後者如X2檢驗,我們亦已有過接觸。本章將介紹兩均數相比時的假設檢驗。
  • 我的投稿經歷分享:一篇 Case report 被拒稿 6 次,終於接收了
    去年 10 月 5 號投稿,16 號給回復,沒有送審沒有給意見,就說版面不夠直接拒稿。(說版面不夠的都是編輯的客套話,實際上就是文章創新質量不夠) 去年 10 月 26 號投稿,11 月 15 號拒稿,超過半個月的時間,編輯認為我這個文章影響力還不夠高,所以沒有送外審,所以也沒有送審意見。
  • 「統計檢驗」t檢驗和F檢驗
    我們今天來聊一聊t檢驗和F檢驗。t檢驗是在其他解釋變量不變時,檢驗單個解釋變量對被解釋變量的影響。F檢驗是檢驗整個方程,即所有解釋變量聯合起來對被解釋變量的影響。隨機抽取一組容量為n的樣本觀測值進行該事件的試驗,如果小概率事件竟然在一次抽樣實驗中被觀測到,說明原假設不可信,因為不應該出現的小概率事件出現了,因而應該拒絕原假設H0。反之,如果該小概率事件沒有出現,就沒有理由拒絕原假設H0,應該接受原假設H0。假設我們的模型為:
  • 理解 t 檢驗與 F 檢驗的區別
    倘若經比較後發現,拒絕出現這樣結果的機率很少,亦即是說,是在機會很少、很罕有的情況下才會拒絕;那我們便可以有信心的說,這不是巧合,是具有統計學上的意義的(用統計學的話講,就是能夠拒絕虛無假設null hypothesis, H0)。F值和t值就是這些統計檢定值,與它們相對應的概率分布,就是F分布和t分布。
  • 你知道T檢驗與F檢驗嗎?
    另一種解釋:t檢驗有單樣本t檢驗,配對t檢驗和兩樣本t檢驗。單樣本t檢驗:是用樣本均數代表的未知總體均數和已知總體均數進行比較,來觀察此組樣本與總體的差異性。若兩總體方差相等,則直接用t檢驗,若不等,可採用t"檢驗或變量變換或秩和檢驗等方法。其中要判斷兩總體方差是否相等,就可以用F檢驗。
  • 一份國際權威期刊對中國稿件的拒稿率
    圍繞這一問題的討論已經有很多,但是對產生這一結果的直接背景,也就是我國學者投稿SCI期刊的錄取比或者被拒稿率,卻鮮有評述。主要原因是缺乏統計數據,因為絕大部分期刊並不提供其拒稿率,少數期刊提供拒稿率,但也不會透露被拒稿件作者的國籍分布的統計數據。   最近,筆者所從事領域—礦物加工—的頂級期刊Minerals Engineering的主編BarryA.
  • T檢驗與F檢驗,傻傻分不清楚?
    另一種解釋:t檢驗有單樣本t檢驗,配對t檢驗和兩樣本t檢驗。單樣本t檢驗:是用樣本均數代表的未知總體均數和已知總體均數進行比較,來觀察此組樣本與總體的差異性。若兩總體方差相等,則直接用t檢驗,若不等,可採用t"檢驗或變量變換或秩和檢驗等方法。其中要判斷兩總體方差是否相等,就可以用F檢驗。
  • 統計中重要的檢驗:T檢驗、F檢驗及其統計學意義
    單樣本t檢驗:是用樣本均數代表的未知總體均數和已知總體均數進行比較,來觀察此組樣本與總體的差異性。配對t檢驗:是採用配對設計方法觀察以下幾種情形,1,兩個同質受試對象分別接受兩種不同的處理;2,同一受試對象接受兩種不同的處理;3,同一受試對象處理前後。F檢驗又叫方差齊性檢驗。
  • 卡方檢驗,T檢驗和F檢驗
    1、求卡方值:t檢驗為了確定從樣本(sample)統計結果推論至總體時所犯錯的概率,一般是小樣本,n<30。t檢驗可分為單總體檢驗和雙總體檢驗,以及配對樣本檢驗。這裡主要舉例說明雙總體檢驗(即獨立樣本t檢驗),雙總體t檢驗是檢驗兩個樣本平均數與其各自所代表的總體的差異是否顯著。獨立樣本t檢驗統計量為:
  • 手把手教你用 GraphPad 做配對樣本 t 檢驗
    今天給大家介紹一下它的統計分析功能——配對樣本(paired)t 檢驗。 配對 t 檢驗中的數據是每行代表一個不同的主題(或一組不同的匹配數據),用行標題進行標記。請注意,與許多統計程序不同,組和主題不是通過將變量分組來定義的。相反,每列定義一個單獨的組,每行代表一個不同的主題。
  • 【實例】Excel數據分析之假設檢驗中的t-檢驗應用
    (建議查看統計學相關知識)t-檢驗:T檢驗,亦稱student t檢驗(Student's t test),主要用於樣本含量較小(例如n<30),總體標準差σ未知的正態分布資料。t檢驗是用t分布理論來推論差異發生的概率,從而比較兩個平均數的差異是否顯著。
  • R語言:t檢驗
    單樣本t檢驗(使用教材光碟血紅蛋白數據: 例03-05.sav)前提條件:取自正態分布的小樣本(<=60, 偏態用秩和檢驗);或者取自任意分布的大樣本(>60)# install.packages("memisc")library(memisc)## Loading required package: lattice
  • 她穿著17封拒稿信做的裙子去答辯……網友:我有條拖地長裙!
    17封拒信做成的紙裙子這位不走尋常路的女生是密西根州立大學的地球與環境科學博士生Caitlin Kirby,在博士論文答辯這天,她沒有選擇穿普通的西裝裙,而是用自己曾經收到過的17封拒信做成的裙子去參加答辯,裙子上身效果是這樣的:
  • 統計學常用概念|T檢驗、F檢驗、卡方檢驗、P值、自由度
    就是因為要評估兩個總體的方差(Variances)是否相等,要做Levene's Test for Equality of Variances,要檢驗方差,故所以就有F值。另一種解釋:t檢驗有單樣本t檢驗,配對t檢驗和兩樣本t檢驗。單樣本t檢驗:是用樣本均數代表的未知總體均數和已知總體均數進行比較,來觀察此組樣本與總體的差異性。