G.Power教程 | 樣本量估計

2021-02-13 行上行下


Hello,

這裡是行上行下,我是喵君姐姐~

一入科研深似海,從此假期是路人。

網上正在熱論996,而大部分的科研人的工作時間可能是711。

每次和審稿人鬥智鬥勇,都感覺自己的頭髮少了很多,深刻體會到了「聰明絕頂」的深意。

而審稿人常問的一個問題是:

這個被試量太少了,我對所得到的結果的準確性感到擔憂~

看到這裡我們就慌了,怎麼辦?

解決方法有兩個

要麼補實驗數據;要麼讓審稿人信服你的被試量是足夠的,得到的結果是可靠的。

補數據相對而言比較麻煩,可能要重新做實驗,重新分析數據和畫圖。而且有的實驗因為現實原因,不能夠補數據了。

那麼,你可以採取另外一種辦法:

使用G.Power進行先驗分析,估計出所需要的樣本量,然後看看你的數據量能否大於估計的樣本量。

或者使用事後分析,說明你現目前的數據量可以達到什麼樣的效應量和統計功效水平,是足夠讓人信服的。

其實,這一步應該在實驗之前就應該進行。但是剛開始做實驗的小白都沒有做這一步的意識,所以只好事後亡羊補牢了。

那麼,今天就詳細講解一下,如何使用G.Power進行樣本量的估計?


來源:雪師妹

(點擊查看大圖,今天只詳解樣本量估計喲~)


其實G.Power的安裝和使用都十分簡單,只需要按照要求,點點點即可。當然,想要弄懂背後的統計學原理,還是需要花費一番功夫。

G*power軟體是由德國杜塞道夫大學幾位樂於分享知識的老師開發的,專門用於統計功效(包括樣本量)計算的免費統計軟體,在心理學領域有著很高的聲譽和認可度。

首先,在官網即可下載軟體,Windows和Mac版本均有。也可在後臺回復「G.power教程」免費獲得軟體及相關資料包。

網址:http://www.gpower.hhu.de/

來源:AffectiveNeuroscience-梁麗美

其次,打開文件夾,雙擊setup,進行安裝。安裝完成後,點擊桌面圖標,順利出現如下圖的主界面圖,即可安裝完成。

對於大多數的人來說,統計學概念都是十分抽象的,看著就頭疼。

然而,有一群可愛的科學家設計了一個有趣的網站,讓我們可以可視化的了解各個概念之間的關係。

網址:https://rpsychologist.com/d3/NHST/

首先,複習一下統計學基本概念,兩個假設以及兩類錯誤之間的關係。

研究假設(H0)與對立假設(H1)


來源:AffectiveNeuroscience-梁麗美

型錯誤(a)與Ⅱ型錯誤(β


其次,理清統計功效(power,1-β)與效應量(effect size,d)之間的關係。

再次,在假設檢驗中,統計模型既定的情況下,有四個參數:

alpha值(a)

效應量(effect size,d)

樣本量(sample size,N)

統計檢驗力(power,1-β)

當統計模型確定後(即使用的是t檢驗,ANOVA或其他檢驗方法),知道其中三個可以計算出第四個。(來源:劉嘉老師)

來源:AffectiveNeuroscience-梁麗美


最後,介紹常見的5種統計力分析(power analysis)的類型。

來源:AffectiveNeuroscience-梁麗美

G.Power的功能強大,即可以計算事後統計檢驗力(事後分析),也可以進行事前樣本量的估計(先驗分析)。

今天,著重講解一下,如何使用G.power進行各個統計方法的樣本量估計?

來源:曹振波老師

Tips: 

1. 新版的重複測量分析當中,組內相關係數為0.5,球形檢驗系統為1(均為默認數值),並且不用再除重複測量次數。

2. 除了進行樣本量的估計,也可查看X-Y plot 查看在現目前的樣本量之下,可以達到多大的統計功效(power,1-β)與效應量(effect size,d)。

今天從G.Power的介紹和安裝、統計基本概念的講解、各個統計方法的樣本量估計三個方面進行了G.power的講解。

但是,其實我們還需要很多的路需要走。

就像範妍老師所講的那樣:

隨著技術的革新,如何進行fMRI實驗樣本量的估計?

我們只採取單篇研究進行樣本量的估計是否可靠?

如何才能夠進行更加科學的樣本量估計?

科學無止境,只希望能夠在不斷的學習和發展當中,能夠越來越好。

今天,我也整理了G.power的相關資料,包括G.Power軟體、英文指導手冊、中文指導手冊及相關PPT、參考文獻資料等。後臺回復「G.Power使用教程」,即可獲得啦!

小夥伴們也可以在留言區將自己的審稿相關經驗分享一下,和大家互相交流哈~

分享完畢,希望有所幫助。

R語言安裝及入門

免費英文文獻下載攻略

2018年心理學乾貨|年刊

EEGLAB腦電數據預處理指導手冊

相關焦點

  • 統計學第7版(賈俊平)—— 參數估計與樣本量估算原理
    統計學第7版(賈俊平)—— 參數估計與樣本量估算原理微信公眾號:生信小知識關注可了解更多的生物信息學教程及知識。
  • 樣本量計算第五彈:PASS軟體輕鬆實現多個樣本均數比較的樣本量計算
    無論是申請課題還是撰寫SCI文章,樣本量的計算是至關重要的
  • 生態學模擬對廣義線性混合模型GLMM進行功率(功效、效能、效力)分析power analysis環境監測數據
    對於對 r 不夠熟悉的研究人員,設置模擬實驗可能太複雜了。在本文中,我們介紹了一個工具來自動化這個過程。r 包有一系列的 r 包目前可用於混合模型的功效分析 。然而,沒有一個可以同時處理非正態因變量和廣泛的固定和隨機效應規範。
  • 統計檢驗力與樣本量計算:G*Power在不同實驗設計與統計方法中的應用
    在被試量和經費有限的情況下,一般將統計檢驗力設置為0.8即足夠;在有條件的情況下,可將統計檢驗力設為0.95甚至0.99。本文中均以80%的統計檢驗力(power = 0.8)計算。統計檢驗力分析是針對某一具體的效應(effect)進行的,因此在同一實驗設計(如,A×B被試間設計)中,在效應量和顯著性水平固定時,檢測A的主效應、B的主效應和A×B的交互效應所需要的樣本量都可能不同,需要分別計算。一般來說,在確定樣本量時,以需要樣本量最多的一個效應(交互效應)為準。
  • R語言統計—配對t檢驗樣本量計算
    在我們實際科學研究中,樣本量是一個頭疼的問題。一般而言,樣本量越大,結果估計更精確,但是過大影響計劃的實施,過小不能提供足夠的統計效能。因此如何確定一個合適的樣本量,增加研究的可靠性,得到可信的結果,這是一個重要的問題。因此,我們來講講在R語言中如何計算研究需要的樣本量。一、樣本量的影響因素「我的研究究竟需要多少樣本量?」
  • 科研實務 | 護理研究:「總體參數估計」樣本量選擇(1)
    小編上兩期幫大家匯總了預實驗以及正式實驗的樣本量計算公式,可是公式裡各種代碼、字母太多,很容易計算錯誤,今後這段時間,小編針對每個公式進行講解。今天先來講第一個。1.總體均數區間估計樣本量總體參數估計是指根據樣本的特徵,去估計總體的特徵。總體均數區間估計樣本量是指對計量資料進行樣本量估計。
  • 研究終點的相關性(correlation)與樣本量計算
    Derive norminal alphas with including correlation為了演示,我們考慮一個簡單的例子:雙重檢驗終點是:The full disjunctive power (or Global power) is obtained in the special case when all null hypotheses are false.
  • 臨床試驗樣本量計算
    科技期刊中樣本量的計算是研究原著文章必備的步驟之一,但目前中國大部分科技期刊對樣本量描述的要求不夠清晰和規範,仍有一部分期刊的稿件不進行樣本量估算的描述,現將科技期刊研究原著文章中樣本量描述方法做一歸納。
  • 如何計算樣本量和統計檢驗力——G*Power軟體
    不同的實驗設計,不同的變量的水平,所選擇的樣本量即被試人數不同。
  • 如何方便快捷地估算樣本量?師兄想講兩句
    樣本量取多少合適?樣本量是不是越大越好?臨床上並沒有那麼多的樣本怎麼辦?這些都是常見的臨床研究疑惑。而樣本量在計算的過程中涉及很多統計量、複雜的公式和專業的軟體,讓科研初學者望而卻步。今天,給大家分享一個簡單的樣本量計算工具,助力科研設計(網址:http://powerandsamplesize.com/),網站中還提供了公式講解和 R 語言代碼等有關信息。進入網站後,可以通過點擊紅框內按鈕直接進入樣本量計算界面:
  • 磕鹽大家說 | G*Power使用教程分享(上)
    樣本量(Sample Size):樣本量增加,兩個正態分布變得更「窄」,統計功效(Power)增大。4. 何時需要計算統計功效(Power)?P.S.一般為雙尾檢驗、α=0.05、Power=1-β=0.8(若被試量充足,Power達到0.95則更好),d=0.2為小效應,d=0.5為中效應,d=0.8為大效應,期望達到的效應量可以依據前人研究估計。
  • 參數估計之點估計和區間估計
    即根據樣本數據如何選擇統計量去推斷總體的分布或數字特徵等。統計推斷是數理統計研究的核心問題。所謂統計推斷是指根據樣本對總體分布或分布的數字特徵等作出合理的推斷。它是統計推斷的一種基本形式,分為點估計和區間估計兩部分。一、點估計點估計是依據樣本估計總體分布中所含的未知參數或未知參數的函數。
  • R與生物專題 | 第五十四講 R-樣本量及實驗效能計算
    在「R與生物統計專題」中,我們會從介紹R的基本知識展開到生物統計原理及其在R中的實現。
  • [理論+SPSS實戰] 點估計與區間估計詳細解析+把論文寫在抗擊疫情的第一線
    正文:點估計點估計(point estimation)是用樣本統計量來估計總體參數,因為樣本統計量為數軸上某一點值,估計的結果也以一個點的數值表示,所以稱為點估計。如利用樣本平均數作為總體平均數μ的估計數,用樣本方差直接作為總體方差的估計值。
  • IV-工具變量法:第一階段係數符號確定時的小樣本無偏估計
    傳統工具變量的統計推斷基於大樣本理論,即在給定工具變量和內生變量強相關關係情況下,樣本趨於無窮大時,2SLS 估計量是一致估計。而在弱工具變量情況下過度識別的模型係數偏誤很大。儘管過去有不少學者嘗試使用各種方法來解決這種偏誤,但是這些改進的估計量,在有限樣本或弱工具情況下仍然是有偏的。
  • 多組均值比較的樣本量估算
    分別對u1和u2、u2和u3、u1和u3進行兩樣本均值比較的樣本量估算,一定要注意α應是調整後的0.0167。還是以u1=8.25, u2=11.75, u3=13為例,通過咱們微信公眾平臺「實用工具-樣本量-兩組獨立樣本均值比較」可以知道:當u1=8.25, u2=11.75, α=0.0167, β=0.2時, 每組21例;當u2=11.75, u3=13, α=0.0167, β=0.2時, 每組165例;當u1=8.25, u3=13, α=0.0167,
  • [理論+spss實戰]假設檢驗——單樣本t檢驗
    解:(1)提出假設:H0:u=10g (機器性能良好)H1:u≠10g(機器性能不好)假設提出原則:H0是不能輕易否定的命題;H1是需要驗證的命題。因為機器的規格裝一袋食品重量10g,所以我們不能輕易否定這個命題,故假設H0為 u=10g (機器性能良好)。
  • 樣本量計算器,免費下載使用,手把手教你計算樣本量!
    >它絕對可靠,因為它嚴格按照樣本量計算公式進行計算的。而且,它還有已經撰寫好的文本模板,幫助你能夠快速地將樣本量計算依據寫在你的開題報告、項目申報書中!這個exce形式的小工具,便是浙江中醫藥大學公共衛生學院鄭老師團隊為零基礎者編寫的樣本量計算小工具---「浙中大樣本量計算器」。
  • 響應比(Response Ratio)、功效(power)、效應量(effect size)
    如下圖:文獻二:另一篇SBB,通過處理組和控制組的均值來計算響應比RR:方差計算為:nt和nc為處理組和控制組的樣本量,st和sc為處理組和控制組所有比較的標準差。在meta分析中,加權響應比(RR++)由單個RRij計算出來,給予精度更高(lower v)的估計更大的權重,從而提高了綜合估計的精度和檢驗的能力。m為分組數,ki是第i組的比較次數。
  • g_mmpbsa之簡單教程
    相對於自由能微擾(FEP)和熱力學積分(TI),雖然準確度相對較低,但其計算量相對較小,比較適用於生物大分子體系。是一種對MD軌跡進行後處理以估計結合自由能的方法, 計算時會將溶劑視為均勻的連續介質, 並基於力場和隱式的連續介質模型, 對平衡軌跡中的許多幀進行平均, 以考慮溫度的影響。其實該教程網上很多地方有,我之前也做過很多次,在這裡僅做簡單介紹,其實只是想引出後面的文章做一個系列。