G.Power教程 | 樣本量估計

2021-02-24 行上行下


Hello,

這裡是行上行下,我是喵君姐姐~

一入科研深似海,從此假期是路人。

網上正在熱論996,而大部分的科研人的工作時間可能是711。

每次和審稿人鬥智鬥勇,都感覺自己的頭髮少了很多,深刻體會到了「聰明絕頂」的深意。

而審稿人常問的一個問題是:

這個被試量太少了,我對所得到的結果的準確性感到擔憂~

看到這裡我們就慌了,怎麼辦?

解決方法有兩個

要麼補實驗數據;要麼讓審稿人信服你的被試量是足夠的,得到的結果是可靠的。

補數據相對而言比較麻煩,可能要重新做實驗,重新分析數據和畫圖。而且有的實驗因為現實原因,不能夠補數據了。

那麼,你可以採取另外一種辦法:

使用G.Power進行先驗分析,估計出所需要的樣本量,然後看看你的數據量能否大於估計的樣本量。

或者使用事後分析,說明你現目前的數據量可以達到什麼樣的效應量和統計功效水平,是足夠讓人信服的。

其實,這一步應該在實驗之前就應該進行。但是剛開始做實驗的小白都沒有做這一步的意識,所以只好事後亡羊補牢了。

那麼,今天就詳細講解一下,如何使用G.Power進行樣本量的估計?


來源:雪師妹

(點擊查看大圖,今天只詳解樣本量估計喲~)


其實G.Power的安裝和使用都十分簡單,只需要按照要求,點點點即可。當然,想要弄懂背後的統計學原理,還是需要花費一番功夫。

G*power軟體是由德國杜塞道夫大學幾位樂於分享知識的老師開發的,專門用於統計功效(包括樣本量)計算的免費統計軟體,在心理學領域有著很高的聲譽和認可度。

首先,在官網即可下載軟體,Windows和Mac版本均有。也可在後臺回復「G.power教程」免費獲得軟體及相關資料包。

網址:http://www.gpower.hhu.de/

來源:AffectiveNeuroscience-梁麗美

其次,打開文件夾,雙擊setup,進行安裝。安裝完成後,點擊桌面圖標,順利出現如下圖的主界面圖,即可安裝完成。

對於大多數的人來說,統計學概念都是十分抽象的,看著就頭疼。

然而,有一群可愛的科學家設計了一個有趣的網站,讓我們可以可視化的了解各個概念之間的關係。

網址:https://rpsychologist.com/d3/NHST/

首先,複習一下統計學基本概念,兩個假設以及兩類錯誤之間的關係。

研究假設(H0)與對立假設(H1)


來源:AffectiveNeuroscience-梁麗美

型錯誤(a)與Ⅱ型錯誤(β


其次,理清統計功效(power,1-β)與效應量(effect size,d)之間的關係。

再次,在假設檢驗中,統計模型既定的情況下,有四個參數:

alpha值(a)

效應量(effect size,d)

樣本量(sample size,N)

統計檢驗力(power,1-β)

當統計模型確定後(即使用的是t檢驗,ANOVA或其他檢驗方法),知道其中三個可以計算出第四個。(來源:劉嘉老師)

來源:AffectiveNeuroscience-梁麗美


最後,介紹常見的5種統計力分析(power analysis)的類型。

來源:AffectiveNeuroscience-梁麗美

G.Power的功能強大,即可以計算事後統計檢驗力(事後分析),也可以進行事前樣本量的估計(先驗分析)。

今天,著重講解一下,如何使用G.power進行各個統計方法的樣本量估計?

來源:曹振波老師

Tips: 

1. 新版的重複測量分析當中,組內相關係數為0.5,球形檢驗系統為1(均為默認數值),並且不用再除重複測量次數。

2. 除了進行樣本量的估計,也可查看X-Y plot 查看在現目前的樣本量之下,可以達到多大的統計功效(power,1-β)與效應量(effect size,d)。

今天從G.Power的介紹和安裝、統計基本概念的講解、各個統計方法的樣本量估計三個方面進行了G.power的講解。

但是,其實我們還需要很多的路需要走。

就像範妍老師所講的那樣:

隨著技術的革新,如何進行fMRI實驗樣本量的估計?

我們只採取單篇研究進行樣本量的估計是否可靠?

如何才能夠進行更加科學的樣本量估計?

科學無止境,只希望能夠在不斷的學習和發展當中,能夠越來越好。

今天,我也整理了G.power的相關資料,包括G.Power軟體、英文指導手冊、中文指導手冊及相關PPT、參考文獻資料等。後臺回復「G.Power使用教程」,即可獲得啦!

小夥伴們也可以在留言區將自己的審稿相關經驗分享一下,和大家互相交流哈~

分享完畢,希望有所幫助。

R語言安裝及入門

免費英文文獻下載攻略

2018年心理學乾貨|年刊

EEGLAB腦電數據預處理指導手冊

相關焦點

  • 檢驗功效(Power)與樣本量
    在樣本量n一定的情況下,α減小,β就會增大;β增大,α就會減小;要想同時減小α和β,只有增大樣本量n才行*。*因為增大樣本量會使得樣本均值的置信區間變窄,從而使得均值的正態分布曲線變得更窄。假設檢驗的功效(Power)受到以下三個因素的影響:樣本量:其他條件保持不變時,樣本量越大,功效越大。
  • 科普| 細節決定A/B測試的成敗:有底線的樣本量
    所以說確定你的實驗對於樣本量大小的需求是很重要的。然鵝,我在網上那些A/B測試入門教程裡少有看到對於樣本量估算的介紹,大量的A/B測試科普文章仍舊停留在介紹A/B測試怎麼怎麼厲害怎麼怎麼牛逼,要怎麼怎麼做怎麼怎麼注意(是的沒錯之前我們也是這樣的~233)。但就是不告訴你到底應該劃拉多少人來做。別慌。
  • 參數估計之點估計和區間估計
    即根據樣本數據如何選擇統計量去推斷總體的分布或數字特徵等。統計推斷是數理統計研究的核心問題。所謂統計推斷是指根據樣本對總體分布或分布的數字特徵等作出合理的推斷。它是統計推斷的一種基本形式,分為點估計和區間估計兩部分。一、點估計點估計是依據樣本估計總體分布中所含的未知參數或未知參數的函數。
  • [理論+SPSS實戰] 點估計與區間估計詳細解析+把論文寫在抗擊疫情的第一線
    正文:點估計點估計(point estimation)是用樣本統計量來估計總體參數,因為樣本統計量為數軸上某一點值,估計的結果也以一個點的數值表示,所以稱為點估計。如利用樣本平均數作為總體平均數μ的估計數,用樣本方差直接作為總體方差的估計值。
  • 實驗設計最小樣本量測算
    【測算公式】關於t檢驗樣本量的測算公式:    關於比率檢驗樣本量的測算公式
  • WGCNA-最短教程掌握高級分析
    我們比較了很多網絡上的教程,發現大多數文章都是翻版WGCNA官網中的分析流程去做,並沒有把WGCNA的精髓給講清楚。而且很多文章把整個分析流程講的異常繁瑣,讓很多同學看了就望而卻步。於是,我們決定在這篇文章中,通過一個簡化的步驟把WGCNA給大家徹底講透,讓大家上手就能做。本文代碼見文末,聯繫客服領取。
  • 樣本量是自變量的10倍?
    微信公眾號:醫學統計與R語言如果你覺得對你有幫助,歡迎轉發在非常多的中文文獻中關於多重線回歸分析的樣本量是這樣描述的
  • 觀察性療效比較研究的樣本量計算,研究實例及注意事項
    RCT研究中樣本量計算需要考慮的問題,在非隨機對照研究中同樣需要考慮,但一些參數的設定方法和計算方法與RCT設計可能有一些區別。下面的內容將著重介紹非隨機對照試驗設計中樣本量計算需要考慮的問題及處理方法。
  • 大樣本分析神器WGCNA正式上線!
    下面我們就一起來看下,究竟該如何利用WGCNA去找到那些與樣本及性狀最相關的基因,以及確定基因與基因之間的關聯關係。 WGCNA起手最關鍵的一步,就是要確定power值的大小。WGCNA會對基因間的相關性取β次冪進行冪函數處理。少量強相關性的關係不受影響或影響較少;相關性弱的關係取β次冪後,相關性下降明顯,那麼這個β值就是power值了。接著對相關關係進行無尺度化。
  • 醫學研究,樣本量計算結果到底給誰看的?
    專家需要看到你一項研究預估樣本量是多少!可能大多數人都說,專家需要,導師需要,是他們要看。。。。其實,樣本量是計算給自己看的!樣本量就是研究者對自身項目能否取得成功的預判。當你沒有樣本量計算過程,胡亂湊個整數10、30、50,那你對整個項目的預期結果根本無法預計。
  • R語言——通過bootstrap自抽樣量化統計估計量的不確定性
    這時候bootstrap就是一個很有用的替代方法,bootstrap本質就是對現有的樣本進行重複抽樣得到新樣本,以這種方法來模擬擴大樣本容量。bootstrap的適用範圍不僅限於線性回歸估計,任何統計學裡的估計量都可以通過bootstrap進行量化並且計算standard error標準誤。
  • 驚爆| 只要是樣本研究 p值不能少【連載5】
    (圖五、六)看圖可以得知,power越大,還有先驗機率越大的話,偽陽性的反機率就越小。可是當power 越小的時候,還有先驗機率越小的時候,偽陽性的反機率就越大。 圖五 圖六我做了一個表,列出研究假設的先驗機率,從最小排列到最大,可以看到在不同檢定強度之下,偽陽性的反機率是多少。(圖七)它可以高到近乎1.00。
  • 【原創】參數估計與假設檢驗(一)-- 參數估計之點估計
    例如,在前面文章中,已經分析了某個湖裡種類為「Bream」的魚類的寬度樣本數據,通過樣本數據的計算得知,Bream的寬度的樣本均值為15.18,樣本標準差為1.96。那麼,這裡的樣本均值15.18就可以作為整個湖中所有Bream魚的寬度均值的一個估計。
  • 談談樣本量選擇背後的科學道理
    作者:陳聆帙@NetEase電商設計中心總是說XX的樣本量就夠了,可是為什麼呢?如何決定樣本量,是一個老生常談的話題,也有很多相關文章。但是這個公式存在一個問題:我要是連總體方差(CV2)都能知道,還做個毛線調研。
  • 精益六西格瑪管理-技術人員最常使用的工具-假設檢驗效力及樣本量
    以此為基準,再通過控制樣本容量,也可以對發生第二類錯誤的概率進行控制。由於兩類錯誤造成的損失是不同類型的,其嚴重性也是不同的,因此不同的人可能會對兩類錯誤的概率做出不同的限制。但是,再確定樣本容量之前,必須對發生兩類錯誤所允許的概率做出明確規定。再假設檢驗中還常用到一個詞,檢出力(power of test)。他的定義就是1-β。其意義相當於「在備擇假設成立時不犯第二類錯誤」的概率。
  • 六西格瑪系列14-分析-點估計和區間估計
    用於估計未知參數的統計量稱為點估計量 ,簡稱點估計 ,或估計。在正態分布中 ,均值 μ、方差 σ2 、標準差 σ 等都被稱為總體的參數。實際問題中,這些參數都是未知的 ,常常需要選用適當的統計量作為未知參數的估計。
  • 因素分析的樣本量得多少
    作者:晃晃悠悠 審核:X 封面:自己想吧        樣本量就是樣本中所包含的單位的個數,即抽樣單位數。樣本量直接影響抽樣誤差、調查的費用、調查所需的時間、調查訪員的數量以及其他一些重要的現場操作的限制條件。樣本量過大,會造成人力、物力和財力的浪費;樣本量過小,會造成抽樣誤差增大,影響抽樣推斷的可靠程度。
  • Parametric g-formula方法在因果分析中的應用
    如果需要在不同處理措施之間做出正確選擇,則必須先要準確估計出不同處理條件下的可能結果。要做到這一點的最好方法是隨機對照實驗(RCT)。如果因為各種原因使RCT不可行,此時只能採用前瞻性隊列研究等觀察性研究方法。這類觀察性研究方法在用於因果關係研究時可能存在偏倚,而parametric g-formula方法可有效控制這些偏倚,特別是時依性混雜偏倚。