實驗設計最小樣本量測算

2021-02-21 許冀和止

【測算公式】

關於t檢驗樣本量的測算公式:

    

關於比率檢驗樣本量的測算公式:

     

【參數說明】

method:可選擇方法兩種’t檢驗』或者』比率檢驗』,默認』比率檢驗』;

x:對於t檢驗是總體,對於比率檢驗是比率, 默認0.5;

alpha:顯著性水平是在進行假設檢驗時事先確定一個可允許的作為判斷界限的小概率標準,可以理解為這次估算的誤差,通常取0.1,0.05,0.01,默認0.05;

beta:可以用於測算功效,功效power = 1-beta,也是第二類取偽錯誤,即測算結果是假但是被誤認為是真的可能性,默認0.2。

delta:即MDE,期望最終效果可以提升多少個點,默認0.01,即1pp。


【python 代碼】

def sample_size(method='比率檢驗',x=0.5,alpha=0.05,beta=0.2,delta=0.1):    from scipy.stats import norm    from numpy import mean    import pandas as pd    import numpy as np    import math    if method == 't檢驗':                x = x.values.tolist()        sample_size = math.ceil(2*((sum((x-mean(x))**2/(len(x)-1))*((norm.ppf(1-alpha/2)+norm.ppf(1-beta))**2))/(delta**2)))        print('t檢驗單組樣本量:',sample_size)    elif method == '比率檢驗':                sample_size = math.ceil(2*((x*(1-x)*((norm.ppf(1-alpha/2)+norm.ppf(1-beta))**2))/(delta**2)))        print('比率檢驗單組樣本量:',sample_size)    else:        print('抱歉,目前沒有這個檢驗方法的測算(*╹▽╹*)')

相關焦點

  • G.Power教程 | 樣本量估計
    而審稿人常問的一個問題是:這個被試量太少了,我對所得到的結果的準確性感到擔憂~看到這裡我們就慌了,怎麼辦?解決方法有兩個:要麼補實驗數據;要麼讓審稿人信服你的被試量是足夠的,得到的結果是可靠的。補數據相對而言比較麻煩,可能要重新做實驗,重新分析數據和畫圖。而且有的實驗因為現實原因,不能夠補數據了。那麼,你可以採取另外一種辦法:使用G.Power進行先驗分析,估計出所需要的樣本量,然後看看你的數據量能否大於估計的樣本量。
  • 城鎮居民人均日生活汙水汙染物產生量如何測算
    但國內外關於城鎮居民人均日生活汙水汙染物產生量的相關研究不足,國內現有各種規範標準和文獻中引用的人均日生活汙水汙染物產生量數據多數借鑑外國經驗值,難以真實表徵我國城鎮居民日常生活排汙情況。中國市政工程華北設計研究總院有限公司孫永利等構建了城鎮居民生活汙水汙染物產生量測算方法,並設計研發了成套測算裝備。
  • 精益六西格瑪管理-技術人員最常使用的工具-假設檢驗效力及樣本量
    以此為基準,再通過控制樣本容量,也可以對發生第二類錯誤的概率進行控制。由於兩類錯誤造成的損失是不同類型的,其嚴重性也是不同的,因此不同的人可能會對兩類錯誤的概率做出不同的限制。但是,再確定樣本容量之前,必須對發生兩類錯誤所允許的概率做出明確規定。再假設檢驗中還常用到一個詞,檢出力(power of test)。他的定義就是1-β。其意義相當於「在備擇假設成立時不犯第二類錯誤」的概率。
  • 醫學寫作中實驗設計常見問題及分析
    一般來說,一個完整的研究設計,其基本內容通常包括研究的目的、意義、研究對象、研究內容與方法,還包括研究進度及其預期結果等。統計設計是整個研究中最重要的一環,是研究工作應遵循的依據。實驗設計要遵循隨機、對照、重複和均衡四原則。
  • 科普| 細節決定A/B測試的成敗:有底線的樣本量
    他不知道該怎麼辦:是因為效果看似達到了於是停止實驗?還是因為檢驗不達標而做其他的補救措施?針對A先生的問題,我們進行了一系列分析,最後確定了癥結所在:樣本量不足。A先生的實驗實際上需要至少1500人,但是目前只有1000人進入實驗,也就是說樣本量的缺口達到了500。若想解決這個問題,只要繼續讓流量進入實驗,達到最低需要的樣本量,即可。
  • 醫學研究中常見的實驗設計類型
    一般來說,實驗設計的類型,依按分類標準的不同而不同。醫學研究中,常見的實驗設計類型是按研究對象分組情況進行分類的,主要分為:完全隨機設計、配對設計、隨機區組設計、重複測量設計和析因設計等。下面,藍譯編譯就這些實驗設計類型做簡要說明。
  • 因素分析的樣本量得多少
    作者:晃晃悠悠 審核:X 封面:自己想吧        樣本量就是樣本中所包含的單位的個數,即抽樣單位數。樣本量直接影響抽樣誤差、調查的費用、調查所需的時間、調查訪員的數量以及其他一些重要的現場操作的限制條件。樣本量過大,會造成人力、物力和財力的浪費;樣本量過小,會造成抽樣誤差增大,影響抽樣推斷的可靠程度。
  • 檢驗功效(Power)與樣本量
    在樣本量n一定的情況下,α減小,β就會增大;β增大,α就會減小;要想同時減小α和β,只有增大樣本量n才行*。*因為增大樣本量會使得樣本均值的置信區間變窄,從而使得均值的正態分布曲線變得更窄。假設檢驗的功效(Power)受到以下三個因素的影響:樣本量:其他條件保持不變時,樣本量越大,功效越大。
  • 城鎮居民人均日生活汙水汙染物產生量測算之產汙規律
    【能源人都在看,點擊右上角加'關注'】北極星水處理網訊:該文是中國市政工程華北設計研究總院有限公司孫永利團隊關於城鎮居民人均日生活汙水汙染物產生量系列研究之二,將發表在《中國給水排水》2020年3月第6期,作者:孫永利、張維、鄭興燦、高晨晨、
  • 談談樣本量選擇背後的科學道理
    作者:陳聆帙@NetEase電商設計中心總是說XX的樣本量就夠了,可是為什麼呢?如何決定樣本量,是一個老生常談的話題,也有很多相關文章。由於總體差異越大,需要的樣本量就越大。我們面對任何總體的時候,都可以假設「這是一個差異性最大的總體」,來計算我們所需要的樣本量。因此,把p=0.5代入,就簡化出了一個可以供我們輕鬆計算樣本量的公式。如果想看到總體不同差異所對應的樣本量,前人還總結了這樣一個表:
  • 觀察性療效比較研究的樣本量計算,研究實例及注意事項
    RCT研究中樣本量計算需要考慮的問題,在非隨機對照研究中同樣需要考慮,但一些參數的設定方法和計算方法與RCT設計可能有一些區別。下面的內容將著重介紹非隨機對照試驗設計中樣本量計算需要考慮的問題及處理方法。
  • 推薦算法改版前的AB測試 | 實驗設計
    實驗流程三、實驗設計1. 假設檢驗的基本概念統計假設:是對總體參數(包括總體均值μ等)的具體數值所作的陳述。實驗原理說明先認定原假設成立,然後在事先給定的顯著性水平下,構造一個小概率事件,根據抽樣結果觀察小概率事件是否發生;若小概率事件發生,則拒絕原假設,否則接受原假設。3. 實驗流程設計1) 提出假設本次AB測試,目的是希望提升猜你喜歡功能的推薦效果。所以選取推薦系統的準確率,作為優化指標。
  • 樣本量n>30時,還能繼續使用T檢驗嗎?
    我的意見很簡單:只要是兩個樣本平均數的差異性檢驗,假定總體正態,不管樣本容量是否大於30,就直接使用t檢驗,而不用費心地想是採用t檢驗還是採用z檢驗。這大概也叫做「認知經濟論」吧!兩個樣本平均數的差異性檢驗,實際上是針對樣本平均數差異量的分布來展開的。
  • 醫學研究,樣本量計算結果到底給誰看的?
    專家需要看到你一項研究預估樣本量是多少!可能大多數人都說,專家需要,導師需要,是他們要看。。。。其實,樣本量是計算給自己看的!樣本量就是研究者對自身項目能否取得成功的預判。當你沒有樣本量計算過程,胡亂湊個整數10、30、50,那你對整個項目的預期結果根本無法預計。
  • 日常運營中,如何做好AB實驗?
    進行AB實驗能夠有利於優化用戶體驗,提升漏鬥或者單個節點的轉化率,從而使得產品的最終效果變得越來越好。那麼該怎麼去進行測試呢?如何才能保證測試的數據有效性,在最短的時間內測試出來結果,以便後期能夠更好地進行調整。小步快跑,關鍵是步子要小,結果要快,後期才能更好地運用在運營過程中。
  • 57款小工具神速解決繁瑣算量步驟,附測算表
    科學單位換算器   今天學霸就搞來了一份「寶貝」,57個工程常用的算量小工具。包含鋼管理論重量及刷油保溫、C型鋼檁條計算、單位換算器、給排水計算、混凝土配比、土方計算等工程人日常用的算量小工具,無需下載點開即用,減少算量浪費的時間,大大提高了造價的工作效率,告別熬夜加班!  檁條計算程序
  • 人類微生物組研究設計、樣本採集和生物信息分析指南
    然後,我們討論了研究設計方案、樣本量計算方法以及提高研究可靠性的方法。我們特別強調了陽性和陰性對照的重要性。接下來,我們討論了微生物組研究中常用的統計分析方法,重點關注多重比較的問題以及組間β多樣性分析的方法。最後,我們介紹了生物信息學分析的具體流程。總之,嚴謹的研究設計是獲得有意義結果的關鍵步驟,而適當的統計方法對於準確解釋微生物組數據很重要。
  • 實驗的設計 科學研究的方法(三)
    傳統的研究設計是一份詳細的工作計劃:選擇可以測量的變量,決定所需的樣本大小,數據的收集(實驗設計)、統計分析,以及結論。研究設計是為了保證研究程序是妥適的,可以得到確實的(valid)、客觀的(objective)、精確的(accurate)關於所研究的問題的答案。
  • 陳丹琦提出小樣本微調方法,比普通微調提升11%
    本文研究了一個更符合實際場景的小樣本學習問題:1)可以在普通硬體資源上訪問中等大小的語言模型(如RoBERTa);2)可以通過少量樣本進行微調。其實,自BERT等預訓練語言模型誕生以來,本身就降低了對大規模標註數據量的需求;此外,獲得少量的標註樣本(比如每個類別16個樣本),對我們也是很容易的。
  • 代謝組學在醫學領域機制研究的實驗設計方案
    小鹿特地總結了代謝組學在醫藥領域的主要應用方向(機制研究、標誌物篩選和藥效評價)及其對應的實驗設計思路(見下圖)。看完這個設計方案是不是眼前一亮那小鹿就先跟您說一說,醫學代謝組學中的機制研究最熱門的技術方式吧~~案例一多組學聯合:基因組、轉錄組、蛋白組、代謝組、單細胞測序