今天欣欣老師要帶大家複習一遍抽樣估計和假設檢驗,同學們都來一起快速複習一遍吧!
抽樣估計包括抽樣方法、數據形態、中心極限定理、評判標準、區間估計、偏差等概念。假設檢驗包括定義假設、檢驗統計量、顯著性、拒絕域、P值、一類和二類錯誤等概念。
戳我查看大圖▼
戳我查看大圖▼
抽樣方法有直接抽樣和分層抽樣。
戳我查看大圖▼
抽樣的數據類型有:
1)時間序列數據,它指的是同一公司不同時間;
2)橫截面數據指不同公司同一時間;
3)縱向數據指一段時間內同一整體的多元特徵;
4)面板數據指一段時間內不同整體的某一特徵,它是時間序列數據和橫截面數據的結合。
戳我查看大圖▼
中心極限定理是當總體分布未知的情況下,只要樣本容量足夠大,即N≥30的時候,樣本均值的分布是服從於正態分布的。
樣本的均值等於總體的均值,樣本均值的方差等於總體均值方差除以樣本的容量。
戳我查看大圖▼
估計量的好壞有評判標準,首先Unbiasedness是無偏的;其次Efficiency即有效的,指的是所有無偏估計量中離散程度最小的;Consistency隨著樣本容量的增加,參數精確性也增加。
戳我查看大圖▼
點估計分別用方差和標準差計算出來的值對應的是不同的分布。方差已知是Z分布,方差未知是T分布。非正態總體小樣本是不可估的,當N≥30的時候,T分布是近似於Z分布的。
在查表的時候,查的是二分之一的α,就是顯著性水平要除以二,然後再去查表得到這樣一個Z值或者T值。
戳我查看大圖▼
在估計的過程中可能存在偏差,有數據過分挖掘的偏差,樣本選擇的偏差,存活偏差,前視偏差以及跟時間相關的偏差。
戳我查看大圖▼
假設檢驗一般分幾步走:
第一步作出假設;
第二步計算檢驗統計量;
第三步確定顯著性水平,畫分布、畫出拒絕域;
第四步作出判斷,得到結論。
戳我查看大圖▼
提出假設有原假設和備擇假設,含有等號的以及想要拒絕的放在原假設,備擇假設就是原假設的對立面。
備擇假設有助於我們來判斷是單尾還是雙尾的檢驗,備擇假設不等號對應的是雙尾的;備擇假設中是小於或者大於號的,對應的是單尾的。
備擇假設也可以幫助我們來判斷拒絕域到底是在哪一邊尾巴。備擇假設是不等號,拒絕域是左右兩邊尾巴;備擇假設是大於號,拒絕域是在右邊尾巴;備擇假設是小於號對應的拒絕域是左邊的尾巴。
戳我查看大圖▼
檢驗統計量時我們檢驗均值是否等於μ0的假設檢驗,公式中的分母就是樣本均值的標準誤。
戳我查看大圖▼
在給定的顯著性水平下,我們畫分布來確定拒絕域。確定分布跟上面提到的確定分布的方法是一致的,方差已知Z分布,方差未知T分布。非正態總體小樣本不可估,當N≥0的時候,T分布是近似於Z分布的。
在已知的顯著性水平下,我們查表要注意查的是對應的單雙尾問題,即查的是α還是查二分之一的α,得到critical關鍵值,也就是拒絕的那個點。
然後看一下檢驗統計量是落在了拒絕域裡還是拒絕域外。落在拒絕域裡,我們拒絕原假設;落在拒絕域外,我們不能夠拒絕原假設。
戳我查看大圖▼
P值是最小的顯著性水平,在這樣一個顯著性水平下,原假設能夠被拒絕,他等於1類錯誤發生的概率。對於P值,我們記住P越小越拒絕!
P-value大於significance level時,不可以拒絕原假設;P-value小於significance level時,拒絕原假設。
戳我查看大圖▼
一類錯誤是去真,即原假設為真,但是我們把原假設拒絕了。二類錯誤是存偽,就是原假設是false,但是我們沒有成功地把原假設拒絕。
當樣本容量N不變的時候,一類錯誤和二類錯誤發生的概率是此消彼長的;當N樣本容量增加的時候,一類錯誤和二類錯誤同時下降。
戳我查看大圖▼
power of test指的是假設檢驗的是。假設檢驗的是等於1減去2類錯誤發生的概率。假設檢驗的是對應的是原假設是false,同時成功地把原假設拒絕了。
通過框架複習的方法同學們都掌握了嗎?每天跟著欣欣老師用框架複習知識點,讓學習更加有效率,記憶更加清晰簡單!