CFA一級框架:抽樣估計和假設檢驗都是些什麼?

2021-02-23 BT特許金融分析師

今天欣欣老師要帶大家複習一遍抽樣估計和假設檢驗,同學們都來一起快速複習一遍吧!

抽樣估計包括抽樣方法、數據形態、中心極限定理、評判標準、區間估計、偏差等概念。假設檢驗包括定義假設、檢驗統計量、顯著性、拒絕域、P值、一類和二類錯誤等概念。

戳我查看大圖▼

戳我查看大圖▼

抽樣方法有直接抽樣分層抽樣

戳我查看大圖▼

抽樣的數據類型有:

1)時間序列數據,它指的是同一公司不同時間;

2)橫截面數據指不同公司同一時間;

3)縱向數據指一段時間內同一整體的多元特徵;

4)面板數據指一段時間內不同整體的某一特徵,它是時間序列數據和橫截面數據的結合。

戳我查看大圖▼ 


中心極限定理是當總體分布未知的情況下,只要樣本容量足夠大,即N≥30的時候,樣本均值的分布是服從於正態分布的。

樣本的均值等於總體的均值,樣本均值的方差等於總體均值方差除以樣本的容量。

戳我查看大圖▼

估計量的好壞有評判標準,首先Unbiasedness是無偏的;其次Efficiency即有效的,指的是所有無偏估計量中離散程度最小的;Consistency隨著樣本容量的增加,參數精確性也增加。

戳我查看大圖▼

點估計分別用方差和標準差計算出來的值對應的是不同的分布。方差已知是Z分布,方差未知是T分布。非正態總體小樣本是不可估的,當N≥30的時候,T分布是近似於Z分布的。

在查表的時候,查的是二分之一的α,就是顯著性水平要除以二,然後再去查表得到這樣一個Z值或者T值。

戳我查看大圖▼

在估計的過程中可能存在偏差,有數據過分挖掘的偏差,樣本選擇的偏差,存活偏差,前視偏差以及跟時間相關的偏差。

戳我查看大圖▼

假設檢驗一般分幾步走:

第一步作出假設;

第二步計算檢驗統計量;

第三步確定顯著性水平,畫分布、畫出拒絕域;

第四步作出判斷,得到結論。

 戳我查看大圖▼

提出假設有原假設備擇假設,含有等號的以及想要拒絕的放在原假設,備擇假設就是原假設的對立面。

備擇假設有助於我們來判斷是單尾還是雙尾的檢驗,備擇假設不等號對應的是雙尾的;備擇假設中是小於或者大於號的,對應的是單尾的。

備擇假設也可以幫助我們來判斷拒絕域到底是在哪一邊尾巴。備擇假設是不等號,拒絕域是左右兩邊尾巴;備擇假設是大於號,拒絕域是在右邊尾巴;備擇假設是小於號對應的拒絕域是左邊的尾巴。

 戳我查看大圖▼


檢驗統計量時我們檢驗均值是否等於μ0的假設檢驗,公式中的分母就是樣本均值的標準誤。

戳我查看大圖▼

在給定的顯著性水平下,我們畫分布來確定拒絕域。確定分布跟上面提到的確定分布的方法是一致的,方差已知Z分布,方差未知T分布。非正態總體小樣本不可估,當N≥0的時候,T分布是近似於Z分布的。

在已知的顯著性水平下,我們查表要注意查的是對應的單雙尾問題,即查的是α還是查二分之一的α,得到critical關鍵值,也就是拒絕的那個點。

然後看一下檢驗統計量是落在了拒絕域裡還是拒絕域外。落在拒絕域裡,我們拒絕原假設;落在拒絕域外,我們不能夠拒絕原假設。

 戳我查看大圖▼


P值是最小的顯著性水平,在這樣一個顯著性水平下,原假設能夠被拒絕,他等於1類錯誤發生的概率。對於P值,我們記住P越小越拒絕

P-value大於significance level時,不可以拒絕原假設;P-value小於significance level時,拒絕原假設。

 戳我查看大圖▼


一類錯誤是去真,即原假設為真,但是我們把原假設拒絕了。二類錯誤是存偽,就是原假設是false,但是我們沒有成功地把原假設拒絕。

當樣本容量N不變的時候,一類錯誤和二類錯誤發生的概率是此消彼長的;當N樣本容量增加的時候,一類錯誤和二類錯誤同時下降

戳我查看大圖▼

power of test指的是假設檢驗的是。假設檢驗的是等於1減去2類錯誤發生的概率。假設檢驗的是對應的是原假設是false,同時成功地把原假設拒絕了。

通過框架複習的方法同學們都掌握了嗎?每天跟著欣欣老師用框架複習知識點,讓學習更加有效率,記憶更加清晰簡單!

相關焦點

  • 必考知識點,CFA一級數量分析-抽樣與估計
    下一篇文章,我們將會進行假設檢驗的講解。這篇文章主要的內容為抽樣和估計,通過從總體中抽取樣本獲得樣本統計量進行分析,從而反推總體的參數,對其進行估計。引言現實生活中,特別是在金融領域,我們每分每秒都在形成大量的交易數據。我們如何通過這麼多的數據來評判整個全球市場的運行情況呢?近期頻上熱門的「熔斷」想必大家都聽說過吧。
  • 你真的了解參數估計和假設檢驗嗎?
    對於第一種說法,相當於上述的點估計。第二種,相當於區間估計,就是給定一個區間,這個區間包含真值。統計學中對區間估計的定義:在點估計的基礎之上,給出總體參數估計的一個區間範圍,該區間通常由樣本統計量加減估計誤差得到。問題:獲取一個抽樣樣本後,如何確定置信區間和置信度?要確定置信區間和置信度,就需要知道樣本和總體,在分布上有怎樣的聯繫。中心極限定理給出了這個問題很好的回答。
  • [理論+spss實戰]假設檢驗——單樣本t檢驗
    ] 點估計與區間估計詳細解析+把論文寫在抗擊疫情的第一線》假設檢驗的基本思想是小概率反證法思想。反證法思想是先提出假設(檢驗假設H0),再用適當的統計方法確定假設成立的可能性大小,如可能性小(即最後計算出P值小於0.05),則認為假設不成立。 假設檢驗其實就是驗證你事先提出的假設是落在了置信區間內部,還是落在了置信區間外部(稱為:拒絕域)。如圖,若落在了拒絕區域內(陰影部分),則拒絕H0,此時P<0.05。
  • 高頓CFA:CFA一級相當於什麼水平?
    CFA一級相當於什麼水平   CFA考試總共三個級別,需要從一級開始考,有同學在剛接觸CFA時會諮詢「CFA一級相當於什麼水平?CFA一級考了有用嗎?」之類的問題。   高頓君今天給大家詳細講解CFA一級相當於什麼水平相關問題。
  • 假設檢驗、Z檢驗與T檢驗
    概述假設檢驗是統計學、分析學和數據科學中的一個關鍵概念了解假設檢驗的工作原理、Z檢驗和t檢驗之間的區別以及其他統計概念介紹冠狀病毒大流行使我們大家都成了一個統計學家。我們不斷地核對數字,對大流行將如何發展做出自己的假設,並對何時出現「高峰」提出假設。
  • CFA一級相當於什麼水平?有什麼用?
    CFA一級相當於什麼水平CFA考試總共三個級別,需要從一級開始考,有同學在剛接觸CFA時會諮詢「CFA一級相當於什麼水平?CFA一級考了有用嗎?」之類的問題。高頓君今天給大家詳細講解CFA一級相當於什麼水平相關問題。
  • 理論與實務學習:專業假設檢驗
    一、假設檢驗的涵義及目的  假設檢驗是抽樣推斷的一項重要內容,是利用樣本的實際資料來檢驗事先對總體某些數量特徵所作的假設是否可信的一種統計方法。因此,凡屬於研究總體的數量變化是否按照我們預期的規律性要求的問題都屬於統計假設檢驗的討論範圍。
  • 案例實戰 | Python 玩轉 AB 測試中的分層抽樣與假設檢驗!(附代碼和數據集)
    儘管如此,裡面還是有許多值得學習和注意的地方。假設檢驗我們將從控制組和實驗組中各抽取一定數量的樣本來進行假設檢驗,下面是置信水平 α 的選擇經驗:為了使假設檢驗的數據樣本更加合理,我們可以使用分層抽樣。Python 沒有現成的庫或函數,可以使用前人的輪子。
  • 搞定統計學必知:P值、T檢驗、卡方檢驗、假設檢驗……
    t檢驗適用於兩個變量均數間的差異檢驗,多於兩個變量間的均數比較要用方差分析。無論哪種類型的t檢驗,都必須在滿足特定的前提條件下: 正態性和方差齊性,應用才是合理的。在這個前提下,假設檢驗按下列步驟進行:確定假設進行抽樣,得到一定的數據根據假設條件下,構造檢驗統計量,並根據抽樣得到的數據計算檢驗統計量在這次抽樣中的具體值依據所構造的檢驗統計量的抽樣分布,和給定的顯著性水平,確定拒絕域及其臨界值比較這次抽樣中檢驗統計量的值與臨界值的大小,如果檢驗統計量的值在拒絕域內
  • 【實例】Excel數據分析之假設檢驗中的t-檢驗應用
    當一些樣本均數與已知的總體均數有很大的差別時,一般來說有兩點主要原因:一是抽樣誤差的偶然性,二是樣本來自不同的總體,而使試驗因素不同。這個時候,我們運用假設檢驗方法就能夠排除誤差的影響,區分差別在統計上是否成立,並了解誤差時間發生的概率。
  • cfa一級備考攻略,考完cfa一級能幹什麼
    關於cfa要複習多長時間,其實因人而異,cfa官方推薦學習時間是300小時,大部分通過人也基本是在300小時左右。也有學霸表示他們一級複習了兩周就去考了,如果有基礎的話,cfa一級200個小時左右應該沒問題。cfa二級、三級也差不多300個小時左右。
  • 顯著性檢驗、假設檢驗和原假設顯著性檢驗
    在Fisher那裡,p值是一次實驗中,從假設總體中獲得觀測樣本或更極端樣本的可能性,越小,越可能懷疑假設的正確性,並且要結合其他先驗知識才能做出最後的決策。NP體系適用於重複抽樣,其所有概念都是基於重複抽樣的頻率定義,不適用於一次實驗。NP體系中α是人為設定好的,通常設定α= 0.05,它表示H0為真的總體中重複100次實驗,會有5次實驗被錯誤拒絕。
  • 檢驗批容量和最小抽樣數量的規定,秒懂!
    GB50300-2013:檢驗批容量和最小抽樣數量的規定檢驗批劃分完成後需要確定檢驗批容量,檢驗批容量是由數值與單位組成的,根據施工習慣
  • 學好統計學與計量經濟學假設檢驗縱貫線
    下面對其中的一些關鍵問題做一簡要的規律性總結:假設檢驗存在的必要性是什麼;假設檢驗為何有雙側、單側之分;假設檢驗為何有0.1%、1% 和 5% 三種顯著水平;客觀事物平均水平、離散水平的假設檢驗如何設置雙側和單側;計量經濟學中 t分布、卡方分布與 F 分布如何設置假設檢驗的雙側和單側。
  • CFA一級考試重難點竟然有這麼多!
    CFA一級考試為CFA三個級別考試的初始階段,每年舉行兩次CFA一級考試;cfa一級考試有很多科目內容,很多考生不知道該從何備考。高頓君給大家總結了cfa一級考試的重難點及學習順序,可供參考:   CFA一級考試有很多重難點,知識點的重要程度意味著備考的學習順序。
  • 假設檢驗的前世今生
    現行的假設檢驗,叫原假設顯著性檢驗( Null Hypothesis Significance Testing,NHST)。其基本思路和框架在現行的統計教材中論述較多,在此僅簡要概括:建立假設,確定檢驗水平。
  • AQL、LTPD以及「零缺陷」三種抽樣檢驗的比較
    一次抽樣方案包括三個表徵參數:樣本量n、接收數Ac和拒收數Re,簡記為(n︱Ac,Re)。典型的一次抽樣檢驗方案如圖1所示。圖1 一次抽樣方案示意圖假設產品批量為N,採用抽樣方案(n︱Ac,Re)進行抽樣檢驗,隨機變量X表示樣本中包含不合格品數,Pa(p)表示當批不合格率為p時抽樣方案的接收概率,則有:
  • 對假設檢驗中的一些問題的思考
    可我也不敢貿然地判斷此時整批(總體)的不合格品率就一定大於1%呀,因為哪怕總體的不合格品率是小於1%的,在一次抽樣中也有可能出現樣本的不合格品率是大於1%的。這可怎麼辦呢?這時候只好求助於假設檢驗了。假設檢驗實際上是評估當總體的不合格品率不超過1%時,出現樣本的不合格品率大於1%的可能性,然後根據可能性來判斷這到底正常不正常。現在樣品的不合格品率達到了2.4%,通常大家的第一反應應該是什麼呢?
  • 數據分析必備統計學(二):假設檢驗
    假設我有一袋豆子,袋子裡有紅豆,也有黑豆,我想知道紅豆和黑豆是不是一樣多。若是一個個去看怕是要瘋了。於是偷個懶,從袋子裡拿了一把豆子,看看這把紅豆多還是黑豆多。用這把豆子作為樣本,去推斷這袋豆子。既然是用樣本推斷總體,就有抽樣誤差的可能性。不管袋子裡紅豆多還是黑豆多,這一把不一定能真實反映這袋豆子,那怎麼辦呢?這就要用到假設檢驗了。
  • 假設檢驗的基本步驟
    假設檢驗的基本步驟  假設檢驗的基本思想是:根據所獲樣本,運用統計分析方法,對總體X的某種假設 做出接受或拒絕的判斷。在這裡,備擇假設還可能有兩種設置形式,它們是:  : <1.40或 : >1.40  備擇假設的不同將會影響下面拒絕域的形式,今後稱  對 的檢驗問題是雙側假設檢驗問題  對 的檢驗問題是單側假設檢驗問題  對 的檢驗問題也是單側假設檢驗問題  註:若假設是關於總體參數的某個命題