必考知識點,CFA一級數量分析-抽樣與估計

2020-12-09 從CFA到量化

一種有效學習的方式,就是把你學得的東西再分享給別人。

文:藍兔子讀難NOTES

圖: 配圖 來源於網絡

編碼:0009

[Quantitative Methods]

[Sampling and estimation]

數學作為一種工具,應用在金融領域,一般用於對目標資產進行估計和預測,從而協助投資者進行買入和賣出決策。正如我們前面所說,統計學分為描述性統計學和推斷性統計學。描述性統計學通過一些統計量來描述數據的特徵,如我們一般用均值來代表收益,用方差來代表風險。而推斷性統計學在描述性統計學的基礎上,利用描述性統計學得出的結論(通常是對樣本的描述),來推斷總體參數。

在前面數理統計基礎那一篇文章中,我們所講的內容主要就是描述性統計學的內容。而這篇文章,我們就進入了推斷性統計學的內容。下一篇文章,我們將會進行假設檢驗的講解。這篇文章主要的內容為抽樣和估計,通過從總體中抽取樣本獲得樣本統計量進行分析,從而反推總體的參數,對其進行估計。

引言

現實生活中,特別是在金融領域,我們每分每秒都在形成大量的交易數據。我們如何通過這麼多的數據來評判整個全球市場的運行情況呢?近期頻上熱門的「熔斷」想必大家都聽說過吧。實不相瞞,某隻股票熔斷見識過,而交易所熔斷,還真是孤陋寡聞第一次呢。

不過話說回來,某一隻具體的股票熔斷標準很好制定,漲跌幅定個值就行,那整個交易所的熔斷要怎麼制定呢?這就有點採樣和估計的感覺了,我們先從該交易所的股票中選幾隻股票出來,對其進行分析,再用分析得出的樣本統計量來評判整個股票市場的運行情況。如果抽樣估計結果達到了熔斷標準,那麼不管每一個具體股票的情況如何,都piaji,整個交易所都得熔斷。

實際上,目前美股熔斷是以標普500指數為準,熔斷閾值分為三級:一級市場熔斷,下跌達到7%;二級市場熔斷,下跌達到13%;三級市場熔斷,下跌達到20%。下跌是以指數點位相對於前一日收盤點位的下跌幅度為準[1]。下面回到正題,我們來看看CFA一級的推斷性統計學採樣和估計相關的內容。

術語與概念

採樣(sampling):從總體中抽取樣本的過程。之所以要抽取樣本而不是直接對總體進行估計,因為有時候總體可能非常大,根本不可能實施,或者實施起來的時間、人力和財力成本不划算。在描述性統計學那篇文章中,我們說過,用於描述總體特徵的統計量我們叫做參數,而用於描述樣本特徵的數據我們叫做樣本統計量從總體中獲得樣本的過程叫做抽樣,而從樣本統計量推斷總體參數的過程叫做估計

抽樣是一個非常關鍵的過程,如果一開始抽樣都有問題,後面做得再好也是白搭。在實際抽樣中,我們最常見的抽樣方法有兩種:

簡單隨機抽樣(simple random sampling):如其名字一般簡單,沒有任何套路,每一個個體被抽到的概率相等;分層隨機抽樣(stratified random sampling):分成兩步,第一步先將被抽樣的總體分層,第二步再在每一層進行簡單隨機抽樣。樣本抽出來以後,我們還要對樣本進行評估,因為無論我們如何抽,由於抽出的結果都不是原總體,所以總和原總體存在誤差。在對樣本進行評估時,我們考慮兩個概念:

抽樣誤差(sampling error):如上文所說,無論如何抽,樣本始終都不是原總體,所以同原總體存在差別,由樣本得出的樣本統計量和總體參數之間的差別就是抽樣誤差。抽樣分布(sampling distribution):抽樣過程會抽出什麼樣的一個樣本是不確定的,抽一次樣就相當於拋一次骰子,結果是一個隨機變量,隨機變量存在一個分布。例如拋骰子就是一個結果為1-6,且每個結果出現概率相等的離散均勻分布。數據類型,所謂數據類型,和程式設計師大哥的什麼整型和浮點型是不一樣的,這裡的數據類型有兩種:

時間序列(time-series):也可以理解為縱向數據,是同一個對象在時間線上的數據,比如華夏五千年,中國的經濟發展變化。截面序列(cross-sectional):橫向數據,多個對象在同一時間的數據,比如2020年2月22日這天,全球各國的新型冠狀病毒感染人數。

抽樣

前面介紹了相關的術語和概念,這裡進一步來講抽樣的問題。在進行抽樣時,有一個非常關鍵的參數需要考慮,那就是樣本容量(sample size)。雖然我們之前一直在說樣本容量,但是樣本容量該如何確認呢,樣本容量是否越大越好呢?顯然不是的,樣本容量的選擇要結合實際情況,大樣本能獲得更接近總體參數的樣本統計量,但其耗費的成本也會上升。

在抽樣時,還需要注意以下幾個問題:

數據挖掘偏差(data-mining bias):有道是林子大了什麼鳥都有,數據挖掘偏差指的就是對歷史數據過分挖掘,找出了一些看似有影響,實則沒什麼意義的數據。樣本選擇偏差(sample selection bias):這個好理解,抽樣都沒選對對象。為什麼淘寶賣降落傘的沒有差評呢?沒有差評說明他們的降落傘質量好嗎?通過抽取購買者的評論,能認定客戶都滿意嗎?不能吧!這就是倖存者偏差(survivorship bias),後面還會經常出現的一個詞。前視偏差(look-ahead bias):你要調查某個公司5月的表現,你依靠財報來進行,然後他們的財報要6月才出,這種尷尬就叫做前視偏差。時間段偏差(time-period bias):典型的部分不代表總體的情況,你不能拿第二次世界大戰時全球的經濟增長來代表人類近代的經濟增長。接下來,我們說一個非常重要的定理:中心極限定理(central limit theorem)。之前說過,我們在進行抽樣時,抽樣的結果是一個隨機變量,它服從一定的分布。具體是什麼樣的一個分布呢,中心極限定理進行了解釋:對任意一個總體進行簡單隨機抽樣,如果樣本容量足夠大(30個以上),抽樣的樣本均值服從正態分布。具體的來講,如果總體的均值和方差已知,分別為

,且簡單隨機抽樣的樣本容量大於30,則有其樣本服從正態分布,且正態分布的抽樣分布均值等於

,樣本方差等於

/n,其中n為樣本容量。

上圖來源於簡書[2]

估計

說完抽樣,下面來說估計。估計分為兩種,一種是點估計(point estimate),一種是區間估計(confidence interval estimate)

所謂點估計,我們估計的結果是一個點,最常見的就是利用樣本的平均值來估計總體的平均值。比如抽取某一個班同學的平均身高來代表全校同學的平均身高。

在進行估計時,我們期望儘可能的利用樣本去準確的估計總體,這就有了估計量的三個理想特徵:

無偏性(unbiasedness):理想估計量,以均值為例,樣本均值的期望值應該等於總體均值;有效性(efficiency):在無偏的基礎上,可能有多個滿足的統計量,應該選擇樣本方差最小的那一個;一致性(consistency):隨著樣本容量的增加,樣本統計量應該也越來越接近總體參數。

所謂區間估計,其估計的是一個能覆蓋總體參數的區間,並且給出了該區間能覆蓋總體參數的概率。這裡特別說明一下,區間估計不是估計總體參數落在某區間的概率,而是這個區間能覆蓋總體參數的概率,總體參數無論是否知道,它是一個固定的值。

上面所說的概率指的就是置信水平,用(1-α)表示,其中α為顯著性水平(significance level)。因此可以看出,(1-α)的置信水平和α的顯著性水平所代表的概率是一樣的。

區間估計的方法,就是在點估計的基礎上,上下偏移一個量,這個量就是置信因子*標準誤。

(點估計量-置信因子*標準誤,點估計量+置信因子*標準誤

其中:

點估計量不解釋;置信因子,取決於總體分布和α,以正態分布為例,α=1%時,1-α=99%,置信因子=2.58;α=5%時,1-α=95%,置信因子=1.95。換句話說,即當分布的概率在置信水平時,對應的標準差範圍。標準誤:其實就近似於標準差,當總體方差已知時,可以使用:

如果總體的方差未知,則要使用:

綜上,最終的區間估計為:

方差已知(z分布):

方差未知(t分布):

注意,以上一個是z分布,一個是t分布。方差已知時,用z分布,n為樣本容量,方差未知時,用t分布,如果是t分布,查表使用自由度,自由度為n-1。

最後,再送各位同學一句口訣:方差已知用z,方差未知用t,樣本容量夠大(30為界),tz皆可,非正態分布小樣本不可估計。

部分資料來源:

[1] 南方財富網 . 美股熔斷以哪個指數為準?美股熔斷的標準

[2] statr. 中心極限定理的最最通俗解釋

兔紙的相關文章

CFA一級數量分析-貨幣的時間價值

CFA一級數量分析-數理統計基礎與收益

CFA一級數量分析-概率論基礎

CFA一級數量分析-常見概率分布-上

CFA一級數量分析-常見概率分布-下

相關焦點

  • 必考知識點,CFA一級數量分析-常見概率分布-下
    可以說,在常見概率分布這一大章內容裡面,最重要的內容就在接下來要說的裡面,一個是正態分布(normal distribution),另一個是t分布(student『s t-distribution),其也是掌握後面章節內容的關鍵知識點。
  • 2019年cfa二級考試難度分析,和一級區別在哪兒?
    2019年cfa二級考試難度   CFA考試分為三個等級,三個等級從一級考試開始,依照順序參加考試,CFA一級考試每年有兩次考試時間,6月cfa考試成績還沒出來,cfa考生已經擔心起2019年cfa二級的考試難度了,害怕自己通過了cfa一級考試,卻不能通過cfa二級考試,今天高頓CFA
  • CFA一級框架:抽樣估計和假設檢驗都是些什麼?
    今天欣欣老師要帶大家複習一遍抽樣估計和假設檢驗,同學們都來一起快速複習一遍吧!抽樣估計包括抽樣方法、數據形態、中心極限定理、評判標準、區間估計、偏差等概念。假設檢驗包括定義假設、檢驗統計量、顯著性、拒絕域、P值、一類和二類錯誤等概念。戳我查看大圖▼戳我查看大圖▼
  • 2020年cfa一級考試難度如何?考哪些內容?
    cfa特許金融分析師認可度較高,薪資待遇也相對不錯。cfa一級考查內容十分廣泛,那麼究竟難度如何呢?會考什麼內容?下面快跟著會計網小編一起來了解看看吧!2020年cfa一級考試難度如何?1、cfa考試一共包括三級,cfa一級相對於二級、三級的考試難度要小一些。雖然實際難度不會很大,但是其涉及的考試內容十分廣泛,考到的金融知識點至少有4000個。要想順利拿下cfa一級考試,也還是有一定難度的。2、cfa一級考試真正難的地方不是題目有多難,而是題目數量大,時間卻不夠充足。
  • 2020年6月CFA一級如何自學?
    2020年6月CFA一級如何自學?   隨著2019年6月CFA考試結束,很多準考生開始關注2020年cfa考試(ps,2019年12月僅有CFA一級考試),諮詢2020年6月CFA一級如何自學?
  • 必考知識點,CFA一級數量分析-常見概率分布-上
    常見連續概率分布模擬分析由於前面的廢話說得有點多,顯然字數是要超標了,而後面又有非常重要的正態分布,所以連續概率分布和模擬的內容放到下篇文章中,請大家自行查閱。the existence of God兔紙的相關文章美聯儲降息,多國下調利率,敢問利率為何物從餘額寶七日年化談今天的一百塊,明天值多少CFA一級數量分析
  • CFA一級數量分析科目重難點分析
    數量分析是一種基礎的金融分析工具。我們運用各種數學模型來分析一個金融商品在未來會達到的價位水平,同時也能通過它評估出與投資者承擔風險相對應的收益回報等。   投資者運用數量分析所追求的目標在於保值投資資產,而非使其獲得最大化的收益。
  • 高頓CFA:CFA一級相當於什麼水平?
    一、CFA一級難度相當於什麼水平   CFA一級考試科目:職業倫理道德、數量分析、經濟學、財務報表分析、公司理財、投資組合管理、權益投資、固定收益投資、衍生品投資、其他投資。   也就是說CFA一級涉及以上科目相關知識。
  • 考了CFA相關證書,能免考CFA一級嗎?
    越來越多的人想要報考CFA,CFA考試總共三個級別,需要從一級開始報考,有的同學的學歷比較高,或者已經考了相關的證書,來諮詢高頓君「能不能免考CFA一級測試?」  高頓君表示:CFA一級是不能免考的,不管你的學歷有多高,考過相關證書多少個,都是不可以免考的。CFA考試任一級別都不能免考,CFA協會並未設立CFA免考政策。
  • CFA每級題目數量一樣嗎?
    CFA每級題目數量不一樣,同時CFA每個級別的考試題型是不一樣的,參加不同級別CFA考試的同學要根據不同級別的題目數量與考試題型來展開學習。    一、CFA各級別題目數量有多少?
  • CFA一級相當於什麼水平?有什麼用?
    CFA一級相當於什麼水平可以從兩個方面說明。 一、CFA一級難度相當於什麼水平CFA一級考試科目:職業倫理道德、數量分析、經濟學、財務報表分析、公司理財、投資組合管理、權益投資、固定收益投資、衍生品投資、其他投資。
  • CFA一級 | 數量分析重點難點及備考方法
    沒接觸過CFA®一級考試的人,往往看到有個叫做數量分析(Quantitative Method),即金融數量方法的科目,不少覺得自己數學不太好的童鞋,心裡就開始打退堂鼓了。原因也很簡單,以前學數學的時候留下的陰影唄。CFA®一級考試的數量分析在考試中佔比為12%,也是其它很多課程的基礎。
  • 高頓教育:12月CFA考前看什麼?怎麼備考?
    針對這些佔比較大科目重要內容的分析:   三個等級必考的道德部分,一定要多看案例,多分析。固收和財報這種科目一定要多看筆記,如果沒有筆記,可以看高頓的《CFA精要圖解》。而如數量,權益這樣的重點,就需要通過做題去熟悉公式了。
  • 12月CFA一級該怎麼備考?
    因為CFA一級的考點太多了,240道題,要考一兩百個知識點,這絕不是單單靠運氣就能考過。但CFA一級不難,就是繁雜,只要你複習的點覆蓋到,一般都能順利通過。  所以需要花費足夠的時間,把這些知識點啃下來。  CFA一級,285小時的學習時間——它們只是一個基準,而不是成功的保證。
  • CFA二級數量複習攻略
    此外二級數量傳統的重難點依舊在多元回歸分析和時間序列模型上。我們需要重點掌握違反回歸模型假設的三種情形:異方差、序列相關和多重共線性。對於時間序列模型,我們需要重點掌握自回歸模型的假設,這同時也是一個難點。關於時間序列模型這一部分,需要我們理清各個模型相互間的邏輯關係,並且強調對重要概念的結論的理解。
  • CFA notes是什麼?CFA notes學習順序
    根據考生的學習背景不同在備考CFA的時候所花的時間分配也需要有所區分,在notes和教材的比例是按照基礎越好佔有notes的時間越多這樣來分配學習時間,在看cfa notes的同時也可結合其他cfa教材進行學習。   在學習notes內容的時候,如果遇到什麼重要知識點就拿筆標準下來,或者專門拿一個本子進行記憶,在後期的CFA考前衝刺時對你有一定的幫助。
  • cfa一級和frm一級考試先考哪一個比較好?
    CFA和FRM這兩大考試,每年的CFA考試會比FRM考試遲上一個月,而有些考生鑑於FRM和CFA這兩個證書的含金量想要一起備考,於是在我們的交流群中就有了以下這個問題:cfa考試先考哪一級,可以與FRM一級一起備考嗎?下面高頓FRM小編就詳細為大家進行回答!
  • cfa一級掛靠一年多少錢 cfa和cpa哪個含金量高更有用
    cfa,這個是一個證書的名稱,從事金融方面的需要這個證書,這個證書還比較難考,那麼cfa一級掛靠一年多少錢?和cpa哪個含金量高:  cfa一級掛靠一年多少錢:  cfa一級掛靠一年的金額並不是那麼高,不同的城市價格不一樣,而且金額也是要受到掛靠事務所的等級的影響,像在一線城市,比如說北京,掛靠一年能有一萬塊錢,要是是二線城市,金額會低於1萬塊錢。
  • 2018年CFA考試通過率怎麼計算?CFA考試科目詳解
    全球170多個國家高度認可,通往100萬年薪必考的資格認證,FT中文網譽為投資專才的「鉑金標準」,人民日報推薦為高含金量金融證書!未來十年中國將會有100萬複合型金融人才缺口,國內一、二線城市CFA持證人高額獎金補貼和人才引進福利。
  • cfa一級備考攻略,考完cfa一級能幹什麼
    關於cfa要複習多長時間,其實因人而異,cfa官方推薦學習時間是300小時,大部分通過人也基本是在300小時左右。也有學霸表示他們一級複習了兩周就去考了,如果有基礎的話,cfa一級200個小時左右應該沒問題。cfa二級、三級也差不多300個小時左右。