Python實現固定效應回歸模型實現因果關係推斷

2021-01-10 deephub

眾所周知,「相關並不意味著因果關係」。 我要告訴你,相關可以表示因果關係,但需要一定條件。 這些條件已在計量經濟學文獻中被廣泛討論。 在本文中,我將以一種易於理解的方式對其進行總結。 我將解釋如果不滿足這些條件為什麼標準的普通最小二乘(OLS)無法確定因果關係。 然後,我將介紹可以提供有效解決方案的固定效應(FE)模型。 之後,我將使用兩套數據分析示例向您展示如何在python中進行操作。 我希望本文能夠通過良好的設計和令人信服的結果增強您對因果關係的理解。

相關可以表示因果關係 — 僅在滿足某些條件時

讓我們給出因果關係的正式定義。 因果關係是x導致y。 關聯意味著x和y沿相同或相反的方向一起移動。 因果關係應滿足以下三個經典條件:

x必須在y之前發生x必須與y相關x和y之間的關係不能用其他原因解釋。從相關性推斷因果關係是一件很難的事

在圖(A)中,冰淇淋銷量的增長與夏季鯊魚的襲擊密切相關。 您認為這有意義嗎? 這是一種關聯,但不是因果關係,因為並非以上三個條件中的所有條件都成立。 首先,鯊魚襲擊的次數不會隨著冰淇淋銷售的增加而增加。

其次,冰淇淋銷售量的增長與鯊魚襲擊之間的相關性可能始終存在,也可能不是始終存在。 第三,也是最重要的一點,兩個因素之間的關係可以用夏季來解釋。 實際上,炎熱的夏天是冰淇淋銷售量增加和鯊魚襲擊增加的驅動力。

混雜因素(Confounding Factor):冰淇淋銷售量x和鯊魚襲擊次數y都受夏季熱量,混雜因素z的驅動,如圖(B)所示。 混雜因素是一個既影響因變量y又影響自變量x的變量,從而導致了虛假關聯。 一項研究可能會忽略混雜因素。 因為我們沒有收集足夠的數據,所以它是不可觀察的。 而補救措施是將混雜因素識別為可觀察的因素。

內生性:如果存在一個混雜因素可以解釋x和y之間的關係,則x是內生的。x和y之間的相關性也無法解釋或毫無意義。 您能說冰淇淋銷售與鯊魚襲擊之間存在正相關關係嗎? 我們不應試圖從正號或負號得出任何結論。 事實是該係數可以更高,更低,甚至不同。

如何量化X對Y的影響?

為了衡量治療的效果,我們必須與沒有治療的事實進行比較。 換句話說,我們討論如果個人不接受治療會產生什麼結果。

隨機對照試驗(RCT)通常是非常好的標準

我們要怎麼解決這個難題呢? 隨機對照試驗(RCT)通常被視為非常好的標準,因為可以確定因果關係(Shadish et al,2002)。 如果我們可以將個體隨機分配到治療組和對照組,那麼兩組的個體特徵將大致相等。 那麼,治療效果就是兩組之間的y之差。

讓我用一種統計的方式來進行以上描述。 普通最小二乘(OLS)假設x與不可觀察項之間沒有相關性,即沒有內生性。 這可以用RCT中實現,因為隨機分配下不可能出現內生性或混雜問題。 在下式中描述了OLS,其中i是N個個體中每個個體的標識符。 第二個方程是矩陣形式。 關鍵假設是E(X)= 0,這表示x與不可觀測項之間沒有相關性。 錯誤項可能是任何不可觀察的項。

但是,在大多數情況下進行RCT會不可行。 RCT可能很耗時,或很昂貴,或難以向需要合作的公眾解釋,並且有時是不道德的。 例如,在醫院中,研究人員可能會建議將患者保留為對照組。 這顯然不可行,因為該研究使患者處於危險之中。 並非所有決策問題或臨床實驗都可以遵循RCT。 那我們還有什麼辦法? 研究人員越來越依賴於準實驗設計並取得了令人信服的結果。 「準」一詞表面上看起來表示不是真的。 準實驗設計類似於隨機對照試驗,但沒有對研究者進行隨機分配(Cook&Campbell,1979)。

準實驗接近「一樣好」

RCT中無法進行大量研究。 因此,我們使用了準實驗設計,其中已曝光和未曝光單位之間的唯一區別是曝光本身。 典型的準實驗包括回歸不連續性回歸——Regression Discontinuity(RD),差異——Difference-in-differences(DiD)和固定效應模型——Fixed-Effects Model (FE)。

不連續性回歸(RD)

RD設計將剛好高於和剛好低於閾值的對象進行比較,如圖(D)中「Before」方案中的綠色框所示。 預計綠色框中的主題非常相似。 在「After」場景中,正確的小組受到幹預,結果有所不同。 結果的這種跳躍或不連續可以解釋為幹預的結果。

在「After」期間(「 1」 =After)對Y的預期影響為E [Y(1)| X],而「Before」期間(「 0」 =Before)為E [Y(0)| X ]。 在小綠色框中,所有X都非常相似,因此,「之前」和「之後」期間的X被認為是相同的。 RD的結果接近RCT。

面板數據(Panel Data):也稱為縱向或橫向時間序列數據。 在面板數據中,您擁有所有時間段內個人的數據點。 基本的面板數據回歸模型類似於方程式(1),其中和是係數,而i和t是個體和時間的指標。 面板數據使您可以控制變量並說明各個變量的差異性。 有趣的是,在Python中使用Pandas模塊時,您可能會奇怪為什麼開發人員將其稱為「 Pandas」-非常可愛! 實際上,它來自「面板數據」。

假設我們可以在OLS中詳盡詳盡地指定所有因素:如果我們想知道一個人的婚姻狀況是否會增加一個人的收入。 假設我們可以指定一個詳盡的模型,明確列出影響收入水平的所有因素:

其中yit是時間t中i的收入,xit是婚姻狀況,Zit都是觀察到的隨時間變化的變量,例如年齡或工作數量。 Wi都是觀察到的不隨時間變化變量,例如種族,_it是誤差項。 如果我們可以列出所有因素,則可以得到的無偏差估計。

在面板數據上運行OLS時,它也稱為「池化OLS」。 當每個觀察值彼此獨立時,這是沒問題的,雖然這不太可能,因為面板數據中同一個人的觀察是相關的。 話雖如此,有時觀察結果在面板內的相關性很小,可以忽略不計。 然後,您可以這樣做。

但是,我們不太可能在OLS中指定所有可能的因素:很可能我們無法詳盡列出所有OLS的因素。 假設我們從上面的方程式中省略了Zit和Wi,而僅將yit回歸到xit上。 我們知道婚姻狀況(xit),年齡(Zit)和種族(Wi)很可能相關。 在沒有明確指定Zit和Wi的情況下,OLS中的估計幾乎可以肯定是有偏差的。 這是因為未在方程式中指定Zit和Wi使得它們變得不可觀察並合併到誤差項it中。 這使得婚姻狀況(x_it)是內生的(請參見上面的說明)。 所以結果,無論是正數還是負數,都將毫無意義。 因此,遺漏變量的問題是一個非常嚴重的問題。 如果省略了任何已知變量,則OLS中的結果都是不可靠的。

固定效果模型

上面的_i變量稱為固定效果,因為它不會隨時間變化。 它捕獲了個人的所有不隨時間變化的因素,例如性別,種族甚至個人特質。 yit和xit是i的收入和婚姻狀況,Zit代表i的所有其他隨時間變化的因素。 假定誤差it與所有上述因素都不相關(如果違反了此假設,則將面臨省略變量導致的偏差)。

如何估算方程式(3)? 在幾乎所有教科書中,您都可以看到像方程式(3)一樣的基本表述形式。 可以將其視為i = 0,1。當有多個個體i = 1,…N時,_i可以視為具有各自係數i的一組(N-1)個虛擬變量Di的簡寫,如圖所示。 等式(4)是您在回歸輸出中看到的。

DiD是FE模型的特例

DiD是FE模型的特例。

DiD背後的想法很簡單。 首先,我們計算在「Before」期間兩組之間的結果均值之差,即圖(E)中的「 A」。 其次,我們在「After」期間計算相同的值,即「 B」。 然後我們取「第二差異」,即「A」和「 B」之間的差異,並標記為「 C」。 第二差異衡量兩組結果的變化如何不同。 差異歸因於幹預的因果效應。

以面板數據形式,可以通過「differencing out」混淆因素從有限元模型中得出DiD。 因為沒有混淆因素,所以影響確實是因果關係。 典型設置類似於公式(5)。

假設個體i在治療組(xi = 1)或對照組(xi = 0)中,並且在治療前(ti = 1)或治療後(ti = 0)。 後期的效應為_2,如圖(E)所示。 這是通過以下方式得出的:

DiD模型和FE模型之間的區別在於更改是外生的。 更改是在個人i的選擇之外進行的。 例如,某州更改了其最低飲酒年齡法律。 此政策是外生的。

固定效應數據分析示例1 —投資與市場價值

公司投資的主要驅動力是什麼? 有大量的文獻討論了其驅動因素。 Grunfeld認為,公司的市場價值是投資的主要解釋和預測指標。 在以下練習中,我將使用Grunfeld數據集(可在statsmodels.datasets中獲得)來演示固定效果模型的使用。 順便說一句,Grunfeld數據集是計量經濟學中的知名數據集,就像Machine Learning中的虹膜數據集一樣。 這篇學術文章「 50歲時的Grunfeld數據」指出了它的廣泛用途。

該數據包含11家公司中每家20年的數據:IBM,通用電氣,美國鋼鐵,大西洋煉油,鑽石比賽,西屋電氣,通用汽車,固特異,克萊斯勒,聯合石油和美國鋼鐵。 在面板數據中,將「確定」和「年份」設置為索引。 固定效果模型指定如下,其中單個公司因子為_i或在以下代碼中稱為`entity_effects。 時間因子是_t或稱為time_effects。

或如下所示,其中Dj是公司i的虛擬變量,而It是t年的虛擬變量。

from statsmodels.datasets import grunfelddata = grunfeld.load_pandas().datadata = data.set_index(["firm","year"])print(data.head())

模塊linearmodels提供PandelOLS進行固定效果模型。 entity_effects=True表示模擬企業特定因素。 這意味著為11家公司創建10(N-1)個虛擬變量。 下面我展示了兩種回歸方法的代碼。 兩者產生相同的結果。

# Coding method 1from linearmodels.panel import PanelOLSimport statsmodels.api as smexog = sm.add_constant(gf[['value','capital']])grunfeld_fe = PanelOLS(gf['invest'], exog, entity_effects=True, time_effects=False)grunfeld_fe = grunfeld_fe.fit()print(grunfeld_fe)# Coding method 2grunfeld_fe = PanelOLS.from_formula("invest ~ value + capital + EntityEffects", data=gf) print(grunfeld_fe.fit())

「value」的係數在95%時具有統計學意義上的0.1101。 因此,Grunfeld得出了因果關係,即高投資是由高市場價值驅動的。

下面的代碼同時指定了公司特有的效果和時間效果。 結論保持不變。

# Coding method 1from linearmodels.panel import PanelOLSimport statsmodels.api as smexog = sm.add_constant(gf[['value','capital']])grunfeld_fet = PanelOLS(gf['invest'], exog, entity_effects=True, time_effects=True)grunfeld_fet = grunfeld_fe.fit()print(grunfeld_fet)# Coding method 2grunfeld_fet = PanelOLS.from_formula("invest ~ value + capital + EntityEffects + TimeEffects", data=gf) print(grunfeld_fet.fit())

固定收益數據分析示例2 –交通死亡率與啤酒稅

更高的啤酒稅是否有助於減少交通致死率? 許多州降低了啤酒稅,交通事故死亡率更高。 我們可以說降低啤酒稅會導致更高的死亡率嗎? 這種因果關係具有深遠的政策含義。 我將使用Stock&Watson廣為接受的書籍「計量經濟學概論」中的死亡數據集。

import pandas as pdimport numpy as npimport seaborn as snsfatalities = pd.read_csv('/fatality.csv')fatalities.head()

mrall = 車輛總死亡率beertax = 酒精稅mlda = 最低法定飲酒年齡jaild = 強制性入獄comserd = 強制性社區服務vmiles = 每位駕駛員的平均裡程unrate = 失業率perinc = 人均個人收入我將每年的數據生成平均值,以顯示每年的平均啤酒稅和死亡率。 1982–1984年的平均啤酒稅高於1986–1988年的啤酒稅。

avg = fatalities.groupby('year')['mrall','beertax'].mean()avg

我將使用`seaborn來顯示相關性。

sns.set(style="darkgrid")g = sns.jointplot("beertax", "mrall", data=avg, kind="reg", color="m", height=6)

我們可以建立任何因果關係嗎? 我將使用固定效果模型進行測試。 下面,我演示了兩個固定效果模型並用於討論和匯總OLS。

模型 1: 實體效果+時間效果模型 2: Entity_effects模型 3: 匯總OLS

或如下所示,其中Dj是狀態i的虛擬變量,而It是狀態t的虛擬變量。

下面對州的不隨時間變化的變量(例如州文化,州居民對飲酒的態度(可能是不隨時間進行變化)等)進行控制。對所有州隨時間變化的遺漏變量的時效控制。 例如,宏觀經濟條件或聯邦政策措施在所有州都是通用的,但會隨時間而變化。

您可能會詢問如何確認需要固定效果的模型規範。 這是通過可合併性測試(Poolability Test)完成的。 許多模塊已經包含測試結果。 用於F-test for poolability並顯示輸出。 這是對沒有固定效果的原假設的檢驗。 模型1中的F-test是40.158,p值是0.0,因此我們可以拒絕原假設,並得出固定效果模型規格合適的結論。

模型1:實體效果+時間效果

# Coding method 1from linearmodels.panel import PanelOLSimport statsmodels.api as smexog = sm.add_constant(fatalities[['beertax','mlda','jaild','comserd','vmiles','unrate','perinc']])fe = PanelOLS(fatalities['mrall'], exog, entity_effects=True, time_effects=True)fe = fe.fit()print(fe)# Coding method 2from linearmodels.panel import PanelOLSfe = PanelOLS.from_formula("mrall ~ beertax + mlda + jaild + comserd + vmiles + unrate + perinc + EntityEffects + TimeEffects", data=fatalities) print(fe.fit())

模型1告訴我們,啤酒稅與死亡率之間存在負相關關係(啤酒稅係數為-.4649)。 因此,我們可以得出因果關係,即較高的啤酒稅會導致較低的死亡率。

模型2:Entity_effects

如何理解三個模型中的R-squared值? 模型1中的R-squared為0.3577,高於模型2中的R-squared0.1286。這意味著模型1的擬合效果更好。 模型3中的0.4662怎麼樣? 儘管它比模型1和2的模型高得多,但是合併的OLS是一個錯誤指定的模型,如上面的公式(1)和(2)所述。 由於模型3無法解決內生性問題,因此它無法幫助我們得出啤酒稅和死亡率之間的因果關係。

# Coding method 1from linearmodels.panel import PanelOLSimport statsmodels.api as smexog = sm.add_constant(fatalities[['beertax','mlda','jaild','comserd','vmiles','unrate','perinc']])fe2 = PanelOLS(fatalities['mrall'], exog, entity_effects=True, time_effects=False)fe2 = fe2.fit()print(fe2)# Coding method 2from linearmodels.panel import PanelOLSfe2 = PanelOLS.from_formula("mrall ~ beertax + mlda + jaild + comserd + vmiles + unrate + perinc + EntityEffects", data=fatalities) print(fe2.fit())

模型3:匯總OLS

# Coding method 1from linearmodels.panel import PanelOLSimport statsmodels.api as smexog = sm.add_constant(fatalities[['beertax','mlda','jaild','comserd','vmiles','unrate','perinc']])pooledOLS = PanelOLS(fatalities['mrall'], exog, entity_effects=False, time_effects=False)pooledOLS = pooledOLS.fit()print(pooledOLS)# Coding method 2from linearmodels.panel import PanelOLSpooledOLS = PanelOLS.from_formula("mrall ~ beertax + mlda + jaild + comserd + vmiles + unrate + perinc ", data=fatalities) print(pooledOLS.fit())

作者:Dr. Dataman

deephub翻譯組:孟翔傑

相關焦點

  • 哈佛大學Hernan教授《因果推斷:What If》新書,311頁講解因果效應(附下載)
    harvard.edu/miguel-hernan/causal-inference-book/在本書中,我們強調需要足夠認真對待因果問題,才能明確表述它,我們還區別了數據和因果推斷假設的不同作用。一旦建立了這些基礎,因果推斷就必然變得不那麼隨意,這有助於防止混淆。
  • Stata講座:因果推斷中的雙重差分法開講
    主講嘉賓是中央財經大學社會發展學院王存同教授,講座題目為《因果推斷中的雙重差分法》。來自全國多所高校及科研機構的10596多名師生及研究者觀看了本場直播。本次講座王老師為大家帶來了因果推斷模型中的雙重差分法(DID)的介紹。因果推斷模型與方法是現代社會科學研究者利用計量模型發表高水平實證論文的核心利器,其中雙    重差分法(DID)佔有舉足輕重的地位。
  • 貝葉斯MS-VAR的Granger因果關係和狀態推斷
    Granger(1969)年提出因果關係概念,即過去和現在關於x的信息不能在均方誤差意義上改善y的預測,那麼x就不是Granger原因。相關研究者有Sims(1972)。在向量自回歸(VAR)中,如果y方程中x的滯後係數聯合為零,則x不會導致y。其他參數時間序列模型也被用來研究基於一步預報的Granger因果關係,包括向量自回歸滑動平均(VARMA)、logistic平滑轉移向量自回歸(LST-VAR)和一些廣義自回歸條件異方差(GARCH)模型。
  • 因果推斷異質性是什麼? 邊際處理效應讓你與眾不同
    邊際政策效應MTE,是指處於接受或不接受某項政策或倡議的臨界狀態的人在最終選擇接受該項政策或倡議時的平均收益(成本)。現在,假設我們想要看看讀大學是不是對我們的收入有所增加,即看看教育回報率水平。考慮如下明瑟爾(Mincer)方程,其參數為常數,這是假設不存在異質性時的傳統教育回報模型。
  • 搞懂因果推斷中內生性問題解決方法必讀的書籍和文獻已搜集好!
    8.廣義合成控制法gsynth, Stata運行程序release,9.廣義合成控制法gsynth, 基於交互固定效應的因果推斷,10.再談合成控制法SCM, 幫你尋找因果推斷控制組,11.合成控制法什麼鬼? 因果推斷的前沿方法指南關於面板數據模型,1.面板數據方法免費課程, 文章, 數據和代碼全在這裡, 優秀學人好好收藏學習!
  • 回歸模型怎麼做 - CSDN
    協整檢驗方法的文獻綜述:(1)Kao(1999)、Kao and Chiang(2000)利用推廣的DF和ADF檢驗提出了檢驗面板協整的方法,這種方法零假設是沒有協整關係,並且利用靜態面板回歸的殘差來構建統計量。(2)Pedron(1999)在零假設是在動態多元面板回歸中沒有協整關係的條件下給出了七種基於殘差的面板協整檢驗方法。
  • 非平衡面板固定效應門限回歸模型
    固定效應門限回歸模型(Hansen, 1999)是時間門限自回歸模型在面板數據中的擴展。Stata的xthreg程序(Wang, 2015)適用於平衡面板。而微觀數據中非平衡面板是更常見的情況,在將非平衡面板整理為平衡面板時很容易導致樣本選擇偏差等問題。因此,利用非平衡面板進行估計和檢驗則可以有效避免這些問題。
  • 【乾貨】隨機森林的Python實現
    本文介紹了隨機森林的原理、用途,以及用 Python 實現隨機森林的方法。 隨機森林是一種高度通用的機器學習方法,廣泛應用於市場營銷、醫療保健、保險等各領域。它可用於模擬市場營銷對客戶獲取、保持和流失的影響,或用於預測患者的患病風險和感病性。 隨機森林能夠進行回歸和分類。
  • 跨媒體因果推斷
    跨媒體智能的主要基礎理論問題是借鑑生物的跨媒體信息表達和處理機理,實現智能感知和認知並做出決策。本論壇將從跨媒體智能的抽象歸納、演繹推理及因果推斷等方面,討論跨媒體大數據表徵與推理、分析因果計算的前沿理論和方法、探索跨媒體因果推斷的未來發展趨勢,並暢想未來的創新應用方向。
  • 因果推理「三問」:是什麼?為什麼需要?如何使用?|內生性|因果關係|...
    譯者:AI研習社(聽風1996)  作為一名經濟學博士,我致力於尋找某些變量之間的因果關係,用來完成我的論文。因果關係強大到可以讓人們有足夠的信心去做決策、防止損失、求解最優解等。在本文中,我將討論什麼是因果關係,為什麼需要發現因果關係,以及進行因果推理的常用技巧。  1. 什麼是因果關係?
  • 再談合成控制法SCM, 幫你尋找因果推斷控制組
    歡迎到以尋找因果關係為宗旨的因果推斷研究小組交流訪問.計量社群徐 Chang群友推薦.今天,我們「因果推斷研究小組」將為計量經濟圈的圈友們進一步引薦「合成控制法」。關於該方法的一些基礎性知識和實證中的操作,圈友們可以看看之前的文章合成控制法什麼鬼? 因果推斷的前沿方法指南。
  • R語言實現LASSO回歸模型
    我們知道廣義線性模型包括了一維連續因變量、多維連續因變量、非負次數因變量、二元離散因變量、多元離散因變等的回歸模型。然而LASSO對以上的數據類型都適合,也可以說LASSO 回歸的特點是在擬合廣義線性模型的同時進行變量篩選(variable selection)和複雜度調整(regularization)。
  • 劉曉蕾:實證研究中如何確定因果關係
    而這些問題,都需要我們確定變量間的因果關係之後才能回答。我們來舉一個常見的「偽」因果關係的例子,新浪健康網站放出一個報告:長期單身少活十年!報告撰寫者根據各種翔實的數據得出結論,單身女性比結婚女性壽命短7-15年,單身男性比結婚男性壽命短8-17年。研究者將「是否單身」作為自變量,「壽命短」作為因變量,做出的回歸結果顯示二者的影響關係非常顯著。
  • 計量模型好壞的評價標準,經濟研究如是說
    而在諸多目標之中,因果關係的推斷是核心。因果關係首先是一個哲學概念,但哲學上迄今沒有給出普遍、嚴格、可量化的定義,社會科學對因果關係的測度更多地是基於某一角度的考慮。例如,計量經濟學中廣為採用的 Granger 因果關係檢驗就是從變量之間的預測關係來檢驗因果關係。如何定義因果效應並進行有效識別則成為可信性革命第二次和第三次大討論的核心話題。
  • 8種用Python實現線性回歸的方法,究竟哪個方法最高效?
    今天,讓我們來談談線性回歸。沒錯,作為數據科學界元老級的模型,線性回歸幾乎是所有數據科學家的入門必修課。拋開涉及大量數統的模型分析和檢驗不說,你真的就能熟練應用線性回歸了麼?未必!在這篇文章中,文摘菌將介紹8種用Python實現線性回歸的方法。了解了這8種方法,就能夠根據不同需求,靈活選取最為高效的方法實現線性回歸。
  • 固定效應模型與隨機效應模型
    大部分的Meta分析需要選擇固定效應模型與隨機效應模型對數據進行合併。本期,我們就介紹下固定效應模型與隨機效應模型這些事。
  • 機器學習之多元線性回歸模型梯度下降公式與代碼實現(篇二)
    上一篇我們介紹了線性回歸的概述和最小二乘的介紹,對簡單的一元線性方程模型手推了公式和python代碼的實現。機器學習之線性回歸模型詳細手推公式與代碼實現(篇一)今天這一篇來介紹多元線性回歸模型多元線性回歸模型介紹在回歸分析中,如果有兩個或兩個以上的自變量,就稱為多元回歸
  • 【固定效應模型】
    在meta分析時,我們常會面臨選擇合併分析的模型-固定效應模型或者隨機效應模型,本期就為大家介紹一下固定效應模型,揭開meta分析神秘的面紗。
  • 8種用Python實現線性回歸的方法
    為什麼我們還需要線性回歸呢?一方面,線性回歸所能夠模擬的關係其實遠不止線性關係。線性回歸中的「線性」指的是係數的線性,而通過對特徵的非線性變換,以及廣義線性模型的推廣,輸出和特徵之間的函數關係可以是高度非線性的。
  • 固定效應模型與隨機效應模型的差別
    緊接前期介紹的固定效應模型與隨機效應模型,今天,我們主要聊聊兩者之間的差別。從假設來看,兩種模型的差別在於: 相應的,固定效應模型得出的結果為「真實值估計值」,而隨機效應模型得出的結果為「真實值平均值的估計值」。這也是源於各自的假設不同。兩者均是得出真實值平均值的估計值,差別是固定效應模型的真實值只有一個,所以得出的結果為真實值的估計值。