在Stata中用import fred命令導入數據

2020-12-17 中國教育裝備採購網

　　概述

　　聯邦儲備經濟資料庫(FRED)由聖路易斯聯邦儲備銀行持有，提供成千上萬的時間系列來衡量經濟和社會結果。新的Stata15命令importfred從這個知識庫中導入數據。

　　這篇文章，將演示如何用importfred命令從FRED中導入數據。還將討論importfred提供的，在數據管理中非常有用的元數據。然後演示如何使用高級功能：導入系列的多個版本，他們的觀測值隨時間的推移保持更新。

　　新版本發布的數據將更新FRED的所有系列。有些系列，新的數據發布只是添加了觀測值。而對於某些系列，一個新的數據發布可以改變先前公布的觀測值，因為觀測值被估計或計算。這些更改是隨著源信息或公式以及方法的更改而做出更改的。例如，具體的國民生產總值（GNP）在某個季度的數據會隨著更完整的源信息的更新而更新幾次。

　　更新的數據被成為vintage。Vintages發行的日期是確定的，比如我們說的「theJuly10,2017vintage」。Importfred命令中的Vintage()選項允許您訪問早期的vintage數據。

　　以前的數據有幾種用途。首先，導入vintage數據可以讓您查看一個數據集，正如前面的文章中所看到的那樣，這對於複製目的是有用的。其次，之前的年份用作穩健性檢驗，在某些情況下，研究您的結果是否在不同數據版本中是穩健的是有用的。第三，在某些應用工作中，有必要對信息進行條件化，而不是使用修改後的數據。

　　在下面討論的例子中，後來的數據顯示，2008的深度衰退比早期的年份更嚴重。

　　使用importfred命令

　　幾乎跟所有的命令一樣，您可以通過菜單驅動的圖形用戶界面(GUI)或者通過命令行界面訪問importfred。通過菜單File>Import>FederalReserveEconomicData(FRED)使用FRED知識庫是最方便的。使用命令行界面對於重複的任務更簡單。在這篇文章中，由於不同年份的應用幾乎總是重複，所以我使用命令行界面。

　　在進行所有的操作前，需要一個使用FRED的密鑰，它可以從以下連結免費獲取https://research.stlouisfed.org/docs/api/api_key.html

　　單擊上面的連結，選擇RequestorviewyourAPIkeys，註冊並獲得一個密鑰。然後,在Stata裡輸入

　　來設置您的密鑰。

　　FRED的序列是根據字母數字代碼識別的。FRED代碼可能是模糊的。ImportfredGUI和fredsearch命令可以極大地幫助您找到您想要的序列的代碼。為了找到真正GNP的代碼，我使用了fredsearch。該命令獲取關鍵字列表，並搜索與這些關鍵字匹配的FRED系列.此外，FRED的系列中為國家、地區等都設有標籤，而fredsearch可以嚴格的按照標籤來搜索以匹配關鍵字。下面我使用fredsearch找到系列關鍵字real,gross,national和product。我添加了選項tag(usa)來限制搜索美國的數據系列。

　　第一個結果是我們想要的，FRED代碼是GNPC96。我使用importfred導入它。

　　匯總表報告導入系列的數量，以及導入系列的最高和最低頻率。前幾個觀測值是：

　　datestr是一個包含觀測日期的字符串變量。daten是Stata的日期變量跟datestr中的字符串日期對應。根據FRED約定，觀測日期作為每天日期保存。例如，1947年第一季度的日期被記錄為1947年1月1日。

　　現在我們使用qofd()從daten中創建一個季度日期，然後tsset數據集：

　　Importfred可以同時導入多個系列，並且可以導入不同頻率的系列。它可以將高頻系列聚集到所需的較低頻率中，且可以在請求的日期範圍內導入數據。

　　導入和檢驗一系列年份數據

　　在提供了必要的背景材料之後，我現在演示如何導入和繪製GNPC96系列年份數據。對這個系列的更新特別有趣，因為它們揭示了大衰退的低谷，而不是早期數據發布中看到的那樣。

　　我們可以通過一個importfred命令來導入實際GNP的多個年份，並指定一個系列的fred代碼和所需的年份。

　　上面輸入的第一個命令是四個時間系列，每個日期指定一個命令。每個系列的名稱包括其FRED代碼和請求的日期，因此，GNPC9620090415是gnpc96系列，它在2009年4月15日被請求查看。其餘的命令生成季度變量，並將其指定為tsset變量。

　　FRED系列包含有關該系列的元數據，包括數據源、系列標題、頻率、單元和注釋。importfred使您能訪問這個元數據。每個導入系列的元數據存儲在變量特性中。特徵類似於記事本，但主要用於編程上下文。在importfred案例中，特徵可以包含數據管理中有價值的信息。

　　使用charlist查看特徵，被稱為varname[charname]。在使用vintage數據時，兩種特徵是最主要的。特徵保存在Last_Updated中，與您導入的年份相對應。

　　與GNPC9620090415相關聯的實際年份是2009年3月26日。當您指定一個不是真正的年份的日期時，導入fred時優先導入要求的日期。

　　特徵Units包含了系列測量的單位。這種特性對於單位隨時間變化的系列是有用的。例如，有些系列是為了通貨膨脹而調整的，並將其編入基準年。基準年可以隨著時間的推移變化。其他系列的單位不會隨時間變化。我列出了我導入的四種vintage數據的單位。

　　所有年份中的單位沒有可比性。其中一個年份使用價格指數，2000年美元計算，另外兩個使用2500美金計算，還有一個以2009美金計算。基準年的差異表現為國民生產總值（GNP）的水平變動。我們可以通過繪圖來看到這些水平的位移。

　　國民生產總值增長率的修正

　　在這一節中，我舉例說明，在這些年份中，對GNP的修訂產生了驚人的不同的增長率。

　　接下來的幾張圖表描述了2009年、2010年、2011年和2017年的實際國民生產總值增長情況。國民生產總值數據經常以增長率的形式來報告，通過使用增長率，我們消除了不同年份的基礎年變化所帶來的水平變化。

　　每一個年份的增長率都是按實際國民生產總值的四分之一個百分比來計算的。我給每個年份都標上年份標籤。

　　之前的年份缺失值的之所以發生是因為，例如，2015年的觀測數據不存在於2009年的年份中。下一個圖表是從每一個年份計算的增長率。首先，繪製了2009年和2010年份的增長率。然後，我又繪製了所有四個年份的增長率。

　　這個圖表繪製了從2006年的每個季度開始到2009年4月15日和2010年4月15日GNP年份實際增長率。單位按季度百分比變化的，所以數值2表示季度增長率是2%。大多數修訂都很小並且沒有太大意義，特別是2006年和2007年。這兩個年份的數據都顯示，2008年實際GNP增長有所放緩，但2010年的數據表明，經濟增長陷入了不利的領域，比2009年份估計的要早兩個季度。最明顯的修訂是2008年的第二和第四季度的觀測結果。2009年的報告顯示，2008年第四季度，實際國民生產總值下降了約1.5%；2010年的數據下降了1.7%。

　　這張圖表增加了從2006年第一季度開始到2011年4月15日和2017年4月15日的實際國民生產總值的增長率。如前所述，2006年和2007年中對觀測結果的修正是次要的。2011年和2017年的年份報告顯示，與2009年相比，2008年的國民生產總值增長有所下降。最明顯的是在2008年第四季度對觀測結果的修正。2009年份報告顯示，這一季度國民生產總值增長率為1.5%，但2017年份數據顯示，國民生產總值的增長率下降了近3%。

　　總結

　　在這篇文章中，我演示了如何使用importfred以及如何導入多個系列的年份數據。還研究了2008年左右實際GNP的修正。大多數的修正影響都不大，但某些季度的修正數據量大，就會得出比之前的數據更嚴重的經濟衰退和低谷。

在Stata中用import fred命令導入數據

相關焦點

從Excel到Stata的「擺渡車」——import excel命令

Python與Stata在數據處理區別

一文收藏stata14&15小抄:常用命令匯總

學術小渣 Stata常用命令

SFI:Stata與Python的數據交互手冊(一)

在Python中導入數據

Stata 16 正式發布:新增16+項主要功能特徵詳細介紹

stata調用python爬取時間數據——借他山之石以攻玉

stata常見命令分享(下)

如何在Stata16中調用Python

【乾貨分享】PVAR模型的stata操作流程(附操作文件)

stata 面板數據攻略

python命令參數及模塊的導入學習

零基礎學Stata 數據分析再不怕

數據清理思路及Stata命令

Python入門基礎之導入問題:from import 與import 詳解

Python import 導入上一級模塊

詳解Python中的import的用法

如何用Matlab/Python/Stata做簡單回歸分析

stata系列命令初探——ttest