在Stata中用import fred命令導入數據

2020-12-17 中國教育裝備採購網

  概述

  聯邦儲備經濟資料庫(FRED)由聖路易斯聯邦儲備銀行持有,提供成千上萬的時間系列來衡量經濟和社會結果。新的Stata15命令importfred從這個知識庫中導入數據。

  這篇文章,將演示如何用importfred命令從FRED中導入數據。還將討論importfred提供的,在數據管理中非常有用的元數據。然後演示如何使用高級功能:導入系列的多個版本,他們的觀測值隨時間的推移保持更新。

  新版本發布的數據將更新FRED的所有系列。有些系列,新的數據發布只是添加了觀測值。而對於某些系列,一個新的數據發布可以改變先前公布的觀測值,因為觀測值被估計或計算。這些更改是隨著源信息或公式以及方法的更改而做出更改的。例如,具體的國民生產總值(GNP)在某個季度的數據會隨著更完整的源信息的更新而更新幾次。

  更新的數據被成為vintage。Vintages發行的日期是確定的,比如我們說的「theJuly10,2017vintage」。Importfred命令中的Vintage()選項允許您訪問早期的vintage數據。

  以前的數據有幾種用途。首先,導入vintage數據可以讓您查看一個數據集,正如前面的文章中所看到的那樣,這對於複製目的是有用的。其次,之前的年份用作穩健性檢驗,在某些情況下,研究您的結果是否在不同數據版本中是穩健的是有用的。第三,在某些應用工作中,有必要對信息進行條件化,而不是使用修改後的數據。

  在下面討論的例子中,後來的數據顯示,2008的深度衰退比早期的年份更嚴重。

  使用importfred命令

  幾乎跟所有的命令一樣,您可以通過菜單驅動的圖形用戶界面(GUI)或者通過命令行界面訪問importfred。通過菜單File>Import>FederalReserveEconomicData(FRED)使用FRED知識庫是最方便的。使用命令行界面對於重複的任務更簡單。在這篇文章中,由於不同年份的應用幾乎總是重複,所以我使用命令行界面。

  在進行所有的操作前,需要一個使用FRED的密鑰,它可以從以下連結免費獲取https://research.stlouisfed.org/docs/api/api_key.html

  單擊上面的連結,選擇RequestorviewyourAPIkeys,註冊並獲得一個密鑰。然後,在Stata裡輸入

  

  來設置您的密鑰。

  FRED的序列是根據字母數字代碼識別的。FRED代碼可能是模糊的。ImportfredGUI和fredsearch命令可以極大地幫助您找到您想要的序列的代碼。為了找到真正GNP的代碼,我使用了fredsearch。該命令獲取關鍵字列表,並搜索與這些關鍵字匹配的FRED系列.此外,FRED的系列中為國家、地區等都設有標籤,而fredsearch可以嚴格的按照標籤來搜索以匹配關鍵字。下面我使用fredsearch找到系列關鍵字real,gross,national和product。我添加了選項tag(usa)來限制搜索美國的數據系列。

  

  第一個結果是我們想要的,FRED代碼是GNPC96。我使用importfred導入它。

  

  匯總表報告導入系列的數量,以及導入系列的最高和最低頻率。前幾個觀測值是:

  

  datestr是一個包含觀測日期的字符串變量。daten是Stata的日期變量跟datestr中的字符串日期對應。根據FRED約定,觀測日期作為每天日期保存。例如,1947年第一季度的日期被記錄為1947年1月1日。

  現在我們使用qofd()從daten中創建一個季度日期,然後tsset數據集:

  

  Importfred可以同時導入多個系列,並且可以導入不同頻率的系列。它可以將高頻系列聚集到所需的較低頻率中,且可以在請求的日期範圍內導入數據。

  導入和檢驗一系列年份數據

  在提供了必要的背景材料之後,我現在演示如何導入和繪製GNPC96系列年份數據。對這個系列的更新特別有趣,因為它們揭示了大衰退的低谷,而不是早期數據發布中看到的那樣。

  我們可以通過一個importfred命令來導入實際GNP的多個年份,並指定一個系列的fred代碼和所需的年份。

  

  上面輸入的第一個命令是四個時間系列,每個日期指定一個命令。每個系列的名稱包括其FRED代碼和請求的日期,因此,GNPC9620090415是gnpc96系列,它在2009年4月15日被請求查看。其餘的命令生成季度變量,並將其指定為tsset變量。

  FRED系列包含有關該系列的元數據,包括數據源、系列標題、頻率、單元和注釋。importfred使您能訪問這個元數據。每個導入系列的元數據存儲在變量特性中。特徵類似於記事本,但主要用於編程上下文。在importfred案例中,特徵可以包含數據管理中有價值的信息。

  使用charlist查看特徵,被稱為varname[charname]。在使用vintage數據時,兩種特徵是最主要的。特徵保存在Last_Updated中,與您導入的年份相對應。

  

  與GNPC9620090415相關聯的實際年份是2009年3月26日。當您指定一個不是真正的年份的日期時,導入fred時優先導入要求的日期。

  特徵Units包含了系列測量的單位。這種特性對於單位隨時間變化的系列是有用的。例如,有些系列是為了通貨膨脹而調整的,並將其編入基準年。基準年可以隨著時間的推移變化。其他系列的單位不會隨時間變化。我列出了我導入的四種vintage數據的單位。

  

  所有年份中的單位沒有可比性。其中一個年份使用價格指數,2000年美元計算,另外兩個使用2500美金計算,還有一個以2009美金計算。基準年的差異表現為國民生產總值(GNP)的水平變動。我們可以通過繪圖來看到這些水平的位移。

  

  國民生產總值增長率的修正

  在這一節中,我舉例說明,在這些年份中,對GNP的修訂產生了驚人的不同的增長率。

  接下來的幾張圖表描述了2009年、2010年、2011年和2017年的實際國民生產總值增長情況。國民生產總值數據經常以增長率的形式來報告,通過使用增長率,我們消除了不同年份的基礎年變化所帶來的水平變化。

  每一個年份的增長率都是按實際國民生產總值的四分之一個百分比來計算的。我給每個年份都標上年份標籤。

  

  之前的年份缺失值的之所以發生是因為,例如,2015年的觀測數據不存在於2009年的年份中。下一個圖表是從每一個年份計算的增長率。首先,繪製了2009年和2010年份的增長率。然後,我又繪製了所有四個年份的增長率。

  

  這個圖表繪製了從2006年的每個季度開始到2009年4月15日和2010年4月15日GNP年份實際增長率。單位按季度百分比變化的,所以數值2表示季度增長率是2%。大多數修訂都很小並且沒有太大意義,特別是2006年和2007年。這兩個年份的數據都顯示,2008年實際GNP增長有所放緩,但2010年的數據表明,經濟增長陷入了不利的領域,比2009年份估計的要早兩個季度。最明顯的修訂是2008年的第二和第四季度的觀測結果。2009年的報告顯示,2008年第四季度,實際國民生產總值下降了約1.5%;2010年的數據下降了1.7%。

  

  這張圖表增加了從2006年第一季度開始到2011年4月15日和2017年4月15日的實際國民生產總值的增長率。如前所述,2006年和2007年中對觀測結果的修正是次要的。2011年和2017年的年份報告顯示,與2009年相比,2008年的國民生產總值增長有所下降。最明顯的是在2008年第四季度對觀測結果的修正。2009年份報告顯示,這一季度國民生產總值增長率為1.5%,但2017年份數據顯示,國民生產總值的增長率下降了近3%。

  總結

  在這篇文章中,我演示了如何使用importfred以及如何導入多個系列的年份數據。還研究了2008年左右實際GNP的修正。大多數的修正影響都不大,但某些季度的修正數據量大,就會得出比之前的數據更嚴重的經濟衰退和低谷。

  

相關焦點

  • 從Excel到Stata的「擺渡車」——import excel命令
    1、前言  在日常學習和工作中,我們接觸的很多數據都是使用Excel文件存儲的,如果想要使用Stata進行數據分析,我們首先就需要將Excel工作表導入到Stata中。這個時候,就該我們的import excel命令「粉墨登場」了。
  • Python與Stata在數據處理區別
    按照慣例,我們按如下方式導入 pandas 和 NumPy:# 計量經濟學服務中心import pandas as pdimport numpy as np在Python教程中,DataFrame將通過調用顯示pandas df.head(),它將顯示該行的前N行(默認為5行)DataFrame
  • 一文收藏stata14&15小抄:常用命令匯總
    Basic stata command 本節主要對stata一些基礎命令例如導入導出和描述性分析以及創建新變量進行學習。Fundamental commands in Stata to import, explore, summarize, and create new variables
  • 學術小渣 Stata常用命令
    大學期間覺得學的最有用的軟體之一就是stata了,對stata基本是在血和淚的嘗試中爬過,到了最後基本屬於只要stata不出現紅字錯誤命令就開心得不得了。順便整理一下常用的stata命令如下,應該對付計量方向第一學期的入門問題不大(求stata大神不虐..),所以就只寫了一部分常用的,有時間後面再補充吧。
  • SFI:Stata與Python的數據交互手冊(一)
    在往期推文《Stata16調用Python測試(一)》 以及 《Stata16調用Python——繪製詞雲圖》 中,我們分別從基礎功能與實踐應用的方面介紹了Stata16中的Python命令,但它們均未直面問題的核心———Python與Stata的數據交互。在Stata16版本以前,用戶並非不能實現「Stata和Python混著用」的場景。例如,通過Stata的!
  • 在Python中導入數據
    在Python中導入數據來源:https://towardsdatascience.com/importing-data-in-python-f6602add57b7作者:Sergi Lehkyi翻譯:老齊閱讀本文需要7分鐘最近,我在DataCamp完成了兩門關於Python數據導入的課程,我對可以用來獲取數據的原始碼數量感到非常驚訝
  • Stata 16 正式發布:新增16+項主要功能特徵詳細介紹
    1Importing of SAS and SPSS dataset從SAS與SPSS中導入數據從各個軟體之間相互可以導入數據,互相兼容已經成為計量經濟學軟體的一個趨勢,小編發現spss24.0版本已經可以實現從spss中導入stata以及sas格式的數據,並且從spss中導入stata格式的數據,各方面的數據結構類型都還可以
  • stata調用python爬取時間數據——借他山之石以攻玉
    但是小編在深入了解學習之後發現,該功能簡直是stata用戶的福音。該功能使得,我們可以先利用python爬取數據,然後再利用用戶所熟悉的stata去處理數據,因為stata在處理數據方面具有一定的優勢。那麼今天我們就來看看,怎樣利用stata調用python爬取數據,再用stata進行處理?今天試爬的數據是巨潮網上的預約年報的披露時間數據。
  • stata常見命令分享(下)
    前幾日小編結合自己做數據的經歷給大家總結分享了stata常用命令分享(上)今天就繼續給大家分享哦~>上回我們講到將excel表格中的數據導入stata隨後可以進行一些簡單操作以實現我們的小心思那麼一頓操作猛如虎之後或許你想給變量換個名字那麼請輸入
  • 如何在Stata16中調用Python
    一方面,Python早就可以調用Stata了,我們完全可以將Stata的命令封裝在Python命令中;另一方面,數據類型的轉化完全可以通過數據集的導入導出來實現。正如我們經常做的,用Python爬一組數據,然後保存為Excel工作表,最後用Stata讀取並建模。
  • 【乾貨分享】PVAR模型的stata操作流程(附操作文件)
    首先,點擊打開/新建do文件的圖標,會自動出現一個Untitled.do文件,我們在其中輸入或直接複製粘貼命令import excel d:\stata15\do\ydyl.xlsx, sheet("Sheet1") firstrow。
  • stata 面板數據攻略
    2、將Excel表格另存為CSV格式,在Stata中導入CSV格式的文檔(file-import-第一個選項,然後點Browse,在跳出的「打開」文檔的文件類型選擇CSV,找到自己之前保存好的CSV文檔)。
  • python命令參數及模塊的導入學習
    python已經成為程式語言排行榜的老大了,要向不被時代淘汰,就要緊跟時代步伐,在IT編程世界的今天,不會python可是不行的,今天繼續學習python的命令及相關模塊導入學習。import 與 from...import
  • 零基礎學Stata 數據分析再不怕
    在學術圈如果是做應用計量(特別是橫截面數據、面板數據),Stata是不二之選,因為不管是管理數據還是跑回歸,實在太太太方便了。現在主流期刊的應用微觀計量文章裡面能用到的模型stata幾乎都有,而且其中的絕大多數都是用stata做的。而且最大的優點是,簡單!
  • 數據清理思路及Stata命令
    例如,如果原始數據中變量標籤為中文,用stata14打開時,變量標籤無法識別。此時,需要設定編碼類型。命令為 Unicodeencoding set gb18030,即設定編碼類型為國標18030,即簡體中文。
  • Python入門基礎之導入問題:from import 與import 詳解
    在python中導入模塊絕對是我們最最常用的功能,基本每個py文件中都會有import或者是from import語句。可是,這兩種導入方法有什麼不同,又該怎麼用呢?今天就好好來分析一下。除非使用精確導入。import語句import語句就像這樣也可以在一行內導入多個模塊:但是這樣的代碼可讀性不如多行的導入語句。 而且在性能上和生成 Python 字節代碼時這兩種做法沒有什麼不同。 所以一般情況下, 我們使用第一種格式。
  • Python import 導入上一級模塊
    1.導入同級模塊python導入同級模塊(在同一個文件夾中的py文件)直接導入即可。import xxx如在file1.py中想導入file2.py,注意無需加後綴".py":import file2# 使用file2中函數時需加上前綴"file2."
  • 詳解Python中的import的用法
    打開命令行,進入到Tree目錄下,敲下python m1.py運行,發現沒有報錯,且列印出In m2,說明這樣使用import沒有問題。我們來看一下導入流程:m1使用from Branch import m3導入m3,然後在m3.py中用import m4導入m4。看出問題了嗎?m4.py和m1.py不在同一目錄,怎麼能直接使用import m4導入m4呢。
  • 如何用Matlab/Python/Stata做簡單回歸分析
    : 數據採用的是Pieters & Bijmolt(1997)的關於Consumer Memory for Television Advertising調查結果。這並不是重點,其實就可以簡單理解為現在有一個橫截面數據:y是unaid,x包括dur、ncb、rank、year這四個變量,我們現在關心的就是y跑在四個解釋變量的多元回歸模型。
  • stata系列命令初探——ttest
    絕對幼稚又不被允許想要改變,卻不能華麗的轉身試圖頹廢,又找不到退縮的理由往前一步,要死要活停在原地,坐以待斃那就不要多想了,去做自己覺得該做的事情今天繼續分享新的stata命令ttest,即 t tests (mean-comparison tests)簡單來說,在t檢驗的假設都滿足的前提下比如滿足正態分布啊