原標題:【分享】中國15個大型微觀資料庫匯總
編者按:
1.中國工業企業資料庫經濟學的量化趨勢使得數據在日常經濟學研究中的地位愈加重要,經濟學者們也越來越依靠資料庫尤其是微觀資料庫進行學術研究。筆者參考了國內很多關於資料庫知識的整理,發現很多關於資料庫的簡介過於粗略或者不夠全面,遺漏了很多重要的資料庫。現將國內常用的微觀資料庫的主要信息進行重新整理匯總,方便大家查詢與應用。敬請閱讀。
數據名稱:中國工業企業資料庫(China Industry Business Performance Data)
執行機構:國家統計局
開放數據年份:1998-2013
調查方式:下級企業單位按時報送
採用計算機輔助調查:是
數據類型:面板數據
抽樣方式:根據國家統計局擬訂的工業企業報表制度抽樣
覆蓋省份:中國大陸地區銷售額500萬元/RMB以上的大中型製造企業
分析單位:企業
核心問題:全國最為詳細、所用最為廣泛的微觀資料庫,主要研究工業企業的相關問題。
具體內容:數據內容中的工業統計指標包括工業增加值、工業總產值、工業銷售產值等主要技術經濟指標以及主要財務成本指標和從業人員、工資總額等。
代表文章:楊汝岱. 中國製造業企業全要素生產率研究[J]. 經濟研究, 2015年02期.
網站連結:
http://www.allmyinfo.com/data/zggyqysjk.asp
2.海關資料庫
數據名稱:海關數據
執行機構:中國海關
開放數據年份:1994-2014年
調查方式:企業申報
採用計算機輔助調查:是
數據類型:面板數據
抽樣方式:企業主動上報匯總
覆蓋省份:全國各種類型進出口企業匯報
分析單位:企業
核心問題:主要是海關履行進出口貿易統計職能中產生的各項進出口統計數據,專注企業進出口情況。
具體內容:數據具體到各企業、各海關口岸的商品具體進出口情況。
網站連結:http://new.ccerdata.cn/Home/Special
3.CPES
數據名稱:中國私營企業調查(Chinese Private Enterprise Survey)
執行機構:中國社會科學院私營企業主群體研究中心
開放數據年份:
1993、1995、1997、2000、2002、2004、2006、2008、2010、2012、2014
調查方式:抽樣調查
採用計算機輔助調查:否
數據類型:截面數據
抽樣方式:在全國範圍內按一定比例(0.05%左右,每次的比例略有差別)進行多階段抽樣。
覆蓋省份:針對中國大陸31個省、自治區、直轄市203萬戶私營企業和企業主
分析單位:私營企業和企業主
核心問題:針對私營企業和私營企業主的綜合狀況進行調查,內容詳細,關注和研究我國私營企業發展。
具體內容:本調查是目前國內關於私營企業的全國性調查中對於私營企業主個人特徵,尤其是社會和政治特徵的調查最為集中的一項,且運用全面、系統、翔實的調查數據,對私營經濟與私營企業主階層的成長過程做了記錄。
代表文章:政治資本、人力資本與行政壟斷行業進入——基於中國私營企業調查的實證研究[J].中國工業經濟,2012年09期
網站連結:http://finance.sina.com.cn/nz/pr/
4.世界銀行中國企業調查數據
數據名稱:企業調查數據(Enterprise Surveys Data)
執行機構:世界銀行
開放數據年份:2002、2003、2005、2012
調查方式:抽樣調查、面對面調查
採用計算機輔助調查:否
數據類型:截面數據
抽樣方式:主要針對一些國家的非農企業進行抽樣調查,調査樣本根據企業註冊域名採用分層隨機抽樣的方法獲取。
覆蓋範圍:中國大陸
分析單位:企業
核心問題:主要關注一個國家的商業環境變化以及公司效率和性能特徵
具體內容:以2012年的數據為例,調査涉及企業位於大連、北京、石家莊、鄭州、深圳、成都等25個城市,涵蓋中國東、中、西三大區域;調查對象為企業總經理、人力資源經理、會計師或者其他職員。調查涉及食品製造業、紡織業、服裝業、基本金屬製造業、電子工業、交通設備製造業等2 0 多個行業;調查內容包括企業基本信息、城市基礎設施和公共服務、銷售和供貨、市場競爭程度、用地和行政許可、創新和技術、融資、政商關係、用工、商業環境及企業績效等多個方面。
代表文章:呂鐵,王海成,勞動力市場管制對企業技術創新的影響——基於世界銀行中國企業調查數據的分析[J].中國人口科學,2015年04期
網站連結:
http://www.enterprisesurveys.org/data
5.中國專利資料庫
數據名稱:中國專利資料庫
執行機構:國家知識產權局和中國專利信息中心
開放數據年份:1985-2015年
調查方式:企業申報
採用計算機輔助調查:是
數據類型:面板數據
抽樣方式:企業主動上報匯總
覆蓋省份:全國各種類型企業專利申請
分析單位:企業
核心問題:準確地反映中國最新的專利發明
具體內容:該系統收錄了中國自1985年實施專利制度以來的全部中國專利數據,具有較高的權威性,網上數據每周更新一次,是國內最好的專利資料庫檢索系統之一。
代表文章:莊濤,吳洪,基於專利數據的我國官產學研三螺旋測度研究——兼論政府在產學研合作中的作用[J].管理世界,2013年08期
網站連結:
http://new.ccerdata.cn/Home/Special#h3
http://202.107.204.54:8080/cnipr/main.do?method=gotoMain
6.農村經濟研究中心農村固定觀察點
數據名稱:農村經濟研究中心農村固定觀察點數據
執行機構:農業部農村經濟研究中心
開放數據年份:不開放,需申請
調查方式:固定點觀察
採用計算機輔助調查:否
數據類型:追蹤調查
抽樣方式:內部統計制度,1990年由國家統計局正式批准。
覆蓋省份:目前有調查農戶23000戶,調查村360個行政村,樣本分布在全國除港澳臺外的31個省(區、市)。
分析單位:農戶
核心問題:通過觀察點對農村社會經濟進行長期的連續調查,掌握生產力、生產關係和上層建築領域的變化,了解不同村莊和農戶的動態、要求,從而取得系統周密的資料。
具體內容:其主要工作是:一是常規調查:每年底按統一口徑全面收集所有樣本村、戶數據;二是專題調查:根據上級領導的指示及有關部門的安排,針對農村發展、農業生產和農戶生產生活中的焦點、重點問題,每年開展多項專題調查;三是動態反映:省、縣兩級調查機構及時反映當地農村中出現的新情況和新問題。
代表文章:林本喜,鄧衡山,農業勞動力老齡化對土地利用效率影響的實證分析——基於浙江省農村固定觀察點數據[J].中國農村經濟,2012年04期.
網站連結:
http://www.moa.gov.cn/sydw/ncjjzx/gcdgzdt/gzdtg/201302/t20130225_3225848.htm
7.CFPS
數據名稱:中國家庭追蹤調查(China Family Panel Studies)
執行機構:北京大學中國社會科學調查中心
開放數據年份:
2008/2009(測試調查)、2010/2011/2012/2014(全國調查)
調查方式:面訪、電訪
採用計算機輔助調查:是
數據類型:追蹤調查
抽樣方式:多階段、內隱分層和與人口規模成比例抽樣
覆蓋省份:25個省
受訪者:家庭戶中的所有成人及少兒成員。基因成員為長期追蹤對象。
分析單位:個人、家庭、社區
核心問題:中國家庭及個人的各種經濟性與社會性的福利及其變遷。
具體內容:村/居概況、家庭結構及關係、家庭經濟、個人的工作、遷移、教育、婚姻、健康、態度觀念、認知能力和社會交往等。
代表文章:胡楓,陳玉宇. 社會網絡與農戶借貸行為——來自中國家庭動態跟蹤調查(CFPS)的證據[J]. 金融研究,2012,12:178-192.
網站連結:http://www.isss.edu.cn/cfps/
8.CHARLS
數據名稱:中國健康與養老追蹤調查(China Health and Retirement Longitudinal Study)
執行機構:北京大學國家發展研究院
開放數據年份:
2008、2012(兩省)、2011、2013、2014(全國)
調查方式:面訪
採用計算機輔助調查:是
數據類型:追蹤調查
抽樣方式:多階段抽樣,縣/區和村居抽樣階段均採取PPS抽樣方法
覆蓋省份:甘肅、浙江(2008/2012);28個省(2011/2013)
受訪者:適齡家戶至少一名年滿45歲的中老年人及其配偶(動態增加樣本)
分析單位:個人/家庭
核心問題:養老與健康
具體內容:個人基本信息,家庭結構和經濟支持,健康狀況,體格測量,醫療服務利用和醫療保險,工作、退休和養老金、收入、消費、資產,以及社區基本情況等。
代表文章:姚瑤,劉斌,劉國恩,臧文斌. 醫療保險、戶籍制度與醫療服務利用——基於CHARLS數據的實證分析[J]. 保險研究,2014,06:105-116.
網站連結:http://charls.ccer.edu.cn
9.中國家庭金融調查(CHFS)
數據名稱:中國家庭金融調查(China Household Finance Survey)
執行機構:西南財經大學中國家庭金融調查與研究中心
開放數據年份:2011、2013
調查方式:面訪
採用計算機輔助調查:是
數據類型:追蹤調查
抽樣方式:多階段抽樣,縣/區和村居抽樣階段均採取PPS抽樣方法
覆蓋省份:25個省(2011)、29個省(2013)
受訪者:家庭中選取一名18歲以上且了解家庭財務狀況的成人
分析單位:個人/家庭
核心問題:家庭經濟與金融
具體內容:住房資產和金融財富;負債和信貸約束;收入;消費;社會保障和保險;代際的轉移支付;人口特徵和就業情況;支付習慣等
代表文章:尹志超,宋全雲,吳雨. 金融知識、投資經驗與家庭資產選擇[J]. 經濟研究,2014,04:62-75.
網站連結:http://chfs.swufe.edu.cn/
10.CHIPS
數據名稱:中國家庭收入調查(China Household Income Projects)
執行機構:北京師範大學
開放數據年份:1988、1995、2002、2007
調查方式:面訪
採用計算機輔助調查:否
數據類型:截面數據
抽樣方式:國家統計局城鄉居民收入調查的樣本
覆蓋省份:19個省(1995);22個省(2002)
受訪者:抽中家庭戶中全部18歲以上人員
分析單位:個人/家庭
核心問題:收入水平
具體內容:收入、消費、就業、生產等方面
代表文章:趙西亮,梁文泉,李實. 房價上漲能夠解釋中國城鎮居民高儲蓄率嗎?——基於CHIP微觀數據的實證分析[J]. 經濟學(季刊),2014,01:81-102.
網站連結:http://www.ciidbnu.org/chip
11.CHNS
數據名稱:中國健康與營養調查(China Health and Nutrition Survey)
執行機構:北卡羅來納大學人口研究中心、美國國家營養與食物安全研究所和中國疾病與預防控制中心
開放數據年份:
1989、1991、1993、1997、2000、2004、2006
調查方式:面訪
採用計算機輔助調查:否
數據類型:追蹤調查
抽樣方式:多階段整群抽樣
覆蓋省份:遼寧、黑龍江、江蘇、山東、河南、湖北、湖南、廣西和貴州9個省(不同調查年份不同)
受訪者:家庭戶成員
分析單位:個人、家庭、社區
核心問題:人口健康和營養狀況
具體內容:住戶、營養、健康、成人、兒童、社區等
代表文章:尹志超,甘犁. 香菸、美酒和收入[J]. 經濟研究,2010,10:90-100+160.
網站連結:
http://www.phsciencedata.cn/Share/ky_sjml.jsp?id=15883803-f005-408e-b4c9-f13697f5a19f
12.CGSS
數據名稱:中國綜合社會調查(Chinese General Social Survey)
執行機構:中國人民大學社會學系
開放數據年份:
2003、2005、2006、2008、2010、2011、2012、2013
調查方式:面訪
採用計算機輔助調查:否
數據類型:截面數據
抽樣方式:多階段分層PPS隨機抽樣
覆蓋省份:28省
受訪者:在選取的家庭中隨機抽取1名18歲以上的成人
分析單位:個人/家庭
核心問題:社會變遷
具體內容:價值觀、健康、家庭、教育、勞動力、職業、心理、個性等
代表文章:劉軍強,熊謀林,蘇陽. 經濟增長時期的國民幸福感——基於CGSS數據的追蹤研究[J]. 中國社會科學,2012,12:82-102+207-208.
網站連結:http://www.chinagss.org/
13.RUMIC
數據名稱:中國城鄉流動資料庫(Rural-Urban Migration in China)
執行機構:澳大利亞國立大學、北京師範大學
開放數據年份:2008、2009
調查方式:面訪
採用計算機輔助調查:是
數據類型:追蹤數據
覆蓋省份:本項目主要在人口流出或流入的大省進行調查。其中,農村住戶調查是在以下9個省(直轄市)進行:安徽,重慶,廣東,河北,河南,湖北,江蘇,四川,浙江;城市流動人口調查是在以下15個城市進行:蚌埠,成都,重慶,東莞,廣州,合肥,杭州,洛陽,南京,寧波,上海,深圳,武漢,無錫,鄭州。城鎮住戶調查是在19個城市進行,包括城市流動人口調查以外的四個城市:安陽市,建德市,樂山,綿陽。
分析單位:個人/家庭
核心問題:人口流動的福利問題
具體內容:調查問卷涉及個人和家庭層面的信息如家庭構成、成人教育、成人就業、家庭資產等。
代表文章:溫興祥. 城鎮化進程中外來居民和本地居民的收入差距問題[J]. 人口研究,2014,02:61-70.
網站連結:
https://www.iza.org/organization/idsc?page=27&id=58
14.UHS
數據名稱:中國城鎮住戶調查數據(Urban Household Survey)
執行機構:國家統計局
開放數據年份:不開放
調查方式:面訪
採用計算機輔助調查:否
數據類型:追蹤數據
覆蓋省份:現在大家使用的是六個省份的數據(北京、廣東、浙江、遼寧、陝西、四川)。每年大約有3500-4000戶的數據。
分析單位:個人/家庭
核心問題:這是現有的最全的全國範圍的微觀變量數據,主要研究教育回報率、收入不平等、家庭消費、家庭金融等問題。
具體內容:調查主要包含個人和家庭層次的變量。如與戶主關係,性別、年齡、家庭總收入、家庭消費等。
代表文章:謝潔玉,吳斌珍,李宏彬,鄭思齊. 中國城市房價與居民消費[J]. 金融研究,2012,06:13-27.
網站連結:無
15.CLHLS
數據名稱:中國老年健康影響因素跟蹤調查(Chinese Longitudinal Healthy Longevity Survey)
執行機構:北京大學
開放數據年份:1998-2012
調查方式:面訪
採用計算機輔助調查:否
數據類型:追蹤數據
覆蓋省份:CLHLS基線調查和跟蹤調查涵蓋了中國31個省中的23個。涵蓋區域總人口在1998年基線調查時9.85億,在2010年總人口為11.56億,大約佔全國總人數的85%。我們在22個調研省份(不包括海南省)中隨機選擇大約一半的市/縣作為調研點進行調查。
分析單位:個人
核心問題:本項目的研究目標旨在更好地理解影響人類健康長壽的社會、行為、環境與生物學因素,為科學研究、老齡工作與衛生健康政策信息依據填補空白。
具體內容:主要搜集老人死亡年月、死因、死前健康與生活自理能力等信息。在2008年調查中,我們還從大約14,000位年齡在40-110歲的自願受訪者中收集了唾液DNA樣本,在2009年和2012年的8個健康長壽典型調研地區的調研中,我們採集了約4800位被訪者的血液和尿樣樣本。另外,在1998年的基線調查中,我們搜集了4,116名80+歲高齡老人的指尖血樣樣本。
代表文章:顧和軍,劉雲平. 教育和培訓對中國城鎮勞動力就業的影響——基於CLHLS數據的經驗研究[J]. 人口與經濟, 2013年01期.
網站連結:
http://web5.pku.edu.cn/ageing/html/datadownload.html
文章來源:微信公眾訂閱號「管理學季刊」2017年6月5日(本文僅代表作者個人觀點)
本篇編輯:王昌耀返回搜狐,查看更多
責任編輯: