【分享】中國15個大型微觀資料庫匯總

2020-12-01 搜狐網

原標題:【分享】中國15個大型微觀資料庫匯總

編者按:

經濟學的量化趨勢使得數據在日常經濟學研究中的地位愈加重要,經濟學者們也越來越依靠資料庫尤其是微觀資料庫進行學術研究。筆者參考了國內很多關於資料庫知識的整理,發現很多關於資料庫的簡介過於粗略或者不夠全面,遺漏了很多重要的資料庫。現將國內常用的微觀資料庫的主要信息進行重新整理匯總,方便大家查詢與應用。敬請閱讀。

1.中國工業企業資料庫

數據名稱中國工業企業資料庫(China Industry Business Performance Data

執行機構:國家統計局

開放數據年份:1998-2013

調查方式:下級企業單位按時報送

採用計算機輔助調查:

數據類型:面板數據

抽樣方式:根據國家統計局擬訂的工業企業報表制度抽樣

覆蓋省份:中國大陸地區銷售額500萬元/RMB以上的大中型製造企業

分析單位:企業

核心問題:全國最為詳細、所用最為廣泛的微觀資料庫,主要研究工業企業的相關問題。

具體內容:數據內容中的工業統計指標包括工業增加值、工業總產值、工業銷售產值等主要技術經濟指標以及主要財務成本指標和從業人員、工資總額等。

代表文章:楊汝岱. 中國製造業企業全要素生產率研究[J]. 經濟研究, 201502.

網站連結:

http://www.allmyinfo.com/data/zggyqysjk.asp

2.海關資料庫

數據名稱:海關數據

執行機構:中國海關

開放數據年份:1994-2014

調查方式:企業申報

採用計算機輔助調查:

數據類型:面板數據

抽樣方式:企業主動上報匯總

覆蓋省份:全國各種類型進出口企業匯報

分析單位:企業

核心問題:主要是海關履行進出口貿易統計職能中產生的各項進出口統計數據,專注企業進出口情況。

具體內容:數據具體到各企業、各海關口岸的商品具體進出口情況。

網站連結:http://new.ccerdata.cn/Home/Special

3.CPES

數據名稱:中國私營企業調查Chinese Private Enterprise Survey

執行機構:中國社會科學院私營企業主群體研究中心

開放數據年份:

19931995199720002002200420062008201020122014

調查方式:抽樣調查

採用計算機輔助調查:

數據類型:截面數據

抽樣方式:在全國範圍內按一定比例(0.05%左右,每次的比例略有差別)進行多階段抽樣。

覆蓋省份:針對中國大陸31個省、自治區、直轄市203萬戶私營企業和企業主

分析單位:私營企業和企業主

核心問題:針對私營企業和私營企業主的綜合狀況進行調查,內容詳細,關注和研究我國私營企業發展。

具體內容:本調查是目前國內關於私營企業的全國性調查中對於私營企業主個人特徵,尤其是社會和政治特徵的調查最為集中的一項,且運用全面、系統、翔實的調查數據,對私營經濟與私營企業主階層的成長過程做了記錄。

代表文章:政治資本、人力資本與行政壟斷行業進入——基於中國私營企業調查的實證研究[J].中國工業經濟,201209

網站連結:http://finance.sina.com.cn/nz/pr/

4.世界銀行中國企業調查數據

數據名稱:企業調查數據(Enterprise Surveys Data

執行機構:世界銀行

開放數據年份:2002200320052012

調查方式:抽樣調查、面對面調查

採用計算機輔助調查:

數據類型:截面數據

抽樣方式:主要針對一些國家的非農企業進行抽樣調查,調査樣本根據企業註冊域名採用分層隨機抽樣的方法獲取。

覆蓋範圍:中國大陸

分析單位:企業

核心問題:主要關注一個國家的商業環境變化以及公司效率和性能特徵

具體內容:2012年的數據為例,調査涉及企業位於大連、北京、石家莊、鄭州、深圳、成都等25個城市,涵蓋中國東、中、西三大區域;調查對象為企業總經理、人力資源經理、會計師或者其他職員。調查涉及食品製造業、紡織業、服裝業、基本金屬製造業、電子工業、交通設備製造業等2 0 多個行業;調查內容包括企業基本信息、城市基礎設施和公共服務、銷售和供貨、市場競爭程度、用地和行政許可、創新和技術、融資、政商關係、用工、商業環境及企業績效等多個方面。

代表文章:呂鐵,王海成,勞動力市場管制對企業技術創新的影響——基於世界銀行中國企業調查數據的分析[J].中國人口科學,201504

網站連結:

http://www.enterprisesurveys.org/data

5.中國專利資料庫

數據名稱:中國專利資料庫

執行機構:國家知識產權局和中國專利信息中心

開放數據年份:1985-2015

調查方式:企業申報

採用計算機輔助調查:

數據類型:面板數據

抽樣方式:企業主動上報匯總

覆蓋省份:全國各種類型企業專利申請

分析單位:企業

核心問題:準確地反映中國最新的專利發明

具體內容:該系統收錄了中國自1985年實施專利制度以來的全部中國專利數據,具有較高的權威性,網上數據每周更新一次,是國內最好的專利資料庫檢索系統之一。

代表文章:莊濤,吳洪,基於專利數據的我國官產學研三螺旋測度研究——兼論政府在產學研合作中的作用[J].管理世界,201308

網站連結:

http://new.ccerdata.cn/Home/Special#h3

http://202.107.204.54:8080/cnipr/main.do?method=gotoMain

6.農村經濟研究中心農村固定觀察點

數據名稱:農村經濟研究中心農村固定觀察點數據

執行機構:農業部農村經濟研究中心

開放數據年份:不開放,需申請

調查方式:固定點觀察

採用計算機輔助調查:

數據類型:追蹤調查

抽樣方式:內部統計制度,1990年由國家統計局正式批准。

覆蓋省份:目前有調查農戶23000戶,調查村360個行政村,樣本分布在全國除港澳臺外的31個省(區、市)。

分析單位:農戶

核心問題:通過觀察點對農村社會經濟進行長期的連續調查,掌握生產力、生產關係和上層建築領域的變化,了解不同村莊和農戶的動態、要求,從而取得系統周密的資料。

具體內容:其主要工作是:一是常規調查:每年底按統一口徑全面收集所有樣本村、戶數據;二是專題調查:根據上級領導的指示及有關部門的安排,針對農村發展、農業生產和農戶生產生活中的焦點、重點問題,每年開展多項專題調查;三是動態反映:省、縣兩級調查機構及時反映當地農村中出現的新情況和新問題。

代表文章:林本喜,鄧衡山,農業勞動力老齡化對土地利用效率影響的實證分析——基於浙江省農村固定觀察點數據[J].中國農村經濟,201204.

網站連結:

http://www.moa.gov.cn/sydw/ncjjzx/gcdgzdt/gzdtg/201302/t20130225_3225848.htm

7.CFPS

數據名稱:中國家庭追蹤調查(China Family Panel Studies

執行機構:北京大學中國社會科學調查中心

開放數據年份:

2008/2009(測試調查)2010/2011/2012/2014(全國調查)

調查方式:面訪、電訪

採用計算機輔助調查:

數據類型:追蹤調查

抽樣方式:多階段、內隱分層和與人口規模成比例抽樣

覆蓋省份:25個省

受訪者:家庭戶中的所有成人及少兒成員。基因成員為長期追蹤對象。

分析單位:個人、家庭、社區

核心問題:中國家庭及個人的各種經濟性與社會性的福利及其變遷。

具體內容:村/居概況、家庭結構及關係、家庭經濟、個人的工作、遷移、教育、婚姻、健康、態度觀念、認知能力和社會交往等。

代表文章:胡楓,陳玉宇. 社會網絡與農戶借貸行為——來自中國家庭動態跟蹤調查(CFPS)的證據[J]. 金融研究,2012,12:178-192.

網站連結:http://www.isss.edu.cn/cfps/

8.CHARLS

數據名稱:中國健康與養老追蹤調查(China Health and Retirement Longitudinal Study

執行機構:北京大學國家發展研究院

開放數據年份:

20082012(兩省)、201120132014(全國)

調查方式:面訪

採用計算機輔助調查:

數據類型:追蹤調查

抽樣方式:多階段抽樣,縣/區和村居抽樣階段均採取PPS抽樣方法

覆蓋省份:甘肅、浙江(2008/2012);28個省(2011/2013

受訪者:適齡家戶至少一名年滿45歲的中老年人及其配偶(動態增加樣本)

分析單位:個人/家庭

核心問題:養老與健康

具體內容:個人基本信息,家庭結構和經濟支持,健康狀況,體格測量,醫療服務利用和醫療保險,工作、退休和養老金、收入、消費、資產,以及社區基本情況等。

代表文章:姚瑤,劉斌,劉國恩,臧文斌. 醫療保險、戶籍制度與醫療服務利用——基於CHARLS數據的實證分析[J]. 保險研究,2014,06:105-116.

網站連結:http://charls.ccer.edu.cn

9.中國家庭金融調查(CHFS

數據名稱:中國家庭金融調查(China Household Finance Survey

執行機構:西南財經大學中國家庭金融調查與研究中心

開放數據年份:20112013

調查方式:面訪

採用計算機輔助調查:

數據類型:追蹤調查

抽樣方式:多階段抽樣,縣/區和村居抽樣階段均採取PPS抽樣方法

覆蓋省份:25個省(2011)、29個省(2013

受訪者:家庭中選取一名18歲以上且了解家庭財務狀況的成人

分析單位:個人/家庭

核心問題:家庭經濟與金融

具體內容:住房資產和金融財富;負債和信貸約束;收入;消費;社會保障和保險;代際的轉移支付;人口特徵和就業情況;支付習慣等

代表文章:尹志超,宋全雲,吳雨. 金融知識、投資經驗與家庭資產選擇[J]. 經濟研究,2014,04:62-75.

網站連結:http://chfs.swufe.edu.cn/

10.CHIPS

數據名稱:中國家庭收入調查(China Household Income Projects

執行機構:北京師範大學

開放數據年份:1988199520022007

調查方式:面訪

採用計算機輔助調查:

數據類型:截面數據

抽樣方式:國家統計局城鄉居民收入調查的樣本

覆蓋省份:19個省(1995);22個省(2002

受訪者:抽中家庭戶中全部18歲以上人員

分析單位:個人/家庭

核心問題:收入水平

具體內容:收入、消費、就業、生產等方面

代表文章:趙西亮,梁文泉,李實. 房價上漲能夠解釋中國城鎮居民高儲蓄率嗎?——基於CHIP微觀數據的實證分析[J]. 經濟學(季刊),2014,01:81-102.

網站連結:http://www.ciidbnu.org/chip

11.CHNS

數據名稱:中國健康與營養調查(China Health and Nutrition Survey

執行機構:北卡羅來納大學人口研究中心、美國國家營養與食物安全研究所和中國疾病與預防控制中心

開放數據年份:

1989199119931997200020042006

調查方式:面訪

採用計算機輔助調查:

數據類型:追蹤調查

抽樣方式:多階段整群抽樣

覆蓋省份:遼寧、黑龍江、江蘇、山東、河南、湖北、湖南、廣西和貴州9個省(不同調查年份不同)

受訪者:家庭戶成員

分析單位:個人、家庭、社區

核心問題:人口健康和營養狀況

具體內容:住戶、營養、健康、成人、兒童、社區等

代表文章:尹志超,甘犁. 香菸、美酒和收入[J]. 經濟研究,2010,10:90-100+160.

網站連結:

http://www.phsciencedata.cn/Share/ky_sjml.jsp?id=15883803-f005-408e-b4c9-f13697f5a19f

12.CGSS

數據名稱:中國綜合社會調查(Chinese General Social Survey

執行機構:中國人民大學社會學系

開放數據年份:

20032005200620082010201120122013

調查方式:面訪

採用計算機輔助調查:

數據類型:截面數據

抽樣方式:多階段分層PPS隨機抽樣

覆蓋省份:28

受訪者:在選取的家庭中隨機抽取118歲以上的成人

分析單位:個人/家庭

核心問題:社會變遷

具體內容:價值觀、健康、家庭、教育、勞動力、職業、心理、個性等

代表文章:劉軍強,熊謀林,蘇陽. 經濟增長時期的國民幸福感——基於CGSS數據的追蹤研究[J]. 中國社會科學,2012,12:82-102+207-208.

網站連結:http://www.chinagss.org/

13.RUMIC

數據名稱:中國城鄉流動資料庫(Rural-Urban Migration in China

執行機構:澳大利亞國立大學、北京師範大學

開放數據年份:20082009

調查方式:面訪

採用計算機輔助調查:

數據類型:追蹤數據

覆蓋省份:本項目主要在人口流出或流入的大省進行調查。其中,農村住戶調查是在以下9個省(直轄市)進行:安徽,重慶,廣東,河北,河南,湖北,江蘇,四川,浙江;城市流動人口調查是在以下15個城市進行:蚌埠,成都,重慶,東莞,廣州,合肥,杭州,洛陽,南京,寧波,上海,深圳,武漢,無錫,鄭州。城鎮住戶調查是在19個城市進行,包括城市流動人口調查以外的四個城市:安陽市,建德市,樂山,綿陽。

分析單位:個人/家庭

核心問題:人口流動的福利問題

具體內容:調查問卷涉及個人和家庭層面的信息如家庭構成、成人教育、成人就業、家庭資產等。

代表文章:溫興祥. 城鎮化進程中外來居民和本地居民的收入差距問題[J]. 人口研究,2014,02:61-70.

網站連結:

https://www.iza.org/organization/idsc?page=27&id=58

14.UHS

數據名稱:中國城鎮住戶調查數據(Urban Household Survey

執行機構:國家統計局

開放數據年份:不開放

調查方式:面訪

採用計算機輔助調查:

數據類型:追蹤數據

覆蓋省份:現在大家使用的是六個省份的數據(北京、廣東、浙江、遼寧、陝西、四川)。每年大約有3500-4000戶的數據。

分析單位:個人/家庭

核心問題:這是現有的最全的全國範圍的微觀變量數據,主要研究教育回報率、收入不平等、家庭消費、家庭金融等問題。

具體內容:調查主要包含個人和家庭層次的變量。如與戶主關係,性別、年齡、家庭總收入、家庭消費等。

代表文章:謝潔玉,吳斌珍,李宏彬,鄭思齊. 中國城市房價與居民消費[J]. 金融研究,2012,06:13-27.

網站連結:無

15.CLHLS

數據名稱:中國老年健康影響因素跟蹤調查(Chinese Longitudinal Healthy Longevity Survey

執行機構:北京大學

開放數據年份:1998-2012

調查方式:面訪

採用計算機輔助調查:

數據類型:追蹤數據

覆蓋省份:CLHLS基線調查和跟蹤調查涵蓋了中國31個省中的23個。涵蓋區域總人口在1998年基線調查時9.85億,在2010年總人口為11.56億,大約佔全國總人數的85%。我們在22個調研省份(不包括海南省)中隨機選擇大約一半的市/縣作為調研點進行調查。

分析單位:個人

核心問題:本項目的研究目標旨在更好地理解影響人類健康長壽的社會、行為、環境與生物學因素,為科學研究、老齡工作與衛生健康政策信息依據填補空白。

具體內容:主要搜集老人死亡年月、死因、死前健康與生活自理能力等信息。在2008年調查中,我們還從大約14,000位年齡在40-110歲的自願受訪者中收集了唾液DNA樣本,在2009年和2012年的8個健康長壽典型調研地區的調研中,我們採集了約4800位被訪者的血液和尿樣樣本。另外,在1998年的基線調查中,我們搜集了4,11680+歲高齡老人的指尖血樣樣本。

代表文章:顧和軍,劉雲平. 教育和培訓對中國城鎮勞動力就業的影響——基於CLHLS數據的經驗研究[J]. 人口與經濟, 201301.

網站連結:

http://web5.pku.edu.cn/ageing/html/datadownload.html

文章來源:微信公眾訂閱號「管理學季刊」201765日(本文僅代表作者個人觀點)

本篇編輯:王昌耀返回搜狐,查看更多

責任編輯:

相關焦點

  • circRNADb:首個匯總編碼蛋白環狀RNA的資料庫
    10月11日,Nature出版集團子刊Scientific Reports在線發表了南京醫科大學Li Yan團隊的一項重要環狀RNA研究成果,介紹開發了首個匯總可編碼蛋白的環狀RNA的資料庫:circRNADb(Chen et al., 2016)。
  • 常用的模式生物資料庫匯總
    模式生物在科研中的重要地位不必多說,今天給大家匯總了一下常用的模式生物資料庫
  • 大型有機物鍵能資料庫(iBonD)簡介
    該資料庫填補了國內外空白,可為廣大研究人員的有機合成理性設計、反應機理研究、產物選擇性預測等提供堅實的數據支撐,具有重要的學術意義和工業價值。圖1  iBonD資料庫主界面作為國際上首個大型、綜合性權威鍵能資料庫,iBonD在保證數據可靠性的同時,也充分兼顧用戶體驗,切實做到使用便捷、重點突出。
  • 12月在線資料庫匯總|資料庫|甲基化|DNA|標誌物|預測|分析|-健康界
    在12月期間,總共發表了醫學相關在線資料庫47個。下面就來給大家介紹一下主要有哪些資料庫,以及筆者比較感興趣的資料庫。1. 疾病與藥物相關資料庫疾病和藥物相關的資料庫一共有5個。涉及到多種不同的疾病。
  • 法律糾紛延遲大型毒性資料庫啟動
    圖片來源:Siqui Sanchez 研究人員表示,一個包含近萬種化學物質的大型健康風險資料庫或將讓預測此前不存在任何數據的千萬種消費化學品的毒性變得更加容易。但相關法律爭議卻意味著,他們不能像希望的那樣公開這一資料庫。 「這個資料庫具有能夠挽救數百萬動物的潛力,還能降低數千萬美元的檢測成本。」
  • 微觀調查資料庫大全!
    分析單位:個人(學生、家長、教師、校領導)覆蓋區域:中國28個縣級單位(縣、區、市)112所學校、438個班級核心問題:揭示家庭、學校、社區以及宏觀社會結構對於個人教育產出的影響數據網址:http://ceps.ruc.edu.cn
  • 實踐分享:ACCESS資料庫導入mysql資料庫
    作為程式設計師很多時候要進行不同資料庫之間的導入導出工作,這樣是為了節省數據錄入的時間。下面我就和大家分享一下如何把數據從ACCESS資料庫導入mysql資料庫。那有沒有辦法把access資料庫轉換成sql語句呢。下面本文的重點出現了,使用「DB2mysql.exe」工具,可以很方便的把access資料庫轉換成一句句的"insert into table"sql語句。生產了sql語句,就是直接複製語句粘貼到phpmyadmin總,運行即可。下面是軟體操作截圖。
  • 史上最全的lncRNA資料庫大全及心得分享
    雖然老談一直默默覺得部分lncRNA就是伸長了的miRNA,其作用機制比較類似,但有關所有lncRNA全方面的功能研究還需要進一步的探索。小夥伴們更需要裝配研究的利器,幫助我們在尋求相關lncRNA信息時能夠手到拈來,不費吹灰之力!今天老談就跟大家分享一些研究lncRNA的資料庫,幫助大家做好科研準備工作。當然lncRNA資料庫較之於miRNA可能相對較少,畢竟後者的研究已經非常成熟。
  • 最新版《中國評價核資料庫》發布
    自1991年開始,《中國評價核資料庫》已成為國際公認的五大主流核資料庫之一,得到國際核數據界的高度認同,我國核數據研究水平在國際核數據界取得了與我國國際地位相符的地位。通過全國核數據工作協作網各成員單位的共同努力,先後完成了多期核數據任務,取得了許多重要成果,並於1985年完成發行中國評價核資料庫第一版CENDL-1,包含37個核素,中子能區從1keV-20MeV,滿足了當時國內核工程對核數據急需,也為我國核數據評價和核資料庫開闢了道路,奠定了基礎。
  • 中國社科院 發布皮書資料庫
    原標題:中國社科院 發布皮書資料庫  科技日報訊 (記者束洪福)中國社會科學院1月9日在京發布2014年度創新工程重大科研成果·皮書資料庫。該資料庫以皮書系列研究報告為基礎,全面整合中國發展與中國經驗、世界經濟與國際關係領域的研究文獻、實證報告、調研數據和媒體資訊,特別是引進機器標引、實現人機二次標引互查,提高了標引精確度。
  • 環狀RNA(circRNA)資料庫大匯總,快來看看有沒有你需要的!
    國內外環狀 RNA 領域發表 SCI 文章對於研究 circRNA 的小夥伴們來說, 總有那麼幾個讓他們愛不舍手的助力神器, 今天小編就來給大家匯總幾個常用的 circRNA 資料庫或在線軟體Circbase(http://cirbase.org/) 這個資料庫收集了幾千條在真核細胞表達的 circRNAs,是個公共 circRNA 數據集, 有相應 circRNA 詳細信息,還可以下載 circRNA 序列。
  • 法律糾紛延遲大型毒性資料庫啟動—新聞—科學網
    圖片來源:Siqui Sanchez 研究人員表示,一個包含近萬種化學物質的大型健康風險資料庫或將讓預測此前不存在任何數據的千萬種消費化學品的毒性變得更加容易。但相關法律爭議卻意味著,他們不能像希望的那樣公開這一資料庫。 【《自然》網站相關報導】 「這個資料庫具有能夠挽救數百萬動物的潛力,還能降低數千萬美元的檢測成本。」
  • 腦與神經類開放資料庫匯總
    歡迎關注我們,選擇加"星標"或「置頂」更多技術,第一時間送達感謝"腦機接口交流群"群友:文 分享的「利用開放數據進行心理學研究
  • 全球經濟總量75%國家涉氫,超20個國家級氫能規劃匯總
    全球經濟總量75%國家涉氫,超20個國家級氫能規劃匯總 2020-11-21 00:01 來源:澎湃新聞·澎湃號·湃客
  • 化學鍵能資料庫iBonD在京發布
    化學鍵能資料庫iBonD在京發布來源:中國科學報 2016-3-17 鍾華  3月15日,清華大學基礎分子科學中心和南開大學元素有機化學國家重點實驗室程津培教授研究組在京發布了國際上首個涵蓋全面、數據可靠、使用快捷方便、專業權威的網絡版化學鍵能資料庫iBonD1.0版。
  • 中國要不要建造大型強子對撞機?你是支持楊振寧,還是反對
    大型強子對撞機是用來拆分原子結構的裝置,可以把原子拆分成更小的微觀粒子,以便於科學家對量子力學的研究,而如果沒有大型強子對撞機,微觀領域的研究很難進行,說到底,大型強子對撞機是研究量子領域的標準配置,重要性毋庸置疑。
  • 中國學者又發現2個能預測PD-1神效的基因
    近期,中國的兩個研究團隊,又發現了兩個全新的可以預測PD-1抗體神效的基因突變。相比於早期腫瘤,晚期腫瘤中TERT突變陽性率更高,分別是5.5%和15.2%。此外,TERT突變的患者,腫瘤突變負荷TMB相對而言更高,分別是6-9個突變/MB和17-20個突變/Mb。在所有人群中,攜帶TERT突變的患者,生存期更短,中位總生存期分別是113個月和38個月。這意味著TERT突變的患者,惡性程度更高,更難治療。
  • 全球經濟總量75%國家涉氫,超20個國家級氫能源戰略規劃匯總
    據氫雲鏈氫能產業資料庫中了解到,全球目前已經有超過20個國家或聯盟發布或制定了《國家氫能戰略》,這些國家和聯盟佔世界經濟總量達到了75%。其中在政策規劃數量上歐洲佔比最高。超20個國家發布氫能發展戰略規劃匯總氫雲鏈對國外氫能產業發展規划進行了整理,詳見表1。
  • 《自然》發表人類遺傳變異體大型資料庫研究成果
    新華社倫敦5月27日電(記者張家偉)英國《自然》雜誌及其子刊27日在線發表了基因組聚集資料庫(gnomAD)團隊的系列研究論文,介紹了研究人員對這個大型資料庫的多方面分析,其結果有助人們深入認識人類基因功能,提升對罕見和常見遺傳病的理解。基因組聚集資料庫(gnomAD)是一個大規模的人類遺傳變異體資料庫,匯集了來自不同人群的外顯子組數據和全基因組數據,全球多國研究人員參與分析。
  • 「十三五」石化業減排:宏觀、中觀、微觀一個都不能少
    對此,中國經濟導報記者採訪了中國化工節能技術協會理事長方曉驊,他表示,「十二五」期間,行業節能減排完成效果並不理想,「十三五」要宏觀、中觀、微觀三個層面結合,利用「網際網路+」的優勢,確保行業節能減排工作取得進一步發展。結構節能空間較大中國經濟導報記者:「十二五」時期,我國石化行業節能減排完成情況如何?取得了哪些成績?