中新網2月1日電 國家統計局網站今日發布統計局住戶調查辦公室主任王萍萍的署名文章《關於我國居民收入基尼係數測算的幾個問題》。
全文如下:
關於我國居民收入基尼係數測算的幾個問題國家統計局住戶調查辦公室主任 王萍萍
一、基尼係數的含義、方法及相關問題
基尼係數是衡量居民間收入差距的綜合指標。該指標由義大利經濟學家基尼在20世紀初提出。社會中每個人的收入都一樣、收入分配絕對平均時,基尼係數是0;全社會的收入都集中於1個人、收入分配絕對不平均時,基尼係數是1。現實生活中,兩種情況都不可能發生。每個人的收入有多有少,差距大時,基尼係數就高,差距小時,基尼係數就低。
基尼係數是根據洛倫茨曲線,即收入分布曲線計算的。在下圖中,橫軸是累計人口百分比,縱軸是累計收入百分比。對角線上的綠色斜線是絕對平均的收入分布線,黑色的縱線是絕對不平均的收入分布線,橙色的是通常見到的實際收入分布曲線。綠線與橙線之間的面積A,相當於用於不平均分配的那部分收入。基尼係數等於A/(A+B),經濟學含義是用於不平均分配的那部分收入佔全部收入的比例。
國際上並沒有一個組織或教科書給出最適合的基尼係數標準,但有不少人認為基尼係數小於0.2時,居民收入過於平均,0.2-0.3之間時較為平均,0.3-0.4之間時比較合理,0.4-0.5時差距過大,大於0.5時差距懸殊。通常而言,與面積或人口較小的國家相比,地域遼闊、人口眾多和自然環境差異較大國家的基尼係數會高一些。經濟處於起步階段或工業化前期的國家,基尼係數要大一些,而發達經濟體特別是實施高福利政策國家的基尼係數要小一些。
基尼係數需要使用分戶或分組的居民收入數據來計算。使用不同來源、不同口徑的收入基礎數據會得到不同的基尼係數。比如:收入指標是否規範、用總收入指標還是可支配收入指標、收入中是否包括政府的實物福利、是否扣除年度物價因素、是否扣除地區差價等等,都對基尼係數及變化趨勢有影響。在對基尼係數進行國際比較或時序比較時,需要注意到基礎數據的可比性。
基尼係數給出了反映居民之間貧富差異程度的數量界線,較全面客觀地反映居民之間的貧富差距,能預報、預警居民之間出現貧富兩極分化,但基尼係數這個差距指標也有局限性,在使用時需要注意:
一是基尼係數衡量的是收入相對差距。假如,每個家庭的收入都比基期年翻一番,雖然高收入戶增收的絕對額要大得多,但因為所有家庭收入增加的比例是一樣的,相對差距仍一樣,計算得到的基尼係數也是一樣的。
二是基尼係數反映的是收入總體差距。基尼係數的變化取決於所有居民的收入相對變化,其中某一群體相對於另一個群體的收入差距的變化有可能與基尼係數的變化趨勢是不一樣的。
三是基尼係數衡量了收入差距,卻不能衡量在哪裡存在分配不公。有些差距是公平合理的,比如,勞動者付出的勞動數量及質量不同,得到的收入有所不同是合理的。而有些差距是不公平的。需要進一步做深入的制度研究,找出差距原因並消除不公平分配現象。
二、測算基尼係數的基礎數據
根據各國通行做法,國家統計局使用全國城鄉住戶收支抽樣調查數據作為計算基尼係數的基礎。
2012年12月前,全國城鄉住戶收支調查共有14萬戶調查樣本。其中,農村住戶調查樣本7.4萬戶,按照分層多階段隨機抽樣方法抽取,分布在全國31個省(自治區、直轄市)的896個縣;城鎮住戶調查樣本6.6萬戶,按照分層二相隨機抽樣方法抽取,分布在全國31個省(自治區、直轄市)的476個市、縣。收支調查結果對全國和分省、分城鄉具有代表性。
城鄉居民收入調查過程可以分為抽樣、記帳、錄入、審核、匯總等多道「工序」,其中還包括多個數據質量控制環節。調查戶按照統一規則,隨時逐筆記錄該戶發生的收支情況,包括工資收入、生產和出售農副產品收入、家庭經營的二三產業收入、轉移收入、財產收入,以及各種購買活動、消費支出、生產支出、社保支出、自產自用產品和其他實物收入等等。年末,調查員還要對調查戶的人口、就業、住房、社保、家庭經營的土地和固定資產等情況進行訪問調查。
全國城鄉住戶調查主要由國家統計局直屬調查隊系統實施。國家直屬調查隊分布於每個地級以上城市以及約三分之一的縣。在每個抽中調查村都聘請一名輔助調查員,定期訪問、指導調查戶記帳,幫助文盲戶記帳。城鎮調查戶的日常訪問工作則主要由市、縣調查人員承擔。所有記帳和訪問調查得到的原始數據由市縣級國家調查隊編碼錄入審核後直接上報,由國家統計局直接匯總出全國和分省的收支數據。國家統計局每個季度電話隨機直接回訪6000個左右的調查戶,對基層調查工作開展情況和主要收支項目進行抽查。同時,還通過實地抽查回訪等方法嚴格控制數據質量。
國家統計局以資料庫形式保存了各年度詳細的調查戶樣本信息、調查戶記帳資料、年末訪問調查資料以及根據這些詳細資料計算的分戶居民收支數據。
從總體看,我國城鄉住戶調查數據來源明確,樣本抽選規範,調查基礎比較紮實。但是,受長期城鄉二元結構的影響,2012年12月前城鄉居民收入統計指標不一致、農民工歸類不明確,無法簡單加總得到全體居民收入。這是最近幾年沒有計算、發布全國基尼係數的主要原因。
為了解決上述問題,滿足城鄉統籌發展、調整居民收入分配格局對居民收支統計數據、特別是收入差距數據的新需要,國家統計局對城鄉住戶調查進行了一體化改革。至2012年底,制定了新的一體化住戶調查制度,建立了統一的收入指標體系,抽選了統一的調查樣本,組織了摸底調查,獲得了調查戶基本信息。從2012年12月1日起全國40萬戶調查戶(其中國家樣本16萬戶,地方樣本24萬戶)已按新調查制度記帳。同時,近年來,為了適應改革需要,對常規住戶調查中需要調整的收支小項儘可能單列調查,在繼續做好記帳調查的同時,對外出農民工的收入進行了問卷訪問調查。
三、測算基尼係數的方法與步驟
國家統計局根據一體化住戶調查指標新口徑和調查戶基本信息、人口普查資料,參考個人所得稅資料等背景信息,對城鄉居民收入歷史數據進行了回溯調整,在此基礎上測算全國居民可支配收入基尼係數。主要方法與步驟如下:
第一步:按新的指標口徑調整歷史數據。
新指標是指2012年12月份以後實施的一體化住戶調查制度中的可支配收入指標。該指標是國家統計局按照聯合國統計委員會《國民經濟核算2008》以及聯合國歐洲經濟委員會《住戶收入統計坎培拉手冊2011》中的居民收入口徑制定的,具有國際可比性。新的可支配收入指標中既包括現金收入,也包括實物收入。按照來源可分為:工資性收入、經營淨收入、財產淨收入、轉移淨收入和自有住房折算淨租金。
國家統計局按照新的可支配收入指標口徑,利用已有的城鄉居民收入分戶調查資料,調整形成了2003年-2012年我國城鄉居民同口徑的可支配收入分戶數據。具體就是將農村居民人均純收入指標調整為人均可支配收入指標,主要是從純收入指標中扣除了農村居民社保支出、利息支出、贈送城鎮居民支出,增加了農民工在外花費的收入。同時,規範完善城鎮居民人均可支配收入口徑範圍,主要是進一步扣除了交納社保費用和所得稅以外的全部轉移支出(社保支出和所得稅在原指標中已扣除)、以及以房貸利息為主的全部財產性支出,增加了自有住房折算淨租金收入和實物折算收入。
第二步:校準城鎮高收入戶調查收入偏差。
為了解決調查樣本中高收入戶記帳收入偏低的問題,國家統計局採用了多種國際上常用校準方法進行試算,比較了各種方法的利弊,最後選擇了有確切數據來源、校準量最大的校準方法。
一是比較歷年城鎮住戶調查的一相樣本(即大樣本摸底調查戶,三年一次,訪問調查)與二相樣本(即記帳調查戶)的住房、職業、文化程度、訪問調查的收入等方面的差距,對不同類型的記帳調查戶的比重進行校準,以提高高收入戶的比重。
二是根據稅務部門發布的年收入在12萬元以上納稅人收入情況校準住戶調查中高收入戶樣本比重和收入水平。
三是對一體化住戶調查中國家抽中的16000個調查小區中所有200多萬住戶的摸底調查資料與現有城鄉住戶調查戶基本信息進行對比,對城鄉住戶調查樣本構成進行評估。
同時,國家統計局也對國內相關研究的校準方法進行了研究。經比較,最終採用以個人所得稅資料為依據,測算確定高收入戶樣本結構權重和人均收入水平的調整係數和調整模式,對高收入戶群體進行平滑校準。
第三步:按照全國城鄉人口比例,調整合併城鄉住戶調查數據。先調整農民工歸類,形成包括農民工在內的城鎮人口總體。將年內外出務工半年以上的農民工,從現行的農村人口調整為城鎮常住人口,保持與人口統計分類的一致性。再按歷年城鄉人口比重對城鄉住戶調查分戶數據進行加權合併。
第四步:計算全國居民收入基尼係數。在城鄉合併樣本數據的基礎上,依據基尼係數計算公式,利用SAS軟體計算出了全體居民的可支配收入基尼係數。所有數據未進行城鄉、地區或時序的價格差異調整。具體計算公式如下:
Wi和Pi 是指將調查戶按收入由低到高進行排序,計算第i戶代表的人口的收入佔總收入比重(Wi)和第i戶所代表的人口佔總人口比重(Pi)。
總之,國家統計局本次測算2003年-2012年全體居民收入基尼係數,主要基於樣本充足、調查紮實的城鄉住戶調查詳細分戶資料,並儘可能消除了城鄉居民收入指標口徑不一致和高收入戶樣本偏差對基尼係數的影響,測算得到的基尼係數具有國際可比性,也反映了我國居民收入差距的變化趨勢。但與很多國家政府統計面臨的問題一樣,由於缺少確切信息,很難校準稅外收入的偏差。根據老樣本和老口徑數據進行調整得到的結果,也可能會與新樣本和新數據得到的結果有一些差異。未來,國家統計局將根據新的一體化住戶調查數據,在進一步廣泛收集校準背景資料及深入研究樣本校準方法的基礎上,及時發布基尼係數和相關方法,也有可能對基尼係數的歷史數據進行進一步的校準修訂。
附件:
基尼係數測算方法示例
基尼係數如何計算?基尼係數與收入的相對差距還是絕對差距有關?為什麼有人對收入差距的感覺與基尼係數不一致?本文用一個假定的三人世界進行計算和說明。
為簡便起見,假如世界只有三個人。第一人A,是低收入者,第二人B,是中等收入者,第三人C,是高收入者。在測算前,需要將A、B、C三人按從低到高排好序。先列出人數和每人的收入,再計算累計的人數和累計的收入,然後再計算累計人口比重和累計收入比重,最後計算基尼係數(詳見附表)。
情況1:
A、B、C收入各37萬,屬於收入絕對平均,收入分布如圖中綠線所示,基尼係數為0。
基尼係數:
=(三角形OCC"面積-三角形OAA"面積-梯型AA"BB"-梯型BB"CC"面積)/三角形OCC"面積
=(1*1/2-0.3333*0.3333/2-(0.3333+0.6667)/2*(0.6667-0.3333)-( 0.6667+1)/2*(1-0.6667))/(1*1/2)=0
情況2:
A收入為1萬,B收入10萬,C收入100萬。收入分布如圖中藍線所示,由此計算的基尼數是0.5946。現實社會中,中、低收入人群比例要高許多,本例為方便計算,假定高、中、低各佔1/3,計算結果不等同實際情況。
基尼係數=(三角形OCC"面積-三角形OAA」面積-梯型AA」BB」-梯型BB」CC"面積)/三角形OCC"面積
=(1*1/2-0.0090*0.3333/2-(0.0090+0.0991)/2*(0.6667-0.3333)-(0.0991+1)/2*(1-0.6667))/(1*1/2)=0.5946
情況3:
A收入為2萬,B收入20萬,C收入200萬。與情況2相比,大家收入都翻一番,但相對差距不變。各人在收入中的份額沒有改變,因此,基尼係數不變,還是0.5946。此時,有的中低收入者因為收入增加額沒有高收入者的增加額大,感覺到收入差距在擴大。
情況4:
A收入為3萬,B收入15萬,C收入150萬。與情況2相比,大家都有改善、低收入者增速較快,基尼係數下降到0.5833。在此情況下,高收入者的收入增加額還是比中低收入者的大。
情況5:
A收入為3萬,B收入9萬,C收入120萬。與情況2相比,
低收入者收入增長較快,中等收入者收入下降,基尼係數下降到0.5909。在此情況下,中等收入者與高收入者的收入相對差距和絕對差距都擴大。此時,基尼係數的下降與中等收入者對於收入差距的感覺是很不一樣的。在此,基尼係數也不能解釋差距變化的原因。