2015年,國務院發布《大數據發展行動綱要》,要求建設政府數據開放平臺。截止2019年底,我國共有82個政府數據開放平臺,從省到市再到區縣,範圍逐漸擴大,層級逐漸加深,地方政府開放數據已成為趨勢。在此背景下,對政府數據開放相關政策進行梳理,對現有研究進行綜述十分必要。本文對政府數據開放國家層面的主要政策進行解讀,從中提取關鍵點,同時,將現有文獻分為平臺分析類和其他類別,挑選典型的文章進行分析。
政府信息公開是政府數據公開的前提和背景。2007年4月,國務院發布《政府信息公開條例》,拉開了我國政府信息資源公開的序幕,《條例》規定了市級、縣級和鄉鎮級政府信息公開的重點內容,從市到鄉,公開的內容越來越細緻,顆粒度越來越小。2019年4月,國務院重新修訂該條例,明確了「公開為常態,不公開為例外」的信息公開原則,強調要擴大主動公開的範圍,建設和完善網際網路信息公開平臺,提高信息資源的規範化和標準化水平。在新時代技術水平提高和政府治理理念升級的背景下,數據公開的概念出現,它是信息公開的延伸和提升,更加強調數據類信息資源,特別是原始數據資源向大眾開放。
當前,我國尚未出臺專門的國家級數據開放方面的法律法規,但在信息資源共享、信息資源開放、大數據發展領域出臺了多個規範性、指導性文件,其中部分內容涉及數據公開,如表1所示。從政策發布部門來看,國務院、中共中央辦公廳、網信辦、發改委、工信部等部門廣泛地參與到數據開放的政策制定工作當中。2015年發布的《大數據發展行動綱要》首次明確提出建設政府數據統一開放平臺,並給出2018年建成的時間節點。據復旦大學數字與移動治理實驗室發布的《中國開放數林指數(2019年上半年)》統計,截止到2019年4月,我國省級、副省級和地級地方政府數據開放平臺共82個,其中有46個平臺於2018年建成,2018年也成為我國地方政府數據開放平臺的集中建設期。從表1可以看出,國家每年都會出臺相關政策推動數據資源的開放和共享,有三點值得注意:
《關於全面推進政務公開工作的意見》和《「十三五」國家信息化規劃》都明確提到要優先開放與人民群眾生活密切相關的、具有較大商業價值的數據,此類安排有利於分階段、分主次地去開放政府數據,可以提高政府開放數據的效益,滿足各類群體的需求。
《關於全面推進政務公開工作的意見》和《政務信息系統整合共享實施方案》提出要制定開放目錄,開放目錄指的是所有開放數據的條目集合,以貴州省政府數據開放平臺為例,在「數據目錄頁面」(http://data.guizhou.gov.cn/directory.html)可以看到當前已經開放了1041個資源。設置目錄的主要是為了明晰開放範圍,便於用戶查找。
《公共信息資源開放試點工作方案》對北京、上海等五個試點地區數據開放平臺的功能、資源獲取方式、數據開放範圍、數據質量和數據利用促進方式進行了較為詳細地規定,也為其他地區進一步完善地方數據開放平臺指明了方向。
政府作為最大的數據生產者,其掌握著大量高質量數據,這些數據具有極大的開發價值。當前,雲計算、大數據、人工智慧等數據存儲和處理技術迅速發展,為有效處理政府部門的沉積數據提供了技術支撐。2019年8月,中國網際網路信息中心發布第44次《中國網際網路發展狀況統計報告》,我國網民人數達8.54億,網際網路普及率達61.2%,網際網路的發展和普及為政府和公眾之間的信息流通搭建了橋梁。開放政府數據有利於公眾了解和監督政府決策,提高政府工作的透明度和公信力,是發展電子政務和建設陽光政府的必要措施,同時,政府的數據規模大、質量高,公開之後可以為個人、企業、社會團體等使用,促進相關領域的科學研究、商業開發和公益使用,助力共享經濟和數字經濟發展。現階段,地方政府是建設開放數據平臺的主體,且逐漸由省級政府向下延伸。在82個平臺中,有13個為省級平臺,10個為副省級平臺,59個為市級平臺,分別佔各級行政區數量的41.93%、66.67%和18.55%。其中,廣東、山東和貴州三地不僅建設了省級政府數據開放平臺,還大範圍建設市級平臺,部分市級平臺已經開放了區縣級政府的數據。
表1 政府數據開放相關政策
信息來源:國務院、網信辦官網
國研網金融部研究整理
2012年6月,上海市政府數據服務網上線,成為我國第一個地方政府數據開放門戶,但到2014年末,我國僅有10個地方政府數據開放平臺。2015年起,大量平臺如雨後春筍般出現,與此同時,研究地方政府數據開放方面的文獻也逐漸增多,主要可以分為兩類:對比和評價類、法律支撐和影響因素類。由於近年來地方政府數據開放平臺建設速度加快,一些時間較早的文獻,其調查結果及政策建議等內容已不符合當前情況,因此本文將以2017年之後文獻為重點進行綜述。
部分文獻對地方政府數據開放平臺的發展情況進行研究和評價。地方政府數據開放是包含政策、平臺、數據、技術等在內的綜合體,其中平臺是體現政策內涵、展示開放數據內容、連接數據供給方和需求方的重要主體,大量文獻以平臺為出發點,探究地方政府數據開放的發展情況。一是對不同平臺的差異進行對比和分析,曹雨佳從生存狀態(如開放數據數量、格式、更新頻率等)和生存環境(如法律法規、組織機構等)兩方面對國內19個開放數據平臺進行對比;周文泓等從數據共享現狀(如可獲得性、多元性、及時性等)和數據利用現狀(如知識性支持、社區性支持、互動性支持等)兩方面對國內24個平臺進行比較分析;鄭磊等從數據發現、數據獲取、工具提供、利用成果、互動反饋等7個維度對我國82個地方政府數據開放平臺進行分析,並從平臺的功能和體驗角度提出優化建議。二是對地方政府數據開放平臺進行評價。陳水湘從用戶利用角度出發,使用德爾菲法和層次分析法構建政府數據開放平臺評價體系,以19家地方平臺為對象進行實證研究,並給出提高平臺利用率的政策建議;李曉彤等以北京、廣州和哈爾濱三地的政府數據開放平臺為例,從完整性、準確性、時效性、開放性等7個維度構建了數據質量評價體系,對平臺的開放數據質量進行重點研究;趙繼娣和趙罕侖從平臺內容、用戶參與和開發利用角度構建政府數據開放績效評價體系,包含類目完備度、可讀性、用戶評價、應用開發情況等8個指標,並以上海市為例進行實證分析。
平臺分析類文獻的基礎是地方政府平臺的建設和完善,與政策和實際的關聯性強。同時,此類文獻會對平臺進行分析並提出建議,有助於指導地方政府進一步提高平臺質量。從文獻撰寫步驟來看,此類文獻一般先確定分析角度,部分文獻選擇對平臺進行全面評價,部分文獻選擇對平臺的某一方面進行分析,如平臺的數據質量、平臺的效益、平臺使用的便利性等。之後,此類文獻一般都會構建指標體系,儘可能科學、全面、合理地對問題進行分析。最後,此類文獻一般會使用表格、圖形展示不同平臺之間的差異。值得注意的是,要對平臺的數據規模、質量等進行分析,首先需要獲取平臺上的大量數據,大部分文章都使用了爬蟲技術,將一段時期內,多個平臺的數據爬取下來,構建成特色資料庫,基於資料庫再進行分析。
此類文獻在分析對象選擇上容易陷入一個誤區,大部分文獻將省級、副省級和地市級政府數據開放平臺放在一起進行比較和分析,存在缺乏區域整體觀念和對象不平衡等問題。某些地區的數據資源開放具有頂層設計和從上自下的特點,構建指標體系進行評價會割裂地區數據資源開放工作的整體性。以廣東省和廣州市為例,從行政關係上看,廣州市隸屬於廣東省,廣東省政府發布的政策同樣也會影響廣州市政府數據開放工作的進程,同時,廣東省開放的數據由省級政府部門提供,數據對象的顆粒度較大,而廣州市開放的數據顆粒度較小,因此,在類似情況下不宜對平臺進行定量對比分析。
另一部分文獻重點研究法律支撐、發展模式、影響因素等與地方政府數據開放密切相關的問題。
一是法律體系和定位。何淵認為在大數據時代,封閉式的「行政主體—行政相對人」理論無法解決政府數據開放的法律風險,應從中央和地方、政府和市場、國家和社會等方面重新構建政府數據開放法律框架;陳朝兵和簡婷婷創新性地構建了數據開放中「分類—分級」的政府責任框架,認為政府主要承擔財政支持、制度設計、社會回應和監督管理四個方面的責任,中央政府重點對全國的數據開放工作進行統籌協調和頂層設計,並對地方工作進行監督,地方政府則負責落實中央政策,並根據地方具體實踐開展數據開放工作。此類文獻主要從法律角度對政府數據開放中各個主體的責任、義務、行為規範等進行分析,同時關注數據安全、隱私安全、數據治理等方面的法律問題。
二是發展模式。張廷君和曹慧琴根據平臺層發展成熟度和數據層發展成熟度,將45個地方政府數據開放平臺分為平衡發展型、平臺優先發展型、數據優先發展型和漸進發展型四大類別。此類文獻數量較少,主要是因為目前各省份在政府數據開放平臺建設方面的思路各異,平臺的發展路徑、搭建方式等都存在差別,要從中找到規律難度較大。
三是影響因素。王法碩將影響地方政府數據開放的因素分為內部因素(包括領導重視程度、制度規範程度和組織保障程度)和外部因素(包括經濟發展水平、公眾需求和信息技術水平),並對國內47個地方政府數據開放平臺為對象進行分析;湯志偉等認為政治要素(如政策數量)、經濟要素(如地方經濟發展水平)、社會要素(如信息產業發展水平)共同決定著地方政府數據開放水平。此類文獻關注平臺發展的驅動因素,而且分析的角度一般較為相似,政治、經濟和技術因素往往是最為重要的幾類因素。