2005-2015年國內外政府數據開放共享研究述評(一)

2021-01-18 甘肅經濟信息網

 

    內容提要:為了了解國內外政府數據開放共享研究現狀,從而更好地指導國內開展相關研究工作,本文選取2005—2015年與政府數據開放共享研究相關的論文、相關政府文件、報告、新聞報導等文獻,運用文獻調查法、文獻計量法和知識可視化相結合的方法對選取的文獻進行了梳理,分析了這10年間國內外政府數據開放共享研究的主題分布、主題時序演進、研究主題特點、研究存在的不足之處,提出了促進我國該領域研究發展的建議。

  關 鍵 詞:政府數據 政府數據開放 政府數據共享 政府數據開放共享

  標題注釋:本文為國家社科基金重大項目「面向國家大數據戰略的政府數據開放共享對策研究」(15ZDC025)的研究成果。

  2015年10月29日發布的《十八屆五中全會公報》[1]提出「實施國家大數據戰略」,這是大數據第一次被寫入黨的全會決議,標誌著大數據戰略正式上升為國家戰略。國務院印發的《促進大數據發展行動綱要》[2](以下簡稱《綱要》)明確指出數據的開放共享是國家數據戰略的核心,正文中「共享」共出現59次,「開放」共出現36處,《綱要》5次提及「政府數據開放共享」,將「加快政府數據開放共享,推動資源整合,提升治理能力」作為三大任務之首,且將「政府數據資源共享開放工程」列為十大數據工程之首,充分顯示了政府數據開放共享在國家大數據戰略中的極端重要性。2016年「兩會」通過的「十三五」規劃再次提出要「實施國家大數據戰略,推進數據資源開放共享」[3]。

  政府數據開放共享是推進我國大數據戰略實施的重要切入點。政府機構擁有社會80%以上數據[4],是最大的數據生產、收集、使用和發布單位,其開放共享可帶動其他領域的開放。無論是推進政府簡政放權、放管結合,還是推進新型工業化、城鎮化、農業現代化,都要依靠大數據、雲計算,其中政府數據的開放共享至關重要。李克強總理指出:「政務數據深藏閨中是極大浪費」。基於上述背景,政府數據開放共享成為2015年以來我國政府、企業和學者高度關注的熱點問題之一。

  本文通過系統的文獻梳理和文獻計量學方法對2005—2015年國內外政府開放共享研究情況進行述評,力圖梳理該領域研究的發展脈絡與現狀,以期為後續相關研究提供建議。

  1 研究背景

  在進行文獻分析之前,有必要簡述本文研究緣由,對概念進行辨析並介紹了文獻檢索情況和研究方法。

  1.1 研究源起

  我國政府數據開放共享距國家大數據戰略的要求甚遠。2016年1月全球資訊網基金會發布的《開放數據晴雨表:世界報告》第3版[5]顯示,我國數據開放的得分為28.12(英國為100、美國為91.89),排名第55位,較2015年下降9位。2015年12月英國開放知識基金會公布的2015年全球開放數據指數[6]顯示,在121個國家和地區中,我國大陸排名持續下滑,從2014年第58名跌落至第93名。收錄全球519個數據門戶的歐洲Open Data Portal[7]只有5個來自我國、且4個是地方性的政府數據門戶。工業和信息化部賽迪研究院發布的報告《賽迪預測——2014年下半年信息化走勢分析與判斷》[8]認為,我國政府數據開放明顯落後於世界先進國家,表現在開放的數據總量少、實時監控數據沒有及時開放、數據開放的方式相當原始、已開放的數據間相互「割裂」、民生保障服務相關領域的政府數據集向社會開放的進度太慢等方面。同時,政府數據開放共享的理論研究與實踐均落後於科學數據共享。可見,政府數據開放是我國目前實施大數據戰略最薄弱的環節,也是急需解決的「痛點」。

  同時,政府數據開放共享已成為國際共識。2014年4月28—29日,參加聯合國主辦的首次「政府開放數據論壇」的專家認為[9],全球政府都在深化其戰略承諾、密切合作使政府數據開放給公眾使用。2015年9月27日,在紐約舉行的聯合國大會上,開放政府合作指導委員會的成員籤署了《實施2030可持續發展議程的開放政府聯合宣言》[10],宣布共同實施政府數據開放共享計劃。2015年4月22日,首屆世界經合組織(Organization for Economic Co-operation and Development,OECD)政府數據開放專家組會議召開,OECD秘書處希望各國分享其綜合運用強制與自願措施開放政府數據的案例與實踐。美、英、澳、加、日等發達國家均將政府數據開放共享作為其國家大數據戰略的重要內容。在國際組織和發達國家帶動下,政府數據開放共享的國際合作備受矚目。尤值一提的是,這些國家在政府數據開放方面快馬加鞭,紛紛推出其開放政府戰略的「升級版」,如加拿大2014年底推出《加拿大開放政府行動計劃2014—16》,英國於2015年初發布《英國開放數據路線圖》,美國於2015年10月推出了其第3次開放政府行動計劃[11]。

  由此可見,政府數據開放共享是我國實施國家大數據戰略最為關鍵的一環,也是當前的首要任務和薄弱環節,很多問題亟待從理論上尋求解決對策,這正是本文調研國內外10年內該領域研究現狀的現實需求。

  1.2 相關概念闡釋

  筆者的文獻調研發現,政府數據開放共享的概念經歷了三個發展階段的演變。

  第一個階段的主要概念是「政府信息公開」(Open Government Information,OGI)。1996年美國柯林頓政府頒發的《信息自由法》修正案提出「政府信息公開」[12],這一概念迅速成為美國學術界關注的話題。爾後,世界上許多國家開始頒發類似法律法規,如英國在2000年頒布了《信息公開法》[13]、日本在2001年頒布了《行政機關擁有信息公開法》[14]、我國在2007年頒布的《政府信息公開條例》[15]等,都強調公民獲取政府信息的權利和政府依法公開行政信息的義務。

  第二個階段的概念是「開放政府數據」(Open Government Data,OGD)。2009年美國歐巴馬政府籤署了《開放透明政府備忘錄》[16],同年頗具影響力的Data.gov上線,標誌著美國開放政府數據運動的開始。隨著英國政府上線data.gov.uk[17]、澳大利亞政府推出data.gov.au[18]等,開放政府數據形成世界潮流。2011年美國、英國、挪威、巴西等八國籤署《開放數據聲明》[19]並成立開放政府合作夥伴;2013年八國集團首腦籤署《開放數據憲章》[20],各國強調要通過政府數據的開放共享提高政府透明度和運作效率,為各國公民提供更好的公共服務。

  第三個階段的概念是「政府數據開放共享」(Open and Sharing Government Data,OSGD)。隨著越來越多的國家和機構參與開放政府數據,跨國、跨機構間的數據共享問題成為新熱點。我國政府文件中(《綱要》)率先明確提出了政府數據開放共享的概念,其是開放政府數據的延伸和升級,這個概念更適合我國國情。

  因此,從概念上來說,政府數據開放共享與政府信息公開、開放政府數據密切相關,也有所不同,它是政府信息資源發展到當前階段的產物,尤其強調數據的公開性、可獲取性和可用性。目前,已有組織機構對政府數據開放共享的相關概念進行了定義,例如八國集團(G8)在《開放數據憲章》定義了開放政府數據、OECD也給出了開放政府數據的概念界定,但對於政府數據開放共享的定義目前還未出現。事實上,政府數據開放共享是由我國政府率先明確的,它既主張開放政府數據,同時強調政府數據共享。我們可以認為政府數據開放共享是指政府機構在法律法規範圍內開放、共享其生產或擁有的按照一定標準規範組織過的數據集,這部分數據可供企業、公民、研究者等自由使用,為社會創造價值。同時,政府數據的開放共享應是在充分的數據安全保障範圍內的,要嚴防洩露危害國家安全的數據和侵犯個人隱私的數據。

  1.3 文獻準備與研究方法

  政府數據開放共享的概念是國內外政府信息化過程中長期實踐與研究演化的結果,對於該研究國外文獻中常用的相關術語有「open government」[21]、「open government information」[22]、「open government data」、「open data」、「data sharing」[23]等。與之對應,國內文獻常用的相關術語有「開放政府」[24]、「政府信息公開」[25]、「開放政府數據」[26]、「政府數據開放」[27]、「政府數據開放共享」、「開放數據」、「數據共享」[28]等。為了保證能夠檢索到儘量全的與研究主題相關的文獻,筆者以「政府信息」、「政府數據」、「開放」、「共享」「公開」等作為標題關鍵詞進行輪排檢索,首先保證檢索到儘量全的文獻,然後進行文獻篩選。為了保障檢索到的文獻質量,將國內外參考文獻的檢索範圍限定在Web of Science核心集、CNKI核心期刊(包含中文核心期刊和CSSCI期刊)。檢索時間限定在2005—2015年,經過篩重和刪去不相關的文獻,最終選定外文文獻256篇、中文文獻157篇。我們的文獻調研發現現有的與政府數據開放共享相關的成果以期刊論文和會議論文為主,還有很多政府文件、非營利性組織和企業的報告等。因此,本文的述評以這413篇文獻為主,兼顧其他文獻。研究方法上利用了文獻調查法和知識可視化的方法,使用CiteSpaceⅡ作為主要分析工具。

  2 研究主題的分析

  2.1 國內外研究的主題分布

  2.1.1 國外文獻的主題分布

  如圖1所示,2005—2015年10年間,國外研究中與「政府數據開放共享」相關關鍵詞出現頻率較高的依次有:政府數據開放、開放數據、模式、政策、電子政務、透明、開放政府、美國、系統、政府等;該圖還反映了不同主題之間的關聯度,關係密切的如:政府數據開放與透明,開放數據與開放政府、模式、政策、策略、技術等。該圖顯示,政府數據開放與數據共享是分開研究的,但數據共享與政府關係十分密切;從該圖不難看出,國外關於政府數據的研究涉及的主題很廣泛,除了上述關注度高的主題外,既有展望、未來、變革等趨勢性問題;也有語義網、大數據、元數據、整合、Web2.0、數據挖掘、記錄連結、元分析等技術問題;還有商業、市場、消費者研究、智慧城市、公共部門、風險和隱私等政府數據的影響或應用方面的主題;從研究方法看,案例研究比較集中。由此可見,國際上對政府數據開放共享的研究主題主要集中在政府數據開放的定義和基本理論、政策與策略、電子政務、技術、應用等,關於標準規範的研究主要集中於元數據。從被研究的國家看,關於美國政府數據開放的研究最多,有75篇文獻;其次是討論英國和澳大利亞,都超過20篇;接著是西班牙、中國、希臘和加拿大,都有10篇以上同類文獻;其他國家相對較少,成果並不突出。

  2.1.2 國內文獻的主題分布

  圖2表明,2005—2015年國內關於政府數據開放共享的研究高度集中於「電子政務」,折射出該主題研究服務於電子政務的需求導向,其他主題詞頻度從高到低依次為:數據開放、政府數據、大數據、數據中心、門戶網、開放政府數據、信息公開等。從圖2可以看出,對政府數據應用的關注度從高到低依次為:公共服務、社會創新、治理能力、業務協同、新興產業、民生服務、經濟增長、信息服務業等,涉及的主要技術問題有:關聯數據、應用系統、信息資源整合、語義網、運行維護等。圖2還顯示,我國政府數據開放共享保障的研究主要集中於頂層設計、保障機制、統籌管理,信息孤島、部門網站、部門間等影響政府數據開放共享的問題,數據安全管理等主題已進入學者們視野;關於標準規範的研究除了「關聯數據」外,其他問題極少涉及,關於元數據的關注度遠不及國外。

 

 

      圖1 2005—2015年Web of Science核心集關於「政府數據」研究成果的主題分布

 

 

   與國外同類研究相比,電子政務、開放政府數據等詞顯示出國內外研究有相同之處;但大數據、門戶網、信息公開、頂層設計等詞彙顯示出國內該主題研究也有創新之處,具備時代特徵。這與我國近兩年出臺大數據有關的政策密不可分。但是,「頂層設計」與「政府數據」、「政府數據開放」的關聯度不高。

 

 

 圖3 2005—2015年Web of Science核心集中「政府數據」研究成果的主題歷時演化趨勢

 

 

   圖4 2005—2015年CNKI中「政府數據」研究主題的歷時演化趨勢

  2.2 國內外研究主題的時序演進

  如圖3所示,國外「政府數據開放」作為研究熱點出現於2011年,是最大熱點,且從2005年起,各個年度都被關注。從研究主題的時序演進看,從2005年開始研究的熱點主題依次為:政策、模式、電子政務、管理、政府數據、透明、政府數據開放、公共部門、人口、技術與影響,說明國際上對政府數據研究的關注度一直未變。

  如圖4所示,國內「政府數據」作為研究熱點出現於2012年,但與國外不同的是,沒有「開放」二字;「數據開放」作為熱點在2013—2014年才出現,晚於國外,而且,「政府數據開放」尚未形成一個集中關注的熱點,這一點與國外有明顯的區別。這10年,「電子政務」是最大熱點,從2005年和2006年的熱點分別為:數據中心、電子政務,而且從2005年快速發展到2006年即形成高峰,2007—2010年出現研究低谷,2011年後重新穩步增長。2007—2010年的低谷雖然使得該主題研究有所斷裂,但卻醞釀出了新的研究主題,例如關聯數據、語義網等技術層面的研究,這也表現出國內研究從理論研究到技術研究的一個轉變。2011—2012年,「門戶網站」成為熱點;2014年,該主題研究中「大數據」成為熱點,這與2014年以來黨和國家領導人、中央和地方政府高度重視國家大數據戰略有關;2015年,該主題的研究熱點聚焦在「頂層設計」,因為《綱要》明確提出了「頂層設計」的要求,不難看出這是學術研究服務於國家政策需求的導向。

  2.3 國內外研究主題的內容分析

  我們從核心作者和共被引關係以及成果與「政府數據開放共享」的密切度,識別出以下國內外主要的相關代表成果,並將其歸為幾類,選取具有代表性的文獻進行評述:

  (1)關於政府數據開放共享的基礎理論的研究

  文獻[29]從政府信息公開的角度研究公眾利用政府信息資源的權利和途徑。文獻[30]研究了政府信息公開與政府數據開放的異同之處。文獻[31]從政府數據挖掘視角分析了政府數據的價值和對公共決策的輔助作用,持有類似觀點的還有文獻[32]。文獻[33]通過實證分析了開放政府數據能夠預測社會衝突,從而實現更好地規避社會衝突和矛盾。

  關於政府數據的安全,文獻[34]研究了數位化政府與社會安全的關係和政府開放數據過程中的安全挑戰。文獻[35]和文獻[36]分別從災備中心的建設和雲存儲視角研究了政府數據開放共享中的數據安全問題。總體上看,這類文獻對政府數據開放共享基礎理論的研究涉及面廣,探討了其重要作用。

  (2)關於政府數據開放共享的現狀與障礙研究

  上文提到的由網際網路基金會、開放數據研究會共同編制的《開放數據晴雨表》和英國開放知識基金會發布的《全球開放指數》是當前剖析全球開放數據現狀的重要報告。此外,文獻[37]從中國政府數據開放平臺建設的視角進行了案例分析,結合大數據時代的信息環境研究了我國政府開放數據面臨的阻礙並提出了對策。文獻[38]基於大數據環境提出了政府數據管理的機遇、挑戰和對策。這方面的研究成果大多立足於現代信息環境的特點分析政府數據開放共享的進展,並指出影響其進一步發展的障礙。

  (3)關於政府數據開放共享的政策與法規研究

  上文提到的文獻[12~15]研究了各國政府數據開放共享的保障性法律,此外,文獻[39]利用英國開放政府數據的案例詳細地研究了信息政策的制定對於開放政府數據的基礎保障作用。文獻[40]研究指出公共部門信息資源可以進行增值利用,提出了相應的政策法規建議。文獻[41]等從國家開放數據戰略視角進行研究,還將發達國家與發展中國家的同類戰略進行了對比研究。文獻[42]分析了國外政府數據開放許可適用情況,探討了制定我國政府數據開放政策的重要性和具體策略。可以看出,國外對政策法規的研究以應用和討論為主,國內對這部分法律法規的研究以建議、實施策略為主,有較大區別。

  (4)關於政府數據開放共享的標準規範研究

  文獻[43]、文獻[44]、文獻[45]等分別從國際政府機構數據開放共享的標準、元數據等角度進行了調查研究。文獻[46]結合世界知名的英國政府數據開放工程(Data.gov.uk)從技術角度研究了開放關聯數據在政府數據中的設計辦法和效果。筆者文獻調查中發現對於政府數據開放共享標準規範的研究的成果遠遠少於基礎研究、法律研究等,說明這是該研究中相對薄弱的一個環節。

  (5)關於政府數據開放共享的基礎設施建設研究

  文獻[47]研究了區域性政府數據共享的實施策略,提出建設數據共享基礎設施對於基層政府的數據共享至關重要。文獻[48]將國內外政府開放數據的研究進行對比,提出了中國開放政府數據平臺的基本理論與框架。筆者調研發現基礎設施建設的研究集中在政府數據開放共享的區域建設和平臺建設。

  (6)關於國家或地方政府數據開放共享的案例研究

  文獻[49]結合歐洲政府數據開放共享的實踐研究了數據共享中PSI驅動模式的影響。文獻[50]研究了不同年齡的人群對政府數據開放共享的利用情況。文獻[51]分析了巴西開放政府數據的案例,文獻[52]探討了加拿大政府數據開放經驗等。文獻[53]、文獻[54]和文獻[55]分別介紹了武漢市政府數據開放平臺建設、青島市政府數據開放和應用的創新以及上海建設「政府數據服務網」的實踐。

  3 研究成果的來源和學科分布

  研究政府數據開放共享的機構一般有政府機關、大學、企業等,而研究的學科分布則呈現出較強的跨學科屬性。

  3.1 國外方面

  從研究機構來看,分布較為分散,排名第一的是加州大學系統、哈佛大學和昆士蘭大學,這三所大學在政府數據開放共享的研究中獨佔鰲頭。其次,南安普頓大學、北卡羅來納大學、墨爾本大學等是研究相對集中的機構。可以看出國外對政府數據開放共享的研究多集中在政府信息化程度較高的國家,以美國、英國、澳大利亞為代表。第二,這些國家信息管理或數據科學領先的高校在該領域的研究最為集中,較為典型的是加州大學系統,加州大學系統擁有伯克利分校、洛杉磯分校、爾灣分校三個全球頂尖信息科學學院聯盟iSchool的成員,它們的圖書情報學科在美國乃至世界都較為知名,因此能夠引領前沿的研究主題。

  從研究政府數據開放共享的學科領域來看,計算機科學與信息系統最多,有49篇;其次是圖書館與信息科學,有41篇;然後是計算機跨學科應用研究,有22篇;最後是公共管理、政治學、管理學、經濟學等、法學等,但這幾個學科的研究較為分散。由此可以看出,對這個主題的研究以信息科學為主,具有明顯的技術屬性。此外,國外發文較多的期刊有Government Information Quarterly、Lecture Notes in Computer Science和Government Publications Review等,均為SCI或SSCI源刊。

  3.2 國內方面

  從機構來看,武漢大學信息管理學院及依託該院建立的信息資源研究中心和復旦大學國際管理與公共事務學院並列第一位,各有8篇論文。其次,工信部賽迪智庫、廣西大學公共管理學院、南昌市西湖區信息中心、雲南省電子政務網絡管理中心居於第二位,各有2篇文獻。其他在該領域有研究成果且較有影響力的機構有中國科學技術信息研究所、中國科學院大學、中國現代國際關係研究院、上海圖書館、臺灣大學圖書資訊學系、青島市經濟發展研究院、中共太原市黨校、寧波市信息中心、天津市信息中心等。與國外的研究成果對比可以看出,國內的研究高校和政府機關各佔半壁江山,來自政府的信息中心、網絡管理中心等成為政府數據開放共享研究的重要力量。在文獻來源中,國內研究的一大特點是來自報紙和網絡媒體的文章較多。工信部、國家信息中心等參與《綱要》起草的有關政府部門的領導與學者對十八屆五中全會文件與精神解讀的成果有助於我們進一步理解這些戰略與《綱要》的深刻內涵。知名媒體紛紛推出應景之大作,國內最具有影響力的媒體如人民日報[56]、人民網、光明日報[577]、光明網等紛紛開展了大數據專題匯總和研究,邀請了國內社會科學領域的專家學者[58]為國家大數據戰略的實施和政府數據開放進行論證,這些成果更具戰略高度。

  從研究的學科領域來看,根據CNKI的學科分類方法,居於第一位的是行政學與國家管理,有77篇文獻;第二位是中國政治與國家政治,有23篇文獻;第三位是信息經濟,有21篇文獻;第四位是計算機科學,有15篇文獻;其他成果在5篇以上的學科還有新聞與傳播、宏觀經濟管理與可持續發展、計算機硬體技術、圖書情報與數字圖書館,這與國外不同。國內發文較多的期刊有《電子政務》、《圖書情報工作》、《情報理論與實踐》、《中國行政管理》等,均為中文核心期刊。

  4 現有研究存在的不足

  整體上來看,目前國內外政府數據開放共享研究處於發展階段,系統性理論尚未形成,對實踐指導的價值有待提高,總體來說存在以下幾點不足。

  4.1 缺乏系統的理論研究

  當前國內外對政府數據開放共享的研究主題較為分散,不同專業的專家學者分別從自身的專業角度出發進行研究。例如行政管理領域研究集中在管理模式、法學領域專注於研究政策法規保障、圖書情報領域研究數據開放共享標準規範的較多、信息科學領域大多研究數據開放共享技術。實際上,政府數據開放共享的需求調研、管理模式、政策法規、標準規範、平臺技術、人才保障等是一個有機的整體,而目前的研究還未見到有將其完整流程放在一起進行系統研究的。其次,該領域研究還缺乏系統的理論支持,如系統論、數據生命周期理論、信息生態理論等。此外,關於政府數據開放共享技術的系統研究有待加強。當前對技術的研究較為零散,研究點包括政府數據的整合技術、數據描述方法、跨平臺的互操作協議、政府數據元數據標準、數據質量控制等。這些技術研究亟待放在統一的體系內進行整合,提升技術研究的系統性、可用性、實用性。

  4.2 對國外相關研究較多、對國內相關研究較少

  通過文獻分析可以看出,目前國內外關於政府數據開放共享的研究大多集中在對國外的政策法規、標準規範和平臺建設等方面,主要以案例分析和對比研究為主。相比之下,對國內政府數據開放共享情況的研究較少。一方面,現有研究很少關注我國政府數據開放共享的需求與障礙的調查,也就是說缺乏宏觀上對國內政府數據開放共享的調查與了解;另一方面,目前的成果鮮有研究我國政府數據開放共享中的微觀措施,例如政策法規保障、標準規範研究、平臺建設等。我國政府信息化過程應立足於我國的國情,不可照搬國外模式,因此對國內政府數據開放共享的各方面的調查研究亟待開展。

  4.3 缺乏政府數據開放共享的法理論證

  當前影響我國政府數據開放共享的一大因素是我國政府部門組織的條塊分割和各自為政,這使政府數據被分隔在不同部門間,形成「數據孤島」。實質上,這是由於缺乏相關的法理論證造成的,首先沒有從法律法規上規定政府數據的屬性,使數據產權尚不明確;其次沒有論證執行政府數據開放共享的主體和責任歸屬;再次,缺乏政府數據開放共享的範圍和邊界的論證,使數據隱私保護成為難點。綜上所述,政府數據開放共享的法理論證十分關鍵。

  4.4 缺乏對數據管理人才保障的研究

  政府數據管理人才是智力保障,是實現其開放共享的重要一環,然而國內外的相關研究非常少。首先,缺乏對政府數據開放共享人才需求的研究。隨著國家大數據戰略的實施,我國各級政府機關需要一批業務能力較強的工作人員參與其中,對不同級別、不同地域的機構的人才需求調研十分必要。其次,缺乏對人才培養教育體系的研究。人才培養教育體系是政府數據開發共享可持續化發展的保障,然而政府數據管理人才應由哪種層次提供教育、由何機構提供教育、提供哪些教育資源保障等,這些問題目前都沒有得到研究。再次,缺乏對數據管理教育內容的研究。當前的數據管理教育多來自於圖書情報領域的信息素養教育和信息科學領域的數據管理教育,儘管其教學內容對數據管理人才的培養具有一定的意義,但都不是直接面向政府培養數據管理人才的。因此,要結合國家大數據戰略的要求,加強對數據管理教育內容的研究,使其更加符合政府數據開放共享的需求。最後,缺乏對數據管理人才保障機制的研究,主要包括數據管理人才的引進機制問題、編制問題、績效評估問題等方面。

  5 對我國政府數據開放共享未來研究的建議

  如前所述,我國政府數據開放共享尚存在多方面的挑戰,國內外現有研究成果也存在一些不足與薄弱環節;且國家大數據戰略和《綱要》發布的時間均不足半年,學者們尚未來得及對其進行系統、深入的研究。這些都為政府數據開放共享的研究提供了進一步發展與突破的空間。促進我國政府數據開放共享的研究有待從以下幾個方面努力。

  5.1 重視系統的理論研究

  如上文所述,政府數據開放共享的研究系統性不夠,現有研究成果大多只涉及其某一個方面,且缺乏強有力的理論根基。在理論上應將政府數據開放共享的需求分析、實施保障與實施載體作為一個整體加以研究,揭示它們之間的邏輯聯繫,立足於國際環境和國家數據競爭力的提升,以國家大數據戰略的現實需求為導向開展研究,開闢圖書情報學與其他學科的交叉增長點。

  建議借鑑信息生態理論[59],將政府數據開放共享置於國家大數據發展戰略、政務網際網路+和全球背景下進行考察。在政府數據資源的生態下,政府是主體、群眾是客體、技術是載體、價值是目標,整個生態系統是互相依存的,其發展有賴於各方的協同管理。

  另外建議借鑑信息資源管理理論[60]、公共物品供給理論和數據生命周期理論[61],將政府數據視為一種公共物品和重要的基礎性戰略資源,系統地研究政府數據從生產、加工到供給、復用的全部流程。從理論上研究並定義政府數據的概念範圍、價值與驅動力及開放共享的模式。

  此外數據開放共享的技術體系研究也較為重要,這包括元數據的描述方法、編碼體系、數據錄用技術、數據分類與組織技術、數據開放共享互操作技術、數據展現與可視化技術、數據的檢索技術、數據的評價反饋技術等。技術體系應放在統一的構架內進行系統研究,以確保其兼容性與可用性。

  5.2 加強需求調查與分析

  當前我國處於經濟轉型和社會發展的重要歷史階段,黨和國家千方百計地為社會經濟發展謀求出路,提出通過政府數據的開放共享來實現社會資源的均衡配置、提供經濟和社會的發展效率。因此,政府數據開放共享的需求調查與分析亟待開展,其主要有兩個方面組成:一方面是政府內部的需求,這是政府開放和共享數據資源的內部動力,包括為什麼要開放共享、開放共享的效益與價值、開放共享的難點與障礙、開放共享到何種程度等;另一方面是政府外部的需求,這是來自社會層面的需求,例如公眾、工商從業者、科研人員等對政府數據的需求。具體包括他們想要開放共享何種數據、開放共享數據對自身生活或工作有什麼價值、想要哪種模式的開放共享等。

  5.3 加強政府「開放」和「共享」的融合研究

  現有研究多側重於政府數據的開放,極少涉及政府數據的共享,尤其是如何解決數據孤島問題、數據隔離問題,將政府數據開放與共享結合的研究更是十分缺乏。近年來,政府信息化受到國際上開放存取運動發展的影響,政府數據的「開放」成為核心概念和熱點問題。但是,我國政府內部部門眾多,涉及交通、能源、教育等多個領域,僅有數據開放是不夠的,數據共享必須加以重視。另一方面,國內外對信息資源共建共享的研究很多,但與數據開放結合起來者甚少。此外,數據的共享和開放需要尋求合適的載體,例如2016年4月26日國務院印發的《推進「網際網路+政務服務」開展信息惠民試點實施方案》提出在80多個城市試點一張身份證辦理各種政務服務,各類「奇葩證明」將成為歷史。事實上,這就是將身份證作為政務數據共享的載體,實現了惠民服務。可以預見的是隨著政府數據的開放共享的持續發展,會有越來越多的便民政務服務出現,「網際網路+政務服務」將得以真正實現。

  5.4 強化政策法規研究

  目前我國專家學者對政府數據開放共享政策法規保障的研究較為薄弱,已經成果桎梏數據開放共享行動開展的障礙,其研究亟待從以下幾個方面進行強化:

  (1)要論證政府數據的法律性質問題,即政府數據在法理上是屬於公共物品還是政府的無形資產,然後根據其性質規定政府數據開放主體和使用主體之間的權利和義務。

  (2)研究我國政府數據開放共享所涉及的各個主體的權利義務。開放主體由不同的政府機構組成,它們掌握著政府數據資源,因此也要承擔相應的權利義務,例如限定數據公開範圍、數據的監督管理等權利和保證數據真實性、規範性、及時性、可獲取性等義務。

  (3)從法理上論證政府數據開放共享與公民指知情權的關係,研究使用主體,即政府數據資源的客體的權利和義務,例如申請開放數據、獲得數據、利用數據的權利和保護數據安全、不得濫用數據等義務。

  (4)研究政府數據開放共享的程序制度,包括數據生產階段對數據質量、安全、秘密、隱私的審查程序;數據開放、更新的程度、數據不予開放的程序、數據共享的程度、數據反饋的程序等。

  (5)研究政府數據開放共享的安全保護法律法規,包括開放範圍、領域的限定;數據脫敏與隱私保護;商業機密的保護;竊取、濫用數據的處罰等。

  5.5 加強標準規範研究的攻關

  政府機構制定統一的元數據標準能夠滿足政府信息系統內數據保存和共享的需要,確保資源在多個信息系統間有效傳遞,能通過統一門戶被用戶訪問。其中,急需加強公關的標準規範主要有元數據的描述標準,例如英國開放政府網站採用了e-GMS(The e-Government Metadata Standard,一種基於都柏林核心集的政府數據元數據標準)、美國開放政府網站使用Project Open Data Metadata Schema;數據資源內容組織的標準規範,包括數據日期、語言、主題、所屬機構等;數據操作的規範,例如數據採集的工具使用與錄用規範、數據分類規範、數據發布規範等。

  5.6 加強政府數據開放共享人才保障的研究

  面對愈加複雜的大數據環境,政府數據開放共享迫切需要相關工作人員具備優秀的數據素養,其包括「貫穿於數據生命全周期的數據採集、表示、描述、發現與檢索、選擇與評價、分析、整合、復用、保存等一系列數據管理活動所需的能力」[62]。數據強國需要多層次的數據人才,因此迫切需要加強政府數據開放共享人才保障的研究。

  5.6.1 政府數據開放共享的人才需求研究

  當前制約我國政府推動數據開放共享的一個因素就是缺乏數據管理人才。隨著國家大數據發展戰略的部署,廣東、遼寧、四川等省份已經成立大數據管理局,基層政府機構如廣東佛山南海區、廣東清遠等還成立了數據統籌局、大數據管理科等機構。這些機構的成立是統籌推動政府部門的數據採集、整理、開放和共享,消除政府信息孤島。因此,他們與其背後的大數據產業對數據管理人才的需求十分迫切。我們需要研究的是如何為政府的大數據管理機構培養輸送合格的人才以滿足其日益增長的數據開放共享需求。

  5.6.2 政府數據開放共享教育的主體

  高校是首要的培養主體,它承擔著系統為相關機構培養數據管理人才的功能。高校的特點是具有固定的學習時間和場所,擁有成熟的學位體系和課程體系,能夠為不同級別的機構輸送各種類型的人才。

  包括MOOCs在內的網絡課程中的數據素養和數據管理類課程為社會人才的培養和大眾知識普及做出了貢獻。

  圖書館一直在教育領域扮演著重要角色,其主要有三種教學方式:一是開展數據管理的研討會和培訓班,圖書館一般邀請具有較強專業技能的專家或館員進行數據管理的教學;二是開展專題講座,針對某一數據管理熱點或工具進行專題講解。例如上海交大圖書館開展過SPSS軟體的應用講座、中國科技大學圖書館開展過CiteSpace講座等。第三種方式是製作、提供專業化的信息素養類課程,例如北京大學圖書館的數據素養與統計數據資源介紹課程、清華大學圖書館的SPSS初級應用課程等。

  還有一個培養主體就是政府機構內部組織開展的培訓,它們往往邀請高校、企業等具有專業技能的專家對政府工作人員進行專題培訓。

  5.6.3 政府數據開放共享教育的客體

  政府機構工作人員是最為重要的客體,他們承擔著政府數據管理職能,其專業技能直接影響著政府數據開放共享的實施和效果。因此,為他們提供及時、專業的數據管理和數據素養培訓極為重要。

  高校學生是國家大數據戰略的後備人才力量,他們將來或多或少地要走到政府管理的工作崗位上。因此,無論哪個專業,都有必要進行數據管理和數據素養的教育,以便為我國政府數據開放共享培養合格的人才。

  企業員工也是重要的客體。國家推動政府數據開放共享的根本目的是推動社會經濟發展,激發社會創新活力,企業在其中扮演了重要角色。因此,企業員工有必要學習如何利用政府數據資源。

  最後是社會公眾,他們是政府數據資源的接受者和使用者,其數據素養直接影響著他們的使用能力。因此,也要研究如何提高社會公眾的數據素養。

  5.6.4 政府數據開放共享的教學內容

  第一,教學體系要貫穿政府數據開放共享的全部生命流程,即數據採集、數據組織、數據檢索、數據分析、數據交換、數據評價、數據發布等。提高數據開放共享主、客體的數據意識、數據倫理和操作能力。

  第二,將建立全面的數據管理與數據素養課程體系,例如設置數據科學的相關學位、多方協同構建課程體系、根據學科進行差異化教學、探索分階段的數據人才培養模式等。

  5.6.5 政府數據開放共享的教學模式

  目前國內數據管理與數據素養教學的手段主要是基於傳統信息素養教學的方法,以通識教育課程、線上線下培訓、講座、研討會為主。然而,傳統的手段已無法滿足政府數據開放共享的需求,其人才培養模式亟待創新,需要深度融合政府、科技、教育等行業的培訓力量。高校可依託學科優勢,成立數據教學實驗室、數據分析實驗室等,將學生引導到大數據實驗研究中。同時,打通高校教學資源,跨學科構建數、理、管理類重點實驗室,打造高校數據管理教學基地和實踐中心。此外,應抓住大數據時代對人才實踐能力的迫切需求,拓展與政府數據部門,如統計局、大數據管理局等國家機構的聯繫,共建數據科學中心和實踐基地。

  作者簡介:

  黃如花(1968- ),女,武漢大學信息資源研究中心教授,博士生導師,主要研究方向:信息檢索和政府數據開放共;

  李白楊(1991- ),男,武漢大學信息管理學院博士研究生,主要研究方向:信息檢索和政府數據開放共享,E-mail:li_baiyang110@163.com;

  周力虹(1983- ),男,武漢大學信息管理學院副教授,碩士生導師,主要研究方向:知識管理,醫療信息學等。武漢 430072

相關焦點

  • (法治)貴州出臺法規推動省級政府數據共享開放
    新華社貴陽12月1日電(記者施錢貴)記者從貴州省政府新聞辦舉行的國家大數據(貴州)綜合試驗區建設情況新聞發布會上獲悉,《貴州省政府數據共享開放條例》自12月1日起正式施行。
  • 當前中國黨報會議新聞研究述評
    本文試圖對當前中國黨報會議新聞研究作一述評和總結,認為新媒體時代下相關研究尚需注重報紙與新媒體的「一體化」考察,關注一般性的會議新聞,以及深入認識新媒體技術對黨報理論的結構性影響。本文最後還提出了今後相關研究若干可能的操作性創新之處。 關鍵詞:黨報;會議新聞;新聞改革   會議新聞是以具有新聞價值的會議及其內容為對象的報導。
  • 朱玉:大數據開放共享的數據安全保障網
    中國信息協會副會長兼秘書長朱玉表示,從數據生產力和生產關係來看,生產力四個基本要素以及數字要素成為我們新的技術基礎。例如雲計算,去年年底已經建成了500個超大規模的數據中心,這個數字是2015年的兩倍。另一方面,新的生產要素,從土地,人員,資源,到今天,對於新的生產要素數據來說,數據應在整個經濟社會的價值和作用已經日益凸顯。朱玉表示,今天的現實世界平行的數字孿生的世界正在產生。
  • 政企數據共享的思考與建議(附PPT)
    4月18日上午,國家工業信息安全發展研究中心主辦的「激發數據要素潛力研討會」以在線直播方式成功召開。我中心信息政策所數字經濟研究室主任殷利梅發布了我中心關於政企數據共享的最新報告《關於政企數據共享的思考與建議》。
  • 論道:數據共享 v.s. 隱私保護
    本次沙龍圍繞數據開放共享和數據隱私保護進行討論。本文對分享內容進行了不影響原意的改編。問題一:國內外有哪些影響力非常大的數據開放共享的計劃或者平臺?徐葳:學術研究和教學上,我個人比較推薦kaggle,主要原因是kaggle一般會介紹數據的使用方式,預處理方式等。另外,美國聯邦政府也有個開放數據網站data.gov。吳信東:學術界有一個比較大的開放數據平臺DBLP,數據挖掘,資料庫等領域的研究者用的比較多。
  • 40年來小康社會建設研究熱點述評
    2020年是全面建成小康社會的決戰決勝之年。從1979年鄧小平提出小康社會構想至今,建設小康、實現小康是貫穿中國改革開放進程的重要目標。40年來小康社會建設這一理論與實踐兼備的重要命題成為學術界關注的熱點,重要研究成果不斷湧現。縱觀這些成果,主要呈現三個特點:一是從研究時段看,黨的十六大和十八大的召開極大地推動了小康社會建設研究的升溫。
  • 貫徹全會精神·高水平建設整體智治體系和現代政府述評①丨從跑...
    浙江新聞客戶端今起推出貫徹全會精神·高水平建設整體智治體系和現代政府系列述評,敬請垂注。 打造以「整體智治」為核心的現代政府,是浙江在新發展階段,爭創社會主義現代化先行省的一項重要抓手。以數據共享和業務協同兩個模型貫穿於政府一體化進程,對冗雜化、碎片化的政務服務進行流程再造,通過開放的數據共享和高效的業務協同,讓群眾和企業辦事從跑部門轉變為跑政府,則是建設整體智治現代政府的主要目標。
  • 政務數據交換共享解決方案:打破數據孤島 讓數據成為資產
    據統計,政府擁有全社會80%的數據資源,通過運用大數據、雲計算等現代信息技術,形成「用數據決策、用數據管理、用數據服務」的公共管理與服務機制,能夠有效提升政府公共管理能力和國家治理能力,促進社會經濟的快速健康發展。
  • 數據「可用不可見」?讓數據安全共享流通的清華技術來了
    徐葳說,他開始做大數據方面的研究。聚集不同學科、不同背景的人才,正是姚期智成立交叉信息研究院的初衷。「做研究過程中我發現最大的難題是我拿不到數據。」徐葳回憶,「經常也有人打電話到我們實驗室,說想委託我們去做個什麼事情,但說到最後的結果基本都是讓我去他們公司使用數據,而不願意把數據拷給我們。」
  • 深圳市大數據研究院與龍崗區人民醫院健康醫療大數據研究中心成立
    健康醫療大數據的開放共享、互聯互通,在轉變健康醫療服務模式方面發揮越來越重要的作用。在此背景下,健康醫療大數據建設與醫療實踐相結合應運而生,且有著非常廣闊的發展前景。此次成立的健康醫療大數據研究中心正是這樣一個多方協作的醫療健康大數據孵化平臺。
  • 鹹陽市數據共享應用成效顯著
    近年來,鹹陽市圍繞「聚集、共享、應用」三個關鍵環節,依託我市數據共享交換平臺,建立了首席數據官制度,在全省率先提出並制定了核心數據服務清單,全流程網上辦理,倒置數據共享申請、審批環節,打破了數據共享的行業壁壘。
  • 馬敏、洪振強:百年來中國同盟會研究述評
    據粗略統計,1978年到2010年共發表了關於同盟會的論文214篇,平均每年近6.5篇,其年份分布如下表:   根據上表,縱觀此33年間同盟會研究歷程,我們基本可以作出兩點判斷:一是同盟會研究的三大高潮時期分別是1981年和1982年(合計31篇)、1985年和1986年(合計24篇)、2005年和2006年(合計38篇),實際上就是辛亥革命七十周年、同盟會成立八十周年和一百周年期間
  • 【書訊】政府財政支出與經濟高質量發展研究
    出版日期:2020年10月 開本:16開 出版社:經濟管理出版社 《政府財政支出與經濟高質量發展研究》基於國家治理理論,在政府、市場與社會宏觀治理框架下探討政府財政支出規模與結構的優化機理
  • 推動資料開放,柬埔寨 NGO 以開放平臺連結鄰國解決社會問題
    ODC 執行長 THY Try 在 10 月 7 日參加臺灣零時政府(g0vCommunity)舉辦的「2018 零時政府高峰會」,向與會者分享他們在這 7 年來做的事。  針對政府不願和民眾分享信息的態度,一個擁有先見之明、早就想推廣開放資料的民間團體,早在 2011 年便已和 32 個團隊合作,投入「ODC 計劃」,分配人力進行網站設計、資料收集及地圖製作。而該計劃在得知政府否決草案後更是積極進行,經過長期充實平臺內容、舉辦工作坊和組建團隊、擴大組織規模等行動後,ODC 在 2015 年 8 月正式在柬埔寨註冊為非政府組織(NGO)。
  • iRobot將地圖數據共享給了谷歌,谷歌會是好隊友嗎?
    唯獨掃地機器人,是近年來隨著國內外智能家居概念的興起而產生的一個全新的產品形態。更出乎意料的是,根據智研諮詢發布的《2018-2024年中國掃地機器人電商市場競爭現狀及未來發展趨勢研究報告》調研數據顯示,我國家庭服務機器人在沿海城市的產品滲透率僅為5%,內地城市僅為0.4%。
  • 國賽結束,從2020年大賽述評角度對2021年備賽的建議
    :「如何看的見」是關鍵-2019教學能力比賽汽車專業作品梳理學前專業:大賽盤點|學前專業獲獎作品信息化特色應用各個專業數據:最新|2019年教學能力比賽專業組哪個專業獲獎最多?二等獎梳理:大賽專欄|教學能力比賽信息化應用數據大盤點-基礎篇一等獎梳理:2019年教學能力比賽獲獎作品信息化應用數據大盤點-基礎篇閱讀本文前建議先閱讀下文
  • 中國科技改革開放40年的回顧與展望
    中國科技改革開放40年曆程簡述主要依據中央對科技事業作出的全局性重大決定,本文把中國科技改革開放劃分為五個時期,分別是:1978~1984年「恢復科研體系、服務經濟建設」的探索期;1985~1994年「改革科技體制、推進科技與經濟結合」的啟動期;1995~2005年「實施科教興國戰略、推動經濟和社會發展」的深化期;2006~2015年「堅持自主創新
  • 2020年10月31日國內外時政考點
    2020年10月31日國內外時政考點 2020-12-23 22:36 來源:時事一點通 作者:
  • 【日本或2021年春開放觀光客入境】10月3日,多位日本政府相關人士...
    2020-10-04 22:10:14來源:FX168 【日本或2021年春開放觀光客入境】10月3日,多位日本政府相關人士透露,為配合延後到2021年夏天擬登場的東京奧運,日本政府已開始正式討論「有條件」開放外國觀光客入境,最快2021年春天起試行。
  • 印尼新首都建設項目投資全面開放 歡迎國內外企業積極參與
    日前,蘇哈爾索在雅加達說:「政府將把新首都的地區劃分為幾個簇群,讓投資者計算是否有吸引力,項目的回報率(IRR)是否符合預期。政府持開放態度。」 雖然如此,外國投資者的投資項目必須符合政府在總體規劃裡劃分的簇群。 「政府將挑戰投資者的任何要求,所以投資機會向任何人士開放商機。