內容提要:公共安全數據管理是近年來興起的一個交叉學科研究領域。文章梳理了公共安全數據管理興起的背景,從「數據管理」「數據監管」和「數據治理」等不同概念下開展的數據研究出發,辨析並明確了公共安全數據管理的內涵,重點對公共安全數據管理的主要研究內容進行了歸納,並總結了公共安全數據管理給相關研究與實踐提出的新問題。
關 鍵 詞:公共安全;數據管理;數據科學;領域大數據;公共安全治理
作者簡介:沙勇忠,男,蘭州大學管理學院,蘭州大學應急管理研究中心教授,博士生導師;陸莉,女,蘭州大學管理學院,蘭州大學應急管理研究中心博士研究生。
基金項目:本文系教育部哲學社會科學研究重大課題攻關項目「大數據驅動的城市公共安全風險研究」(項目編號:16JZD023)與中央高校基本科研業務費專項資金資助重點項目「基於大數據的城市公共安全風險預警研究」(項目編號:17LZUJBWZD012)研究成果之一。
1 引言
大數據時代,數據正在改變著組織的決策因素和管理模式,領域導向的大數據價值開發與利用是實現大數據驅動的管理與決策面臨的重要挑戰之一[1]。然而數據價值的實現離不開對數據本身的管理,在不同行業領域由於認知局限和管理策略不當大量數據正面臨著丟失、不可讀、信息損失、共享和復用困難等風險[2],越來越多的研究者和管理者認識到數據管理是組織不可忽視的一項重要工作。只有在釐清業務系統的基礎上強化原始數據的管理,才能實現從數據到信息再到知識和智慧的升級轉化[3]為管理與決策創造價值。總體來說,數據管理是一個新興領域,目前相關研究多集中在科學數據管理,強調從科研活動和場景出發對研究活動中產生或需要的數據進行管理。但是,單純從科學數據管理角度出發,對其他不同領域數據管理活動進行理解已顯現出其解釋力偏弱和適用性不足等問題。因此,不同領域的數據管理需要跳出科研數據管理的既有界定,結合領域差異性和管理主體特徵,對數據進行體現領域內在規定性的處理和解讀,才能實現數據管理對領域場景決策和行動的價值。
公共安全作為面對複雜性系統問題的一個管理領域,對數據和數據管理有其特殊的領域敏感性和應用要求。公共安全數據是指在公共安全活動中產生或通過其他方式所獲取的,能夠反映公共安全活動的現象、特徵和規律,進而支持管理決策的原始數據或經過加工整理的各類數據集,具有明顯的多源異構及價值密度低等大數據特徵。其大數據特徵使注重事物發展趨勢預測的大數據技術與注重風險監測與預警的公共安全治理思維在運行邏輯上同軌,因此公共安全數據已在智慧交通、智慧消防、食品安全的智慧監管、社會治安綜合治理與精準防控等公共安全領域發揮了重要的作用。作為政府部門的戰略性資產,公共安全數據中蘊含了巨大的社會管理價值、公共服務價值和科學研究價值。但目前公共安全活動中普遍存在重技術應用而輕數據管理、重基礎設施建設而輕數據集成規劃等問題,對數據認知和管理意識的缺乏成為阻礙大數據在公共安全領域價值發揮的關鍵問題。
公共安全數據管理作為一個新領域和新方向的提出,將重點致力於解決以下問題:一方面從技術角度關注多源異構公共安全數據的集成、處理與分析過程,另一方面重視公共安全治理活動中貫穿整個數據生命周期的內外部管理要素和數據的應用情境;通過從數據科學和公共安全的交叉結合中尋找邏輯起點,準確理解公共安全數據管理的內涵,發展公共安全數據管理的知識體系,進而推動數據驅動的公共安全管理實踐發展。
2 公共安全數據管理的興起背景
2.1 大數據時代公共安全治理實踐對數據管理提出新要求
在風險社會的時代背景下,公共安全正在成為優先價值[4]。公共安全治理是公共管理最基本的職能,也是社會發展和公共利益實現的根本前提[5],提升公共安全治理能力和治理水平已成為政府管理部門的重要任務。但現階段我國公共安全治理仍面臨注重事件和危機的應急處置管理而忽視公共安全風險治理,公共安全治理的主體單一、治理技術落後等困境[6]。為提升整體治理能力和治理水平,將風險治理作為公共安全治理的邏輯起點,突出源頭治理和事前的風險管控尤為重要。大數據技術與理論的發展則為實現公共安全治理中的關聯分析、精準研判、動態預警和決策支持提供了信息基礎、工具能力和技術平臺支撐,有助於實現「預防式」的、從風險管理到應急處置再到危機管理整個流程周期的主動式、整體式治理。如北京市東城區利用大數據技術對全區居民慢性病影響因子進行關聯分析驗證,提供區域性病情預警服務[7]。英國交通運輸部等機構的MES SAGE(Mobile Environmental Sensing System Across Grid Environments)項目通過傳感器採集多樣異構的數據用以支持城市級、區域級和國家級的交通規劃和管理,以控制交通活動對環境產生的影響[8]。
但大數據在給公共安全治理實踐帶來機遇與變革的同時,大數據技術的應用與數據價值的挖掘也面臨巨大挑戰。大數據的海量、多樣和迅速變化的特徵給政府管理部門的數據管理和處理能力帶來了嚴峻的考驗,數據間關聯關係的強化更加導致了不同機構間數據鴻溝問題的凸顯[9]。因此,公共安全治理實踐對公共安全數據的處理與管理提出了新的要求。在公共安全治理情境中,大數據功能的實現必須建立在數據充分整合和有效管理的基礎上,通過跨領域、跨組織邊界的數據融合,一方面從數據層面進行關聯,另一方面從業務層面進行集成,才能打破數據共享壁壘,從數據中形成知識和智能,實現大數據驅動的公共安全治理,推動公共安全治理模式由「經驗驅動型」向「事實驅動型」的轉變[10]。
2.2 公共安全研究響應科學研究向數據密集型第四範式轉變的結果
數據管理是數據密集型科研範式即科學研究第四範式的必然要求[11]。吉姆·格雷認為科學研究經歷了實驗科學、理論科學和計算科學階段,目前已進入了數據驅動的第四研究範式階段。其特點是科學研究活動面臨大量的通過設備採集、仿真模擬、傳感網絡生成的多源數據集,研究人員需要通過系列技術和工具支持數據關聯與協作,進行數據的分析挖掘與可視化探索,實現有效的學術交流與傳播[12]。
公共安全治理要求多元主體的廣泛參與,其中高等院校和科研機構成為研發公共安全治理工具、促進大數據技術應用的重要主體,公共安全研究也在逐步向數據密集型研究轉變[13]。Thakuriah等[14]提出在借力多源數據探索城市管理的城市信息學(Urban Informatics)四個主要研究領域(即提升動態城市資源管理策略、城市運行模式及進程的理論洞見和知識發現、城市管理中公眾參與策略以及城市管理規劃和政策分析的創新)中,大數據能夠創新研究方法,既可在已有理論研究支撐下改進現有的城市管理模型並運用大數據進行模擬仿真,也可實現數據驅動的模型構建、模式探測和知識發現,但不可否認的是,數據密集型研究同時也面臨著技術、方法和認識等方面的挑戰,如數據的準備和管理、數據驅動的模型構建、數據安全和隱私問題等。可見,在科學研究範式向數據密集型範式轉變的背景下,不同領域的數據密集型研究均對原始數據本身的管理提出了要求。因此,公共安全數據管理是公共安全研究響應科學研究範式轉變的結果。一方面為公共安全管理理論模型和管理實踐效果的評價提供「數據」這一新的視角和出發點[1];另一方面也在一定程度上擴展了數據密集型研究範式的內涵,為數據密集型研究範式提供了公共安全的領域屬性、理論驗證和實踐素材。
2.3 數據科學與數據管理的興起提供了新思路與新方法
數據科學是從數據中歸納和提煉知識的研究[15],其目標是開展數據界的探索研究從而認識數據的各種類型、狀態、屬性及變化形式和變化規律,進而揭示自然界和人類行為的現象和規律[16],是涵蓋新的理論、方法、模型、技術、平臺、工具、應用和最佳實踐在內的一整套知識體系,主要研究內容包括數據科學基礎理論、數據加工、數據計算、數據管理、數據分析和數據產品開發等[17]。2013年,Mattmann[18]在《Nature》發表文章對數據科學發展願景進行了解讀,並提出數據科學需要在四個方面取得長足進步才能實現大數據在科學研究中的主動性。這四個方面是多樣算法的集成與大數據架構的無縫銜接,軟體的開發與數據管理保存的集成,異構數據的關聯集成和自動解讀,以及兼具科學素養與計算技術的研究者的培養。Mattmann指出有大量的機構如NASA地球科學分布式數據存檔中心,都建立了長期的數據保存管理系統以管理、保存和傳遞數據,相關機構可獲得平均每年一億美元的資金投入,這在一定程度上反映了數據保存與管理的重要性,並指出機構協調是避免數據冗餘、降低成本的關鍵。可見數據管理是數據科學這一新興領域的重要研究內容。
與領域知識的高度融合是數據科學的重要特徵之一,反之數據科學也將促進領域知識中「數據問題」的抽象提煉[17]。數據科學和數據管理研究領域的興起也為公共安全領域數據的管理提供了新的思路和方法,使公共安全數據管理成為一個值得探索且具有交叉學科性質的新領域。目前科學數據管理的理論與實踐探索走在領域數據管理的前列,有許多值得借鑑的理論與實踐經驗。而公共安全數據管理剛剛興起,僅有少數學者對公共安全領域的數據特徵、類型和監管體系進行了初步探索[13,19],更多研究者則關注在公共安全不同情境中多源數據的語義集成、存儲處理、關聯分析與行業應用等具體問題[20-23],__缺乏對公共安全數據特徵、變化規律和管理活動的整體思考。由於公共安全治理活動的複雜性和動態性,實現全生命周期的公共安全數據管理面臨如下問題與挑戰:公共安全數據管理參與主體的角色不明,缺乏數據管理與共享意識;組織之間的數據共享缺乏協同和激勵機制;不同組織採用的應用系統和數據存儲設施的差異性增加了數據統一管理與共享的阻力;涉及個人隱私、密級數據管理、數據安全管理等問題的管理政策不完善等。如何應對公共安全數據管理面臨的挑戰、充分結合公共安全治理情境提升組織公共安全數據管理能力,數據科學與數據管理在理論、方法、模型、技術及應用等方面的成果值得借鑑。
3 公共安全數據管理的內涵
公共安全數據管理仍是一個需要探索的概念,從數據管理的相關概念出發可幫助對公共安全數據管理的內涵進行界定。從已有研究來看,不同學科領域的研究者採用「數據監管」「數據管理」和「數據治理」幾個概念來開展與數據相關的研究。
「數據監管」(Data Curation),國內還有研究者譯為數據管護或數據監護,主要關注對數字資源的管理和完善,尤其是關於科學數據管護的實踐與理論研究是近年來e-Science、圖書館學與檔案學領域的研究熱點。2004年,英國創立了國家級綜合數據管理機構DCC(Digital Curation Center),並將數據監管定義為貫穿數位化研究數據整個生命周期的維護、保存與增值活動,通過主動管理來降低科研數據過時與研究價值降低的風險[2]。英國聯合信息系統委員會(Joint Information Systems Committee,JISC)則將數據監管定義為確保數據當前使用目的、並能用於未來再發現及再利用、從數據產生伊始即對其進行管理和完善的活動,對於動態數據集而言,數據監管意味著需進行持續性補充和更新,以使數據符合用戶的需求[24]。Philip Lord等[25]認為,數據監管的定義涵蓋了三個關鍵活動:一是全過程管理(Curation),側重從數據的產生開始到數據的應用與重用的全過程管理,尤其要注重動態數據集的持續更新與擴充;二是歸檔(Archiving),關注數據的選擇、存儲和可獲得性,並在一定時期內維護數據的邏輯完整性、物理完整性、安全性和真實性;三是長期保存(Preservation),對關鍵數據進行長期保存以支持數據的重新解讀和再利用。Michael Witt等[26]從數據生產者視角出發關注其數據監管需求,構建了一個數據監管剖析框架用以指導數據監管活動,該框架由兩部分組成:一是數據集描述,包括背景信息、數據形式、數據生命周期、應用情境信息、數據價值、關鍵數據抽取等內容;二是監管實踐與需求描述,包括數據產權、數據組織描述方式(元數據格式和標準)、數據抽取的過程與規模、用戶接入、數據搜尋與發現、數據挖掘分析與可視化工具、互操作性、數據影響力測度、數據管理(數據審計、備份與冗餘管理等)和數據的長期保存(政策、格式轉置、保存期限等)。總體來看,「數據監管」的重點在於對數據資源的全生命周期、全過程管理,雖然目前相關研究集中在科學數據管理領域,但相關理論成果與實踐經驗在政府數據管理等其他領域中具有很大的借鑑價值和探索空間。
「數據管理」(Data Stewardship and Management)的概念在計算機科學中較常出現,從信息技術的角度研究如何對數據進行獲取、清洗、集成、存儲和檢索,重點關注數據管理的系統、方法、工具和技術等。如Bill Allcock等[27]對高性能計算網格環境中數據集的高速傳輸和去重管理方法進行了研究;S.Brakatsoulas等[28]研究了交通軌道數據的管理技術,包括數據預處理、數據建模和數據索引等,並通過上述技術實現車輛追蹤數據的分析與挖掘;Jacquelyn Ford Morie等[29]探討了一種面向虛擬實境個體行為研究的數據管理與可視化工具,該工具能夠有效捕捉、管理和分析相關研究中生成的複雜數據,以幫助研究者更為直觀地了解和可視化展示複雜數據之間的關係;T.A.Boden等[30]則探討了美國通量觀測研究網絡的數據管理活動和系統,既涉及了關係資料庫、數據接口與界面、文件傳輸伺服器等數據管理基礎設施的建設,也論述了如何實現控制資料庫內容、自動化數據移動、跟蹤數據來源、管理元數據內容以及處理頻繁添加和更正等操作的實現,同時還提及了多源異構數據集成、用戶數據需求分析與數據產品開發等值得進一步關注的數據問題。雖然並未有關於「數據管理」概念的統一界定,但計算機科學的研究者多在對數據處理的技術、系統、方法與基礎設施等進行論述時將數據的有效存儲、管理、檢索與利用作為目標。此外,也有部分研究者使用「數據管理」這一概念進行科研數據管理、政府數據管理等方面的研究,其研究內涵與「數據監管」屬於同一範疇,在此不再贅述。
「數據治理」(Data Governance)的學術概念源於企業對數據資產的治理。數據治理是指通過制定和實施一系列政策、程序和標準以保證組織的結構化和非結構化數據資產能有效應用的實踐[31],其出發點是「將數據作為組織的一種資產」,主要目的在於通過對組織中相應職責、決策權以及角色的分配[32]來保證數據資產的完整性、準確性、可訪問性和可利用性,涉及數據原則、數據質量、元數據、數據存取和數據生命周期等研究內容[33],以及在企業、政府、醫院和高校等組織中的數據獲取、數據共享、數據重用和數據加值等數據治理實踐[34]。Adrian[35]就「數據管理」與「數據治理」的區別進行了辨析,認為「數據治理」不是一個技術概念而是一個管理概念,它關注的是誰有權並且能夠對數據資產的決策負責的問題。相比於數據管理注重決策的制定執行和具體管理任務的實施,數據治理更關注決策的問責和管理效果的評估;且數據管理側重數據內容本身的管理,而數據治理既包括對數據也包括對相關利益主體的管理[32]。黃璜[36]在對美國聯邦政府數據治理的政策與結構進行分析時指出,政府數據治理可以分為宏觀、中觀和微觀三個層面:宏觀層面的政府數據治理,是政府作為治理主體對數據產業、數據經濟乃至整個社會數據化過程的宏觀治理,如國家數據戰略;中觀層面的數據治理介於宏觀和微觀治理之間,是政府對在社會公共事務治理中所產生或需要的數據資源的治理,涉及政府數據資源的利用、共享和開放等核心議題;微觀層面的政府數據治理,是對政府機構在行政管理過程中所產生和使用的數據,尤其是信息系統中所存儲數據的治理,是維護數據質量、提高決策和管理效率的策略集。其觀點也為公共安全數據管理提供了值得思考的角度。
圖1 相關概念的內涵界定
總體來看,「數據監管」「數據管理」與「數據治理」的概念是從不同學科視角開展的對數據的探索和研究。三者關注的研究重點不同,同時在研究內容上又存在一定的交叉(見圖1)。中國行政管理學會課題組在探討我國政府數據開放頂層設計研究時指出,政府部門數據資源的深入應用正在催生加強數據資源管理的需求,但是政府部門數據資源管理不完全是一個技術問題,而是兼具技術與管理的雙重屬性,需要制度安排與技術保障有機配合[37]。與之相應,公共安全數據的管理同樣兼具技術與管理雙重屬性。由於公共安全數據管理活動是一個具有系統性、協同性、複雜性、多元性和動態性的管理活動,公共安全數據管理也是一個具有廣泛內涵的概念,指在公共安全治理活動中對公共安全數據本身的管理和相關利益主體的協調,並在此基礎上明確管理主體應該實施的管理任務與活動,以及需要運用的管理技術與工具,通過技術支持、標準建設與制度保障等手段共同實現公共安全數據的重用與增值。易言之,本文認為可從三個維度理解公共安全數據管理的內涵:一是從管理客體出發關注數據本身的管理;二是從管理主體出發關注利益相關主體的職責與角色;三是從管理活動出發關注管理主體訴諸管理客體的行動計劃。這三個維度相互聯繫不可分割,共同影響公共安全數據管理的效果。
4 公共安全數據管理的主要內容
4.1 公共安全數據管理的基礎理論
目前,關於公共安全數據管理的研究少而零散,需要系統地研究公共安全數據管理的基礎理論並構建完整的研究體系,使這一新領域新方向成為數據管理乃至數據科學的重要組成部分,推動數據資源在公共安全治理中發揮重要價值。公共安全數據管理的基礎理論研究主要包括以下內容:(1)探討公共安全數據管理的源起,從數據科學維度和公共安全維度及其聯繫中尋求邏輯起點;(2)釐清相關概念,對公共安全數據管理的內涵和外延進行界定;(3)明確研究對象,即公共安全活動中的海量多模態數據;(4)探索公共安全數據管理的基本問題,即發現公共安全數據本身的屬性、特徵和規律,進而從實現數據價值的角度出發,探索如主體、環境、動因、工具等各種管理要素之間的關係和理論框架;(5)分析學科基礎,以實現數據科學、信息科學等學科領域知識的遷移和理論支撐;(6)歸納研究手段和方法,根據研究對象的特性構建包含系統分析、情景分析、模型構建等各類研究方法的公共安全數據管理研究方法體系;(7)探索學科定位與發展方向,把握公共安全數據管理的多學科交叉屬性,使其成長為具有研究潛力的數據管理分支領域。基礎理論研究是構建公共安全數據管理知識體系的基礎,也是公共安全數據管理作為一個新領域確立的重要依據。
4.2 公共安全數據管理模型
目前成熟的數據管理模型總體上可分為兩大類:一是針對數據本身的管理模型,如「數據生命周期模型」「數據質量評估模型」;二是針對數據管理主體的管理模型,如「機構數據管理基礎設施模型」「IBM的數據治理模型」「數據監管能力成熟度模型」等。本文對部分代表性機構提出的數據管理模型進行總結(見表1)。由此可知,相關模型既有從數據全生命周期出發構建的整體性模型,也有針對數據生命周期不同階段、面向不同數據管理任務所構建的階段性模型;既有關注科學數據管理的專門性模型,也有適用於不同領域組織機構數據管理的普適性模型。
數據管理模型是促進數據管理策略理念與管理實踐相結合的重要理論工具。但目前公共安全數據管理模型的研究仍存在空白,結合公共安全數據的應用情境對其管理模型進行探索是公共安全數據管理的核心內容。面向公共安全數據的管理模型研究需要在已有管理模型的基礎上,充分結合公共安全數據的特徵和應用情境,提煉其管理過程中的特殊性問題,使公共安全數據管理模型與公共安全治理活動在數據應用目標和管理過程上達成一致,以指導公共安全數據管理的實踐。
4.3 公共安全數據管理技術、分析方法與工具
公共安全數據管理是一個系統性的工程,針對不同生命周期階段的不同管理任務,需要進行管理工具、處理技術與分析方法的集成,通過統一的管理平臺提供數據集成、數據建模、數據分析和數據服務的能力,維持並不斷改進數據驅動的公共安全治理工作流程。海量多源異構的大數據特徵使得公共安全數據的處理技術與分析方法需要深度集成與融合,常見的鬫簅鎋噓處理技術如數據獲取技術、數據清洗技術、語義集成技術、存儲技術、交換技術、可視化技術、mashups技術等,分析方法如統計分析、網絡建模、模擬仿真、機器學習、自然語言處理等。此外,公共安全數據中還涉及大量的傳感器數據、視頻圖像數據等,對多模態數據的語義集成與關聯融合是公共安全領域研究和實踐中面臨的難點,也是亟待深入探索的重點。
開發面向公共安全領域數據的管理工具和平臺也需要引起業界足夠的重視。除加強Dspace、Dataverse、Fedora等開源通用的數據管理工具在公共安全數據管理中的應用外,面向科研數據管理的專門工具的成功,如由DCC開發的DMPonline和加州大學伯克利分校開發的DMPTool這兩個數據管理計劃工具在眾多高校與科研機構中的成功應用,也表明針對不同領域數據的特徵和應用情境構建專業領域的數據管理工具和平臺,能夠更為靈活地響應領域數據管理需求和目標定位,進行特色應用功能的開發,進而提升領域數據管理的效果和能力。在倫斯勒理工學院的政府開放數據格式轉換項目支持下,A Graves集成了紐約特洛伊城警察、消防、醫院等多部門的公共安全數據,開發了基於語義網(Semantic Web)的公共安全數據管理平臺,該平臺能夠實現數據的長期保存、數據的可視化展示(如公共安全事件地圖)與查詢、數據發布和導出等功能[44],在公共安全數據的集成與可視化展示、促進公眾參與和第三方應用開發方面取得了顯著的成效,其對公共安全數據管理工具與平臺開發的思路以及關於數據質量、數據隱私、數據的公布與可發現等問題的探討和解決經驗值得借鑑。
4.4 公共安全數據管理機制建設
表1 代表性機構的數據管理模型
註:①DCC:英國數據監管中心;②SEI:卡內基梅隆大學軟體工程研究所;③JISC:英國聯合信息系統委員會;④HATII:格拉斯哥大學人文科技信息學院。
公共安全數據管理兼具技術與管理的雙重屬性,需要制度建設與技術保障的有機配合。提煉公共安全數據全生命周期階段的內外部管理要素,根據公共安全數據的管理目標與戰略決策進行管理機制的建設,核心內容包括政府主體等管理職能的明確、數據生命周期與管理職能集成下支持的數據管理活動與數據服務、公共安全數據管理政策的制定、公共安全數據標準與規範的建立以及機構之間的關聯與協同等。其中,統一的公共安全數據規劃、協議與標準規範的制定是數據共享與加值的基礎,從單一主體管理到多元主體協同與公眾參與的轉變則是實現全生命周期的整體性數據管理的關鍵路徑,而公共安全數據管理政策的制定和管理活動與數據服務的明晰則是提升公共安全數據管理能力的有力保證。
公共安全數據管理機制的建設,既要重視和完善國家層面的頂層設計,研究公共安全數據管理機制建設中的共性問題和基礎問題,也要關注不同安全領域的數據規劃和具體管理部門的業務數據剖析,從中微觀層面增強相關管理機制的適用性和靈活性。從現有研究與實踐發展來看,公共安全數據管理機制需從理論研究和實踐應用兩個方面進行深入探索,才能支持和推進跨領域、多主體之間的公共安全數據管理與應用。
4.5 公共安全數據的安全管理
公共安全數據作為事關國家安全與社會穩定的重要基礎性戰略資源,其本身的安全管理至關重要,是數據價值釋放與增值的前提和基礎。實現公共安全數據的共享利用與安全目標的平衡,需要在技術、人員、組織及管理等多個層面統合下,提供技術應用與管理機制的雙重保障。管理機制方面如制定面向公共安全治理活動中多元主體參與的數據安全管理制度、對關鍵部門與組織進行定期的數據安全狀況評估、配置專門的數據安全管理人員等。安全技術方面如加強數據存儲與長期保存的物理防護、進行重要數據資源的信息災備、數據使用過程中的用戶訪問授權與籤名認證、數據流動過程中的加密脫敏和病毒防護等。
從數據安全管理的研究現狀來看,數據訪問權限的機制與技術、用戶信用管理的政策法規與平臺技術、基於區塊鏈等新興技術的數據流動可追溯安全途徑、數據安全存儲與長期保存的風險評估、公開數據與密級數據的分級分類管理、跨組織邊界活動中數據流動的安全風險評估以及數據使用組織安全能力評估等關鍵問題的研究,將是公共安全數據安全管理的重要內容。
4.6 公共安全數據管理的應用實踐
公共安全數據的應用情境和公共安全數據管理實踐是明確公共安全數據的定義、類型與特徵的邏輯起點,也是明晰公共安全數據管理的內涵與主要內容的基礎。通過凝練典型公共安全數據管理經驗和總結最佳實踐,能夠進行基於案例研究的最佳實踐策略要素的提取,以支持公共安全數據的研究活動。目前,公共安全數據管理的應用實踐主要有兩種存在形式,一是不同安全領域的典型案例與數據管理項目,如荷蘭司法部的犯罪與司法數據集成項目[45],佛羅裡達國際大學的災害數據管理調研項目[46],我國成都市食品安全監測預警數據中心的食品安全數據匯聚與共享管理項目;二是政府數據開放平臺中對「公共安全」數據的發布與共享,不同類型的政府數據開放平臺或有專門的「公共安全」主題板塊,或是在不同主題板塊下分布著與公共安全相關的零散數據集。本文對國內外典型的政府數據開放平臺中的「公共安全」數據發布狀況進行總結分析(見表2)。
從上述兩種方式來看,目前公共安全數據管理實踐還未完全實現全生命周期的管理,且缺乏一致的管理框架。尤其以政府數據開放平臺為途徑的公共安全數據發布共享存在明顯的主題交叉、層級混亂和領域不明的問題,缺乏統一的公共安全數據分類標準和數據規範,這一問題也更加凸顯了制定統一的公共安全數據管理規劃的重要性。
5 公共安全數據管理所提出的新問題
表2 政府數據開放平臺中的「公共安全」數據板塊分析
註:檢索時間為2018年12月11日。
按照夏佩爾的信息域(Domain of information)理論,問題是信息域的核心,信息域中心問題的重新設置是科學進化的主要標誌。公共安全數據管理作為一個正在興起的交叉學科領域,為相關研究與實踐提出了新問題。這些問題的提出是公共安全數據管理作為一個新領域確立的重要依據,隨著相關實踐的發展和理論研究的深入,這些問題會進一步集聚和重組,新的問題也會不斷出現,促使公共安全數據管理知識體系的形成和不斷進化。
(1)注重公共安全數據管理客體、主體與管理活動的統合。從不同學科領域所開展的與數據相關的研究內容來看,「數據監管」側重從信息科學和圖書檔案學角度關注數據的管理活動,「數據管理」側重從計算機科學角度關注數據的處理技術與分析建模,「數據治理」則側重從企業管理和行政管理角度關注企業、政府等組織內的數據治理決策與角色定位,同時三種研究視角在數據質量、新技術應用、數據管理平臺搭建、數據標準構建等研究內容方面又具有一定程度的交叉重疊。從公共安全治理情境中審視公共安全數據管理,理應具有更廣泛的內涵,在理念、制度與技術上形成價值目標的統一。數據管理主客體與管理活動的分離一方面導致數據管理研究中概念與內涵界定混亂,另一方面也不利於全過程、全生命周期的整體性數據管理的實現。因此,公共安全數據管理必須將信息科學、數據科學等相關概念和邏輯向公共安全數據管理領域進行延伸,跨越不同學科領域之間的研究缺口,將公共安全數據管理的主體、客體與管理活動在一致的管理目標與框架下統一起來,促進公共安全數據研究內容的擴展和研究方法的豐富,進而使其管理實踐有突破性的進展。
(2)強調政府組織不同層面公共安全數據管理問題的提煉與解決。政府組織是公共安全數據管理的核心主體,從現有政府數據管理研究情況來看,宏觀層面的政府數據開放頂層設計與數據治理規劃研究較多,而中微觀層面的具體數據管理問題缺乏關注。公共安全數據管理,既要關注宏觀層面統一管理框架的搭建和規劃設計,更要關注中觀層面政府對公共安全事務治理過程中多源數據的集成,以及微觀層面公共安全管理機構對行政管理過程中產生和使用的業務數據本身的管理。通過解決公共安全數據管理規劃、跨部門協同、公共安全數據管理的政策法規、公共安全數據的標準建設、公共安全數據質量管理等不同層面的數據管理問題,構建並完善公共安全數據管理體系與機制。
(3)突出公共安全治理情境中數據的特殊性和數據管理活動的差異性。領域導向的數據管理研究是數據科學的理論方法與領域知識相結合的產物,也是從「數據」這一研究視角關注與探索領域活動規律與特徵的新方向。目前,圖書館與高校科研機構等的科學數據管理無論是在理論成果還是實踐上成效顯著,而政府數據管理研究的領域特徵不夠明晰,面向某項重大問題或開展某類重要決策需要專門組織開展數據歸集活動仍有極大的探索空間,不同政府職能背景下的行業數據管理也缺乏足夠的關注。公共安全領域數據的管理需要從宏大的社會數據資源、管理部門業務數據資源以及網際網路數據資源等大範圍中,根據公共安全活動和治理主體的履職需要鎖定其中的關鍵數據,從關注社會系統數據全集過渡到關注公共安全領域數據子集,發現公共安全領域數據的特殊性和管理活動的差異性,才能制定更具效能的公共安全數據管理策略和機制,幫助推進公共安全數據管理實踐的發展和公共安全數據價值的挖掘。
(4)從數據作為關鍵資產的視角出發促進公共安全數據的增值和數據產品的開發。商業領域將企業數據作為一種戰略資產已成為普遍的共識[47]。政府開放數據也被認為是具有賦予公民與企業權力和改變政府提供公共服務方式潛力的重要資源[48]。作為公共安全服務的提供者和公共安全數據管理的主導者,政府管理部門擁有的公共安全數據是其重要的數據資產和戰略性基礎資源。公共安全數據資產的社會價值與經濟價值開發,一方面能夠加強數據的內部使用進而更好地支持政府數據開放、提升公共安全服務,另一方面有助於加強與行業企業的合作,促進數據產品的開發和提供協同數據的公共安全服務,創新公共安全治理外部服務形態。公共安全數據的資產價值評估、數據資產定價、相關組織數據資產審計、機構數據資產元數據集構建、數據資產追溯管理等均是學界和實踐界需要關注的新問題。
(5)公共安全治理活動中跨組織邊界數據流動的安全評估與管控。在「總體國家安全觀」指導下,政府管理部門提升公共安全治理能力和治理水平越來越需要應對跨組織邊界的公共治理難題和複雜突發公共安全事件。數據作為治理活動的基礎性資源,也相應的面臨跨組織邊界的數據流動,包括組織環境維度的跨境、跨區域和跨領域數據流動,不同組織之間的數據流動以及組織內部的跨層級、跨部門、跨系統數據流動。不同層次的數據流動給政府管理部門帶來了全方位的挑戰,如跨境數據流動引發的數據管轄權和數據主權問題,跨領域數據流動帶來的數據融合與集成問題,不同組織之間的數據外部流轉導致的數據質量和安全管理問題,以及組織內部支持數據流動的數據協同與匯集管理問題。但在各種挑戰中,公共安全數據本身的安全問題顯得尤為重要,且貫穿於不同層次、全生命周期的數據流動過程中。如跨境公共安全數據流動存在的竊取、病毒攻擊等安全失控隱患與國家安全和社會穩定密切相關,而組織之間與組織內部的數據流動也容易觸發數據的篡改、丟失、濫用、誤用等安全問題。加強跨組織邊界公共安全數據流動過程中的全周期安全評估與管控,包括數據的導入、脫敏、完整性驗證、留存、運用、可視化、外調、銷毀等多個環節[49],是保證數據安全和有效共享利用的基礎,也是實現平衡多元主體利益的公共安全數據生態的重要保障。
(6)公共安全數據管理的倫理問題與隱私保護。隱私權、信息獲取權、信息安全權等與人的信息權利有關的倫理問題[50]是資訊時代人們長期關注的焦點,公眾對大規模數據收集的擔憂也容易引發系列情緒反應[51]。在公共安全治理活動的不同場景中,由於數據生產主體、利用方式、應用目的和涉及利益相關者的差異性,公共安全數據的採集與使用也面臨著不同程度的倫理挑戰與隱私問題。典型如突發公共安全事件輿情監測中的個人信息保護,人群狀態分析與異常行為檢測中的地理隱私(Geoprivacy)和算法安全(Algorithmic Security)等問題。美國稜鏡門事件就凸顯了其公共安全目標與全球民眾隱私及網際網路自由的衝突,同時也表明「安全」與「隱私」是相互構成相互影響的,應統籌考慮而不是在二者之間權衡利弊[52]。因此,識別公共安全數據全生命周期中的倫理問題並分析相關的形成原因和表現形式,有助於明確數據採集與共享的倫理底線與約束性要求,規範公共安全數據利用行為,既有助於凸顯數據的使用價值,又能夠促進數據驅動的公共安全治理在倫理可辯護的框架內發展。
6 結語
公共安全數據管理是將數據科學、信息科學等學科的相關理論、概念和邏輯向公共安全領域的延伸,是從公共安全治理活動和情境出發,充分利用現有數據管理的理論成果探索公共安全數據的特殊性和管理活動的差異性,以明確公共安全數據管理中的概念體系、問題範圍和分析方法,實現公共安全數據的全要素、全過程、多維度的管理目標。公共安全數據管理作為一個新興領域,其內涵和知識體系正在發展之中,對公共安全界和數據科學界來說,公共安全數據管理意味著新的挑戰、新的方向和新的觀念。學界和業界需要站在新一輪信息技術發展的前沿,結合我國公共安全治理的實踐需要,推動公共安全數據管理的研究發展與實踐創新,使公共安全數據管理成為大數據時代響應總體國家安全觀、加強我國公共安全綜合能力建設的重要學科支撐和實踐力量。
原文參考文獻:
[1]徐宗本,馮芷豔,郭迅華,等.大數據驅動的管理與決策前沿課題[J].管理世界,2014(11):158-163.
[2]王芳,慎金花.國外數據管護(Data Curation)研究與實踐進展[J].中國圖書館學報,2014,40(4):116-128.
[3]沙勇忠,牛春華,等.信息分析(第二版)[M].北京:科學出版社,2016.
[4]丁翔,張海波.大數據與公共安全:概念、維度與關係[J].中國行政管理,2017(8):36-41.
[5]吳愛明.公共安全:公共管理不可忽視的社會問題[J].行政論壇,2004(6):4-6.
[6]孫粵文.大數據:風險社會公共安全治理的新思維與新技術[J].求實,2016(12):69-77.
[7]陳之常.應用大數據推進政府治理能力現代化——以北京市東城區為例[J].中國行政管理,2015(2):40-44.
[8]Donnelly M,North R.The Milieu and the MESSAGE:Talking to Researchers about Data Curation Issues in a Large and Diverse e-Science Project[J].IJDC,2011,6(1):32-44.
[9]李月,侯衛真.政府大數據應用的多元主體協同策略研究——紐約市案例分析[J].圖書情報工作,2017,61(10):50-56.
[10]張春豔.大數據時代的公共安全治理[J].國家行政學院學報,2014(5):100-104.
[11]黃如花,李楠.高校圖書館參與科學數據驗證的前景分析[J].圖書情報工作,2016,60(3):15-20.
[12]Hey T,Tansley S,Tolle K M.The fourth paradigm:data-intensive scientific discovery[M].Redmond,WA:Microsoft research,2009.
[13]曾子明,楊倩雯.面向第四範式的城市公共安全數據監管體系研究[J].情報理論與實踐,2018(2):82-87.
[14]Thakuriah P V,Tilahun N Y,Zellner M.Big data and urban informatics:innovations and challenges to urban planning and knowledge discovery[M].Seeing Cities through Big Data.Springer,Cham,2017:11-45.
[15]Dhar V.Data science and prediction[J].Communications of the ACM,2013,56(12):64-73.
[16]葉鷹,馬費成.數據科學興起及其與信息科學的關聯[J].情報學報,2015(6):575-580.
[17]朝樂門,盧小賓.數據科學及其對信息科學的影響[J].情報學報,2017,36(8):761-771.
[18]Mattmann C A.Computing:A vision for data science[J].Nature,2013,493(7433):473.
[19]黃全義,夏金超,楊秀中,等.城市公共安全大數據[J].地理空間信息,2017(7):9,12-19.
[20]Cervone G,Schnebele E,Waters N,et al.Using social media and satellite data for damage assessment in urban areas during emergencies[M].Seeing Cities Through Big Data.Springer,Cham,2017:443-457.
[21]Kaza S,Chen H.Evaluating ontology mapping techniques:An experiment in public safety information sharing[J].Decision Support Systems,2008,45(4):714-728.
[22]Graves A.A case study for integrating public safety data using semantic technologies[J].Information Polity,2011,16(3):261-275.
[23]Choenni S,Leertouwer E.Public safety mashups to support policy makers[C].International Conference on Electronic Government and the Information Systems Perspective.Springer,Berlin,Heidelberg,2010:234-248.
[24]吳金紅,陳勇躍.面向科研第四範式的科學數據監管體系研究[J].圖書情報工作,2015,59(16):11-17.
[25]Philip Lord,Alison Macdonald,Liz Lyon,et al.From data deluge to data curation[DB/OL].[2019-05-23].http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.111.7425&rep=rep1&type=pdf.
[26]Witt,Michael,et al.Constructing data curation profiles[J].International Journal of Digital Curation,2009,4(3):93-103.
[27]Allcock B,Bester J,Bresnahan J,et al.Data management and transfer in high-performance computational grid environments[J].Parallel Computing,2002,28(5):749-771.
[28]Brakatsoulas S,Pfoser D,Tryfona N.Practical data management techniques for vehicle tracking data[C].Data Engineering,2005.ICDE 2005.Proceedings.21st International Conference on.IEEE,2005:324-325.
[29]Morie J F,Iyer K,Luigi D P,et al.Development of a data management tool for investigating multivariate space and free will experiences in virtual reality[J].Applied Psychophysiology and Biofeedback,2005,30(3):319-331.
[30]Boden T A,Krassovski M,Yang B.The AmeriFlux data activity and data system:an evolving collection of data management techniques,tools,products and services[J].Geoscientific Instrumentation,Methods and Data Systems,2013,2(1):165-176.
[31]Marco D.Understanding data governance and stewardship,Part 1[J].Information Management,2006,16(9):28.
[32]劉桂鋒,錢錦琳,盧章平.國內外數據治理研究進展:內涵、要素、模型與框架[J].圖書情報工作,2017,61(21):137-144.
[33]Khatri V,Brown C V.Designing data governance[J].Communications of the ACM,2010,53(1):148-152.
[34]顧立平.數據治理——圖書館事業的發展機遇[J].中國圖書館學報,2016,42(5):40-56.
[35]Adrian Gregory.Data Governance—Protecting and Unleashing the Value of Your Customer Data Assets Stage 1:Understanding Data Governance and Your Current Data Management Capability[J].Journal of Direct,Data and Digital Marketing Practice,2011,13(3):40-56.
[36]黃璜.美國聯邦政府數據治理:政策與結構[J].中國行政管理,2017(8):47-56.
[37]中國行政管理學會課題組,鮑靜,賈凌民,等.我國政府數據開放頂層設計研究[J].中國行政管理,2016(11):6-12.
[38]Higgins S.The DCC curation lifecycle model[J].International Journal of Digital Curation,2008,3(1):134-140.
[39]Wilson J A J,Martinez-Uribe L,Fraser M A,et al.An Institutional Approach to Developing Research Data Management Infrastructure[J].IJDC,2011,6(2):274-287.
[40]Crowston K,Qin J.A capability maturity model for scientific data management:Evidence from the literature[J].Proceedings of the American Society for Information Science and Technology,2011,48(1):1-9.
[41]Jones S,Ball A,Ekmekcioglu .The Data Audit Framework:a first step in the data management challenge[J].International Journal of Digital Curation,2008,3(2):112-120.
[42]Cox A,Williamson L.The 2014 DAF survey at the University of Sheffield[J].International Journal of Digital Curation,2015,10(1):210-229.
[43]Beagrie N,Chruszcz J,Lavoie B.Keeping research data safe:A cost model and guidance for UK universities[M/OL].[2019-07-18].
http://www.jisc.ac.uk/media/documents/publications/keepingresearchdatasafe0408.pdf.
[44]Graves A.A case study for integrating public safety data using semantic technologies[J].Information Polity,2011,16(3):261-275.
[45]Choenni S,Leertouwer E.Public safety mashups to support policy makers[C].International Conference on Electronic Government and the Information Systems Perspective.Springer,Berlin,Heidelberg,2010:234-248.
[46]Hristidis V,Chen S C,Li T,et al.Survey of data management and analysis in disaster situations[J].Journal of Systems and Software,2010,83(10):1701-1714.
[47]Short J,Todd S.What's Your Data Worth?[J].MIT Sloan Management Review,2017,58(3):17.
[48]Zeleti F A,Ojo A,Curry E.Exploring the economic value of open government data[J].Government Information Quarterly,2016,33(3):535-551.
[49]鮑靜,張勇進.政府部門數據治理:一個亟需回應的基本問題[J].中國行政管理,2017(4):30-36.
[50]沙勇忠.國外信息倫理學研究述評[J].大學圖書館學報,2003(5):8-13.
[51]Thompson N,Ravindran R,Nicosia S.Government data does not mean data governance:Lessons learned from a public sector application audit[J].Government Information Quarterly,2015,32(3):316-322.