告別"多亂差「,數據治理究竟治了些什麼

2020-12-11 騰訊網

文章來源:HIT思想薈

作者:老羅

導讀

我們在醫療大數據的開發利用過程中,經常會聽到有關數據治理的描述。

關於「數據治理」的說法很多,從根本來講,其核心是以數據資產為中心,維護和提升數據資產的價值。

目前,醫院信息化正從以建設信息系統和業務應用為主,轉變為以數據資源利用為焦點。在大數據時代的背景下,基於數據的新型應用不斷湧現,數據治理已然成為提高公立醫院資產管理水平的重要手段。

本文全程從醫療信息化領域的視角,探討「數據治理」這一概念。

01

什麼是數據治理?

引用《DAMA 數據管理知識體系指南》一書給出的定義:數據治理是對數據資產管理行使權力和控制的活動集合(規劃、監控和執行)。數據治理的職能是指導其他數據管理職能如何執行。

數據從應用誕生的那一天開始就存在,但是,它與應用的發展是不同步的。起初,人們並不重視數據,數據也就沒有被存儲/利用。但隨著應用的不斷演進,對數據準確性的要求也就越來越高。

(數據治理核心概念)

而數據治理的存在,就是為了確保數據的準確性、適度分析。有效的數據治理計劃,會通過改進決策/縮減成本/降低風險等方式,將價值回饋到業務層面。

老羅認為:

所有為了提高數據質量而展開的技術/業務/管理活動,都屬於數據治理的範疇。

02

隨處可見的數據問題

為什麼我們需要數據治理?答案跟醫療數據現狀有著密切的關係。

國內大大小小的醫院,每家都有幾十到幾百種系統,每個系統都有成百上千張表。這些表的結構非常亂,比如患者的病歷信息,零亂到難以搜索篩查。還有就是,PACS裡面的影像本身沒有做任何的參數調整,所以我們說影像本身的數據是有偏差的。

醫療數據本身價值巨大,但是由於不夠規範、沒有標準,根本無法發揮它的價值,導致了數據很難應用。很多醫院將希望寄託於各式各樣的信息系統,希望它們能將信息整合在一起,但是結果並不如意。

可以說,忽視數據治理給信息化建設帶來了不少問題(數據不統一/數據質量難以提升/數據模型梳理難以完成等基礎性數據問題)。

當數據被集中呈現出來時,人們有些失望地發現,數據雜質很多,錯誤很多,所謂的「信息標準缺失」,「信息系統孤島」就是由此而來。

目前醫療數據的現狀呈現出了以下幾個問題:

● 數據不可知

醫院雖然意識到了大數據的重要性,但並不清楚有沒有能解決所面臨的業務問題的關鍵數據,以及到哪裡去尋找這些數據。

● 數據不可控

數據不可控是從傳統數據平臺開始就一直存在的問題,在大數據時代表現得更為明顯。沒有統一的數據標準,導致數據難以集成和統一;沒有質量控制,導致數據質量參差不齊,難以被利用。

(醫療數據的現狀)

● 數據不可取

醫院即使知道業務所需要的是哪些數據,也不能便捷、自助地拿到數據。況且獲取數據需要很長的開發過程,如此漫長的需求響應時間是難以滿足業務需求的。

● 數據不可聯

醫院信息化建設初期,由於缺乏整體規劃,系統建設大多都是以業務部門驅動的單體架構系統,數據分散在這些架構不統一/開發語言不一致/資料庫多樣化的系統中,導致內部形成了一個個的「信息孤島」。

這些「孤島」之間缺乏有效的連接通道,數據不能互聯互通,交換和共享困難,不能對數據進行自助的探索和挖掘,數據的深層價值難以體現。

我們希望通過整合醫療數據,規範醫療數據,形成醫療數據的通用語言,讓它更方便的檢索和分析。

但這些對於醫療數據應用的美好設想,都是建立在本身擁有優質數據的前提下,倘若不做數據治理和數據共享,是很難實現的。

03

數據治理如何實施?

醫療機構本身就是依託數據開展業務的單位,如果把醫院的數據資源利用比作一架飛機,那麼數據治理就是飛機的雙翼。

目前,醫療數據已從一種資源上升到資產。在保證資產安全的前提下,如何通過一系列的開發、管理把資產價值發揮出來,是非常重要的一項課題。

醫院數據治理被定義為:醫院對其數據資產的管理和控制,支撐並保障數據被安全、高效地交換與使用,下圖展示了醫院數據治理體系。

(醫療數據的現狀,請橫屏觀看。)

搭建數據治理體系時,需要注意以下四個方面:

一,組織與人員機構管理

醫院需要成立專門的數據管理部門,完成流程和規範的制定、數據質量保證和質量控制、流程審批等工作。目前,諸多醫院已經成立了專門的大數據部門,也有醫院將這項工作放在信息科或病案管理室。

二,規範管理

包括流程管理規範/流程支撐規範/信息規範/數據規範。

● 流程管理規範:

用來規定何人在何種應用場景下,通過何人的審批可以操作何種類型的數據。這樣做的好處有兩點,首先,規範了人員/角色的配置與管理,確定數據標準/更新維護/數據質量跟蹤等由誰完成。其次,規範了各種審批流程。

● 流程支撐規範:

依據審批流程,臨床科室可以作為數據使用方提交數據使用要求,大數據管理部門作為數據管理方進行審批。但是,審批過程缺乏詳細的附加規範,比如不同角色的人員如何協作完成工作/何種職責的科室在何種情形下可以導出數據等等,這些都需要通過制定流程支撐規範來實現。

除此之外,特定的流程需要特定的流程支撐規範,比如,科研流程不是簡單的數據導出,通常需要多次的數據欄位細化、數據清洗和融合,面向特定任務建立流程支撐規範,可以確保信息科/數據管理部門/臨床醫生之間的有效協同。

● 信息規範:

包含隱私、數據權限管控規範/質量評估規範。

● 數據規範:

包括不同業務系統,如電子病歷數據規範、醫院信息系統數據規範。對於數據整合過程和整合後的系統來說,需要主數據/元數據規範等相關的數據質量規範。

以上規範的制定有助於完成以下目標:數據有明確的定義;數據有明確的責任方;數據有清晰的存儲方式與合理的時間期限;數據加工方法明晰;數據訪問方式與控制明確;數據內容符合質量要求。

三,平臺,工具,關鍵技術

數據治理需要有相應的平臺與工具支持,數據清洗過程需要抽取—轉換—加載(ETL技術)、文本結構化工具等。

大數據管理需要支持多種存儲機制,管理平臺需要包含元數據管理/數據權限管理/審批流程管理/數據質量評估/數據質量監控等工具。

(ETL過程)

四,元數據管理

元數據(Meta Data)是什麼玩意呢?

百科上給出的定義:元數據就是是描述數據的數據。這麼說很抽象,缺乏相應技術背景的同學,可能當場就懵了。這種情況發生並不奇怪,其實是一個關於知識的怪圈:我們知曉某件事情,向不了解的人描述時卻很難講清楚。

我們不妨借用一個比喻來理解元數據:對於一個人來說,戶口本就是他的信息登記冊:有姓名,年齡,性別、身份證號碼,住址等等,除了這些基本的描述信息之外,還有血緣關係等等。所有信息加起來,構成對這個人的全面描述。這些信息,我們都可以稱之為這個人的元數據。

同理,如果我們要描述清楚一個實際的數據,以某張表為例,我們需要知道表名、存儲的物理位置、主鍵、索引、這張表與其他表之間的關係等等。這些信息加起來,就是這張表的元數據。

這麼一類比,我們對元數據的概念就清楚很多了:元數據就相當於數據的戶口本。

目前醫院信息系統中存在數據模式描述文檔不全/數據關聯不清晰/系統值域標準不統一等問題,這對數據的集成造成了極大的困擾。

因此,需要通過元數據管理獲取業務系統中數據的含義,輔助數據理解,增加分析敏捷性。有了元數據管理,就可以提高數據的可訪問性/一致性/可用性,並且為多種來源數據的整合搭建橋梁。

元數據管理是數據治理的核心和基礎。

老羅有話講

當數據以真實面目呈現在我們面前,我們要做的不是抱怨和質疑,而是要將這種質疑,轉變為對結果產生的溯源。

面對當前信息化沉澱下的「數據果實」,我們要反思,在現有的信息化建設中有多少頂層設計,當初關注點只是聚焦在了建設上,而忽視了應用和治理。

思考之後,我們需要落實到行動。數據治理不僅僅是治理數據生成的工具,還要治理數據生產的業務流程,這種治理能給我們帶來的驚喜,除了準確好用的數據以外,還有精細化協作場景等等。

正如那句老話,建設固然重要,但應用才是目標。

信息化產品就好比農業收割機,數據則是糧食。收割機只是農民耕種的工具之一,想要獲得豐收,最重要的不是工具,而是精心耕耘莊稼。

相關焦點

  • 數據治理,「治」的是什麼?
    數據治理以「數據」為研究對象,主張在確保數據安全前提下,建立健全規則體系,理順各方參與者在數據流通各個環節的權責關係,形成多方參與者良性互動、共建共享共治的數據流通模式,從而最大限度地釋放數據價值。由中國科學院院士梅宏主編、中國人民大學出版社出版的《數據治理之論》對數據治理進行了較為系統的探討,概括起來有以下幾個方面主要內容。
  • 談數據:微服務環境下,數據如何治理?
    中臺和微服務到底什麼關係?微服務的情況下,數據治理該如何搞?一什麼是微服務,微服務與中臺的關係?那微服務環境下,數據治理到底治什麼,在哪治,怎麼治?what ,治什麼?即:哪些數據需要治理?where ,在哪治?即:在單個的微服務中實施數據治理,還是集中到一個數據平臺(數據中臺)進行治理?
  • 從多維度認識共建共治共享社會治理格局的特徵
    共建共治共享社會治理格局強調以人民為中心、合作共治、公平正義等基本價值取向,是應對社會問題的不確定性和複雜性、保障治理主體平等權利、確保使改革發展成果更多更公平惠及全體人民的思想基礎。由於地域廣大、人口眾多、環境複雜等因素,各地區各部門應在以習近平同志為核心的黨中央堅強領導下,認真貫徹落實黨中央關於加強和創新社會治理的決策部署,緊緊圍繞社會治理突出問題,因地制宜進行整體規劃和統籌協調,建立健全社會治理制度和機制,整合社會治理資源和力量,打造共建共治共享社會治理格局。 創新維度:共建共治共享社會治理格局運用移動網際網路、大數據、人工智慧等技術。
  • 創新社會治理:治什麼 誰來治 怎麼治
    ,推進國家治理體系和治理能力現代化」。     (一)社會治理治什麼:「兩平一調」     社會治理主要是黨委政府和各種社會組織為促進社會系統協調運轉,以法律、行政、道德等手段,對社會成員的行為進行規範,對社會公共事務進行組織、協調、服務、監督和控制的過程。
  • 談數據:DGI數據治理框架 全面解讀
    之所以說,DGI框架是一個十分具有實踐指導意義的數據治理模型,主要是它的設計是從組織數據治理的目標或者需求出發進行設計的,描述了誰可以採取什麼行動來處理什麼信息以及何時,在什麼情況下使用什麼方法。DGI框架中的第1-2組件,數據治理願景使命、數據治理目標。用這兩個組件來定義企業為什麼需要數據治理。
  • 探索科學有效的數據治理之路
    習近平總書記強調,要運用大數據提升國家治理現代化水平。要建立健全大數據輔助科學決策和社會治理的機制,推進政府管理和社會治理模式創新,實現政府決策科學化、社會治理精準化、公共服務高效化。這為推進國家治理體系和治理能力現代化打開了一條技術賦能的路徑。可以說,數據治理是數字經濟背景下實現產業轉型升級和國家治理體系現代化的重要路徑之一。數據治理是一項複雜的社會工程。
  • 王紹光:當我們在談「治理」時,我們究竟在談什麼?
    次年,世界銀行發布了報告《治理與發展》,其重點是推銷「good governance」(國內有學者把它翻譯為「良治」),並為推行「良治」開出了四方藥:公共部門管理、問責、法治、信息透明。兩年後,世界銀行又發布了報告《治理:世界銀行的經驗》,專門討論它在「良治」四個方面的作為。再往後,它組建了專門的團隊,研究「治理」的衡量指標,並不時發布各國治理水平的排行榜。
  • 陳一新:「五治」是推進國家治理現代化的基本方式
    原標題:「五治」是推進國家治理現代化的基本方式 黨的十八大以來,特別是黨的十九屆四中全會,以習近平同志為核心的黨中央就國家治理現代化提出了一系列新理念新思想新戰略,其中蘊含的國家治理方式現代化的新要求,主要體現為「五治」——政治引領、法治保障、德治教化、自治強基、智治支撐。
  • 從大國之治邁向強國之治——新中國70年社會治理現代化巡禮
    新華社北京9月20日電 題:從大國之治邁向強國之治——新中國70年社會治理現代化巡禮新華社記者2019年5月15日下午5時30分,湖北省荊州市沙市區的崇文街派出所送走最後一名辦事群眾,老辦公樓「落鎖」。
  • ThoughtWorks中國首席金融數據科學家常國珍:金融數據治理應當以...
    犀利觀點如下:1.幹數據的人員需要有個特點,脾氣要好,因為你發現哪個跟你對接的人脾氣都比你差。2.數位化無非就是把那些存在於個人腦子裡的隱性知識顯性化,顯性知識固化在系統中,讓系統吸收業務人員的智慧。3.數據治理目的就是讓我們的數據更好用,我們說數據治理好就是數據治理要體現商業的價值。大家上午好。
  • 告別軍營,這些老兵給我們留下些什麼
    >都說鐵打的營盤流水的兵然退伍不褪色,曲終不散場如今,退役進入倒計時這些老兵在做什麼他們又想要給軍營留下些什麼讓我們一起來聽聽這些老兵的故事和他們的心裡話——老兵覃羨攏:還能給連隊留下些什麼?「還能給連隊留下些什麼?」馬上就要離開,覃羨攏一直琢磨著這個問題,甚至成了他的一塊「心病」。就在前不久,為方便大家理解記憶,他帶著幾名年輕士官,把機場主道面線路標誌按比例給「拓」到連隊道路上來。就是靠著這種「蠻勁」和「巧勁」,他先後帶出了「徒弟」35名,連隊幾乎所有養場骨幹都是由他一手教帶出來的。
  • 姜曉萍:社會治理須堅持共建共治共享
    黨的十九屆四中全會《決定》提出:「堅持和完善共建共治共享的社會治理制度,保持社會穩定、維護國家安全」。共建共治共享從主體、路徑、目標三個維度體現我國社會治理制度的內在邏輯和要素構成,對於實現社會治理理念科學化、結構合理化、方式精細化,彰顯我國社會治理制度的優勢,具有十分重要的意義。
  • 郭虹:到底什麼是社會治理共同體?
    十九屆四中全會首次將社會管理單獨列出來:共建共治共享的社會治理制度。十八大提出的生態文明建設有相應的生態文明制度,還有黨對人民軍隊的絕對領導制度、一國兩制制度體系、獨立自主的和平外交政策以及黨和國家監督體系。對於中國特色社會主義到底是什麼,我們有了一個比較完整的認識。
  • 「中國之治」與全球治理的「中國方案」
    面對全球治理困境,「中國之治」對變革全球治理體系的要求日益強烈,積極參與並推動全球治理體系變革,推動全球治理「中國方案」的落地生根,而全球治理「中國方案」的實踐又賦予「中國之治」以全球視野和現代化品質。總之,以人類命運共同體統攝「中國之治」和全球治理,是推進中國社會主義現代化建設、促進人類文明發展的必然選擇。
  • 數據治理導論
    一、什麼是數據治理?維基百科:數據治理對於確保數據的準確、適度分享和保護是至關重要的。有效的數據治理計劃會通過改進決策、縮減成本、降低風險和提高安全合規等方式,將價值回饋於業務,並最終體現為增加收入和利潤。
  • 媒體參與社會治理應該深些再深些
    原標題:百姓生活的難點就是社會治理的起點媒體參與社會治理應該深些再深些   在打造新時代共建共治共享的社會治理格局的過程中,地市級新聞主流媒體應在社會治理和創新中發揮怎樣的作用?怎樣為營造共建共治共享的社會治理格局貢獻媒體力量?
  • 晉城:大數據為社會治理現代化插上智慧翅膀
    近年來,晉城市大數據應用局按照市委市政府的安排部署,把大數據應用作為推動法治政府建設的新途徑、新引擎和新手段,以打造「中等智能城市全國樣板」為目標,加快推進市域社會治理現代化工作,強化智治支撐,加快「五治」融合,全力創建全國市域社會治理現代化「示範市」,推動大數據發展應用實現了重大突破,社會「智」治能力不斷提升,為市域社會治理現代化插上了智慧翅膀,並成功躋身「2020領軍智慧城市」,榮獲
  • 黃石:加強數據安全協同治理
    摘編自《光明日報》  【黃石:加強數據安全協同治理】  湖北省社會治安治理研究中心執行主任黃石認為,面對數據安全領域的諸多挑戰,政府、企業、行業組織需要有效配合,發揮各自優勢,建立適應大數據時代要求的協同治理模式。
  • 法治日報:合肥包河「大共治」推進社會治理現代化
    這個事情不大,卻因涉及多個部門而長期沒有得到根治成為了難題,如今順利得到解決,這歸功於合肥市包河區創新推出的「大共治」治理模式。包河區被稱為安徽省第一城區,2019年地區生產總值突破1200億元。在推動經濟高質量發展的同時,包河區同樣高質量推進市域社會治理現代化,探索推行以「平臺匯、大聯動、網格治」為主體的「大共治」治理模式,運用智慧城市大數據技術開發社會治理信息化網絡平臺,統合調度相關職能部門資源,統籌社會力量參與,以黨建為引領下沉治理重心,實行協同指揮、綜合協調、分級負責,依法處置社會治理領域存在的問題和矛盾,貼近群眾訴求,讓群眾更多地共享獲得感,從而保障城市穩定有序健康運行
  • 「大數據、公共管理與城市治理研討會」在上海交通大學舉行
    他特別介紹了上海交通大學國際與公共事務學院、中國城市治理研究院近年來在公共管理學科建設方面和城市治理領域取得的長足發展。Kevin Desouza教授在致辭表示,大數據、人工智慧這些新技術正在對世界產生巨大的影響,對於城市治理領域產生的影響更為深遠,在大數據重塑城市治理的背景下,不能忽視行為主體的作用,最重要的是需要加強對話,在專家學者、政府、企業 、民眾之間的深度對話。