怎樣從髒亂差的醫療大數據中提取價值(一)

2021-01-12 人人都是產品經理

編輯導語:隨著醫療衛生信息化建設進程的不斷加快,醫療數據的類型和規模也在以前所未有的速度迅猛增長。大數據時代,學會分析數據並且將其應用至工作中,不僅可以節省時間,提高效率,還能提取其中的價值,為醫生和患者提供便利。

一、醫療大數據的背景

迫切的需求:

缺乏統一整體的頂層設計:以HIS為核心的堆疊式建設,醫院整體信息化的擴展性較差,很難適應後續的信息化發展;臨床應用深度不夠:實現醫院以臨床為中心、為患者提供優良的醫療服務,實現全面準確的臨床醫療信息源,提高醫療質量和服務水平;缺乏運營精細化的支撐:沒有形成資源的集中統一管理,未建立醫院人財物的一體化管理;缺乏全院的數據整合、數據利用率較低:數據的利用率較低,沒有對臨床和管理起到支撐;信息系統間交互耦合度過高:基於HIS系統的一體化設計,耦合度較高;數據集中存儲,帶來系統升級和數據安全等問題;數據標準規範性問題:缺乏全院的數據標準規範,系統間數據共享率低。

二、醫療大數據的來源

1. 病人就醫過程中產生的數據

從掛號開始便將個人姓名、年齡、住址、電話等信息輸入系統;面診過程中病患的身體狀況、醫療影像等信息也會被錄入系統;看病結束以後,費用信息、報銷信息、醫保使用情況等信息被添加到醫院的系統裡面。

這就是醫療大數據最基礎、最龐大的原始數據資源。

2. 臨床醫療研究和實驗室數據

臨床和實驗室數據整合在一起,使得醫療機構面臨的數據增長非常快,一張普通CT圖像含有大約150 MB的數據,一個標準的病理圖則接近5 GB。

如果將這些數據量乘以人口數量和平均壽命,僅一個社區醫院累積的數據量就可達數萬億字節甚至數千萬億字節(PB)之多。

3. 製藥企業和生命科學

藥物研發所產生的數據是相當密集的,對於中小型的企業也在百億字節(TB)以上的。

在生命科學領域,隨著計算能力和基因測序能力逐步增加,美國哈佛醫學院個人基因組項目負責人詹森·鮑比就認為,到2015年,將會有5000萬人擁有個人基因圖譜,而一個基因組序列文件大小約為750MB。

4. 智能穿戴設備帶來的健康管理

隨著行動裝置和移動網際網路的飛速發展,可攜式的可穿戴醫療設備正在普及,個體健康信息都將可以直接連入網際網路,由此將實現對個人健康數據隨時隨地的採集,而帶來的數據信息量將更是不可估量的。

三、醫療大數據的價值

1. 服務居民

居民健康指導服務系統,提供精準醫療、個性化健康保健指導,使居民能在醫院、社區及線上的服務保持連續性。妙健康提供了專業的醫生團隊,能夠在線幫助用戶解決各種病症,進行健康指導。

居民也可以在其掌上藥房購買日常所需藥品,方便快捷。

2. 服務醫生

臨床決策支持,如用藥分析、藥品不良反應、疾病併發症、治療效果相關性分析、抗生素應用分析;或是制定個性化治療方案。通過妙健康在線醫生,醫生可以在線進行相關的醫療指導,做出醫療診斷,還能夠有效減少門診量。

3. 服務科研

包括疾病診斷與預測、提高臨床試驗設計的統計工具和算法、臨床實驗數據的分析與處理等方面,如針對重大疾病識別疾病易感基因、極端表現人群、建立個人健康醫療檔案等。

個人健康醫療檔案的建立,能夠讓個人醫療信息共享,讓醫生能直接快捷地了解患者既往病史,避免了重複問診的現象,使患者能夠及時有效地接受治療。

4. 服務管理機構

規範性用藥評價;流行病、急病等預防幹預及措施評價;公眾健康監測,臨床路徑的優化等。

5. 公眾健康服務

包括危及健康因素的監控與預警、網絡平臺、社區服務等方面。通過數據採集、風險評估、健康幹預等方式來為客戶提供健康管理等一系列服務服務。

四、醫療大數據的現狀

1. 數據異構

多平臺,多種接口,數據類型沒有一個標準,只能是點對點的對接大量數據,內容冗雜、過程繁複、速度緩慢。

2. 主題分散性

就診信息分布在不同的平臺上,不能夠形成以患者為中心的所有電子化就診信息集成,不能提供完整、全面、準確、及時的患者臨床信息。

3. 數據量大

在大數據背景下,行業應用的數據量通常都以億級別計算,存儲通常在TB/PB級別甚至更多。

4. 數據多態

數據模型在數據出現之後才能確定,數據模型隨著數據量增長不斷演變。

五、建立醫療大數據資產目錄

依據衛生部信息化工作領導小組辦公室衛生部統計信息中心2011年3月發布的《基於電子病歷的醫院信息平臺建設技術解決方案——業務部分》所示:

1. 臨床服務域

包含12個二級類目:患者標識、患者服務、入出轉、醫囑、病歷文書、護理文書、檢驗、檢查、手術麻醉、治療、輸血、健康體檢,業務子域共計26個。

2. 醫院管理域

包含4個二級類目:醫療管理、人力資源管理、財務管理、物資及後勤服務管理。共有業務子域共26個。

3. 平臺應用域

包含5個二級類目:區域醫療協同、管理決策、臨床決策、公共衛生信息上報、患者公眾服務。共有業務子域20個。

根據臨床服務、醫院管理、平臺應用三域,梳理建設以業務活動為核心的數據資產目錄,根據業務活動主題梳理數據元標識符,保證每一個數據元的標識符具有唯一性(基本數據集:城鄉居民健康檔案、疾病管理、醫療服務、電子病歷等)。

1)數據元標識符「DE08.10.052.00」來源依據《TCHIA 7.3-2018 高血壓專科電子病歷數據集 第3部分:高血壓門(急)診處方》

2)數據允許值「WS218–2002」來源依據《WS 218-2002 衛生機構(組織)分類與代碼》

六、從業務系統中抽取數據

關聯映射業務系統表欄位,並創建調度任務,如圖五:

映射多表情況下,需要選擇關聯表主外鍵欄位,如圖六:

調度任務可支持針對單表、全表,歷史數據抽取,實時數據監聽抽取倆種模式,如果圖七:

七、數據質量質控

具有對數據質量進行評估的完整的指標體系,至少應該有完整性(事件、表單、記錄、表項)、一致性(主數據一致性、邏輯一致性)、唯一性(無二義冗餘、指標及計算口徑)、及時性、原始性、可溯源性及可測量性。

八、數據中臺建設

根據數據資產目錄快速定位業務主題,如圖八:

根據不同業務場景,自定義勾選數據元名稱,自動生成API或新的主題庫(數據集市)。

本文由 @CTO老王 原創發布於人人都是產品經理,未經許可,禁止轉載

題圖來自 Pexels,基於 CC0 協議

相關焦點

  • 怎樣從髒亂差的醫療大數據中提取價值(二)
    編輯導語:上期講到了隨著大數據時代的到來,醫療信息化建設迫切的需求與醫療大數據的溯源過程,還深入的提出了在髒亂差的醫療大數據中怎麼發現價值;接下來我們再進一步探討一下數據的價值與特徵。
  • 大數據在醫療、供應鏈和智慧城市中的作用
    Cambridge Analytica舉報人Brittany Kaiser也在傳播此信息,他後來成為數據道德倡導者,並建立了自己的數據基金會。通過讓人們和數據所有者能夠利用其個人數據獲利,我們將這一概念進一步發展。提交到我們平臺的數據通過虛擬機進行管理,以確保數據安全,然後在市場類型的環境中定價。購買數據後,數據所有者將以CVT令牌接收付款。
  • 打開臨床診療與醫學科研「數據通路」——大數據於臨床醫學價值的...
    兩者在促進臨床診療和科研水平的提高中,本應相輔相成,互相促進,但現實面臨的問題,又困擾著醫生群體、管理部門、乃至整個社會民眾。隨著醫療大數據領域技術的進步和實際應用的快速發展,這一矛盾能否解決,並充分的互相反哺和促進?
  • MTT實現醫療大數據在醫療領域的全面應用
    構建醫療數據應用生態體系,MTT實現醫療大數據在醫療領域的全面應用無論是政府、市場還是資本,都紛紛加碼醫療大數據行業,宏觀環境不斷朝著利好方向推進。然而,即便醫療大數據備受關注,不可否認其數據缺乏標準化、交換性數據量大,數據類型複雜,臨床數據管理和整合能力欠缺和大數據高效分析能力欠缺的行業痛點。而區塊鏈的出現有望打破這一僵局,MTT醫療大數據項目的實施,不僅可以解決醫院信息孤島問題,挖掘歷史數據價值、將數據進行分層處理,更可減少資源消耗,實現數據的統一入出管理、實現數據標準統一。
  • 移動醫療大數據的幾個偽命題:大數據的陷阱與小數據的重要性
    上一篇我們提到,在醫療大數據項目中,很多情況下,由於無法驗證有效性、敏感性和特異性,所以即使得出了100個結果趨勢,卻沒有幾個是有臨床參考意義的,就是說即使看起來是那麼一回事,又怎麼樣,能反過來指導臨床嗎
  • Power Query結構數據中的數據提取方法
    表格可以看作是列表與記錄的結合體,在table中列用方括號,那麼列就相當於是記錄行用大括號,行就相當於是列表Power Query中要提取指定位置的數據應該怎麼做?list前面一個大括號是一個list列表,相當於{1,2,3}後面一個大括號就是提取的數據的位置,這個和VBA中數組的約定是相同的,第一個位置是從0開始。整句話的意思就是從1到3的列表中取出第一個值。
  • 大數據的七大核心具體價值
    大數據,可以說是史上第一次將各行各業的用戶、方案提供商、服務商、運營商以及整個生態鏈上遊廠商,融入到一個大的環境中,無論是企業級市場還是消費級市場,亦或政府公共服務,都正或將要與大數據發生千絲萬縷的聯繫。近期有不少文章暢談大數據的價值,以及其價值主要凸顯在哪些方面,這裡我們對大數據的核心具體價值進行了分門別類的梳理匯總,希望能幫助讀者更好的獲悉大數據的大價值。
  • 「沉睡」的醫療大數據該如何挖掘 專家:數據共享有三大阻礙
    研究表明,目前被利用的臨床數據只佔醫療總數據的10-20%,如何挖掘各醫療機構中沉睡的海量數據並深度利用,有著重要的理論意義和臨床實用價值。 新民晚報記者從一場線上論壇獲悉,位於長三角的之江實驗室建立了多中心智能醫學信息平臺,實現了一站式、跨機構、無障礙的多中心臨床數據深度利用。
  • 醫療健康大數據:應用實例與系統分析
    根據國際數據公司(International DataCorporation,IDC)的報告,僅2011年,全世界產生的數據就有1.8 ZB(1 ZB≈1 021 byte),並且平均每5年增長9倍[1]。大數據一詞由此而生。大數據是指難以被傳統數據管理系統有效且經濟地存儲、管理、處理的複雜數據集。
  • 依圖醫療以AI技術賦能醫學數據
    依圖醫療作為AI醫療領域的唯一企業,獲得2017優秀創新案例獎。依圖醫療副總裁方驄博士與會發表了《AI賦能醫學數據》的主題演講,詳述AI技術和醫學數據在依圖碰撞出了怎樣火花,如何為醫生、患者和整個社會帶來顛覆性的創新。
  • 中科院田捷教授:基於 AI 和醫療大數據的影像組學研究及其臨床應用...
    在他看來,醫療大數據裡最常見的是影像數據,而且影像數據格式標準,容易獲取、容易使用。但是醫療大數據不僅限於影像,還包括病理、臨床治療信息等,只有這些信息融合在一起,我們才能建模,才能解決人工智慧真正在醫學上的應用。田捷教授在研究學術的同時,也在積極探索AI技術的應用前景。他認為,AI技術只有跟臨床掛鈎才有價值,經過企業家的轉化才能變成生產力。
  • ...AI 和醫療大數據的影像組學研究及其臨床應用 丨CCF-GAIR 2018
    在他看來,醫療大數據裡最常見的是影像數據,而且影像數據格式標準,容易獲取、容易使用。但是醫療大數據不僅限於影像,還包括病理、臨床治療信息等,只有這些信息融合在一起,我們才能建模,才能解決人工智慧真正在醫學上的應用。田捷教授在研究學術的同時,也在積極探索AI技術的應用前景。他認為,AI技術只有跟臨床掛鈎才有價值,經過企業家的轉化才能變成生產力。
  • 生物醫療大數據的出路與去路探討
    ——值得萬千球迷慶幸的是,大數據邂逅了本次世界盃。依靠科學的算法數據分析,百度、高盛、谷歌、微軟構成了本屆世界盃「瘋狂猜球」比賽的陣容,各種「詭異」比分結果出來後,小夥伴們一次又一次驚 呆拜服於這些運營商軟體基於大數據的神預測。時下,大數據正如潮水般湧入各行各業,並有愈演愈烈之勢。生物醫療領域的大數據應用又面臨怎樣的局面?生物醫療大數據的出路在哪?去路又在哪裡?
  • 「網際網路+醫療」健康醫療大數據能帶來什麼?
    「網際網路+醫療」健康醫療大數據能帶來什麼?  ——訪市中心醫院副院長、中國衛生信息與健康醫療大數據學會網際網路醫院專業委員會副主任委員楊國慶    楊國慶,市中心醫院副院長、中國衛生信息與健康醫療大數據學會網際網路醫院專業委員會第一屆副主任委員。在全國數千家同級醫院的同行中脫穎而出擔任這一職務,既是對醫院近年來在「網際網路+醫療」方面做出的努力和取得的成績的一種認可,也是對他個人能力的認可。   那麼,近年來,醫院在「網際網路+醫療」的做了哪些動作?接下來還有哪些驚喜等待著大家?
  • 讓大數據真正發揮「大價值」
    讓大數據真正發揮「大價值」  數字經濟時代,大數據帶來的諸多便利得益於被譽為「萬能糧倉」的數據中心。數據中心算力越強,大數據價值越能得到發揮。國家發改委等4部門近日發布的《關於加快構建全國一體化大數據中心協同創新體系的指導意見》(下稱《意見》)提出,加強全國一體化大數據中心頂層設計。
  • 國家藥監局規範真實世界數據在醫療器械臨床評價中應用
    真實世界證據用於醫療器械臨床評價的常見情形如下: (一)在同品種臨床評價路徑中提供臨床證據 同品種臨床評價路徑主要基於同品種醫療器械的臨床數據開展臨床評價,需要的臨床數據包括同品種產品的臨床數據和/或申報產品的臨床數據。
  • 一文了解大數據在國內外疾病監測與預防中的應用現狀
    2016年,原國家衛計委啟動「1+5+X」健康醫療大數據發展規劃,建設江蘇省(東)、貴州省(西)、福建省(南)、山東省(北)以及安徽省(中)五大數據中心。2017年,原國家衛計委牽頭組建醫療健康數據三大集團,包括中國健康醫療大數據產業發展有限公司、中國健康醫療大數據科技發展集團公司及中國健康醫療大數據股份有限公司,以承擔國家健康醫療大數據中心、區域中心、應用發展中心和產業園建設任務。
  • 高慶蕾:用醫療大數據解決百年來的國際性難題
    華中科技大學同濟醫學院附屬同濟醫院婦科腫瘤科副主任,全國婦科腫瘤疾病臨床研究中心負責人高慶蕾說,在過去,無論是早期的診斷還是治療後的跟蹤隨訪都十分困難,現在有了大數據的幫助,毫無疑問將極大促進這些問題的解決
  • AI+大數據在生物醫藥領域中的應用及發展
    其中,國外藉助先進的藥品研發技術和人工智慧技術更早起步,以AI藥物研發為主,我國則藉助海量大數據優勢,以AI醫學影像為主。本文將針對這四個主要領域分別進行探討。一、藥物研髮根據 Global MarketInsight的數據報告,全球人工智慧醫療市場中,第一大細分市場為藥物硏發,份額最大(約佔35%)。
  • 2019PLAGH-MIT醫療大數據學術交流及Datathon活動正式開始
    2019年11月14日,由中國人民解放軍總醫院聯合麻省理工學院、哈佛醫學院、清華大學數據科學研究院、《中國醫療設備》 雜誌社、中國醫院協會醫學工程專業委員會、北京生理科學院危重症醫學專業委員會共同舉辦的"2019中國醫院協會醫學工程專業委員會學術年會暨第四屆PLAGH-MIT醫療大數據學術交流及