電子病歷在再入院風險預測模型開發與驗證中的應用

2021-01-10 科學網

作者：

小柯機器人

發布時間：2020/4/14 13:36:49

美國密西根大學醫學院Elham Mahmoudi研究組，對電子病歷在再入院風險預測模型開發與驗證中的應用進行了系統回顧。2020年4月8日，《英國醫學雜誌》發表了這一成果。

為了對電子病歷（EMR）數據預測30天再入院率的模型進行集中評估，研究組對Ovid Medline、Ovid Embase等大型資料庫中2015年1月至2019年1月的相關文獻進行了系統審查，檢索使用EMR數據預測模型評估28天或30天再入院率的研究。

共有41項研究符合納入標準。有17種模型預測了所有患者的再入院風險，有24種針對特定人群患者進行預測，其中13種針對心臟病患者。除了來自英國和以色列的兩項研究外，其他研究均來自美國。每個模型的總樣本規模在349至1195640之間。

25個模型使用了拆分樣本驗證技術。41個研究中有17個報告的C統計值為0.75或更高。15個模型使用了校準技術來進一步完善模型。使用EMR數據讓最終的預測模型能夠使用各種臨床指標，例如實驗室結果和生命體徵；但很少使用社會經濟特徵或功能狀態。

使用自然語言處理，三個模型能夠提取相關的社會心理特徵，從而大大改善它們的預測。有26項研究使用了Logistic或Cox回歸模型，其餘研究則使用了機器學習方法。使用回歸方法開發的模型平均C統計量為0.71，機器學習開發為0.74，兩者之間無統計學差異。

總之，使用EMR數據的預測模型比使用管理數據的預測模型具有更好的預測性能，但改進並不大。大多數研究都缺乏社會經濟特徵，未能校準模型，忽略嚴格的診斷測試，且未討論臨床影響。

附：英文原文

Title: Use of electronic medical records in development and validation of risk prediction models of hospital readmission: systematic review

Author: Elham Mahmoudi, Neil Kamdar, Noa Kim, Gabriella Gonzales, Karandeep Singh, Akbar K Waljee

Issue&Volume: 2020/04/08

Abstract: Objective To provide focused evaluation of predictive modeling of electronic medical record (EMR) data to predict 30 day hospital readmission.

Design Systematic review.

Data source Ovid Medline, Ovid Embase, CINAHL, Web of Science, and Scopus from January 2015 to January 2019.

Eligibility criteria for selecting studies All studies of predictive models for 28 day or 30 day hospital readmission that used EMR data.

Outcome measures Characteristics of included studies, methods of prediction, predictive features, and performance of predictive models.

Results Of 4442 citations reviewed, 41 studies met the inclusion criteria. Seventeen models predicted risk of readmission for all patients and 24 developed predictions for patient specific populations, with 13 of those being developed for patients with heart conditions. Except for two studies from the UK and Israel, all were from the US. The total sample size for each model ranged between 349 and 1195640. Twenty five models used a split sample validation technique. Seventeen of 41 studies reported C statistics of 0.75 or greater. Fifteen models used calibration techniques to further refine the model. Using EMR data enabled final predictive models to use a wide variety of clinical measures such as laboratory results and vital signs; however, use of socioeconomic features or functional status was rare. Using natural language processing, three models were able to extract relevant psychosocial features, which substantially improved their predictions. Twenty six studies used logistic or Cox regression models, and the rest used machine learning methods. No statistically significant difference (difference 0.03, 95% confidence interval 0.0 to 0.07) was found between average C statistics of models developed using regression methods (0.71, 0.68 to 0.73) and machine learning (0.74, 0.71 to 0.77).

Conclusions On average, prediction models using EMR data have better predictive performance than those using administrative data. However, this improvement remains modest. Most of the studies examined lacked inclusion of socioeconomic features, failed to calibrate the models, neglected to conduct rigorous diagnostic testing, and did not discuss clinical impact.

DOI: 10.1136/bmj.m958

Source: https://www.bmj.com/content/369/bmj.m958

相關焦點

基於語音識別的移動電子病歷應用探索

另一方面，以電子病歷為核心的診療行為仍是醫院重點業務，有效減輕臨床醫生的信息錄入工作量，依然是亟待解決的難題。在此背景下，需要將語音識別技術更好地應用於電子病歷信息錄入過程，構建更高質量、更高效率的電子病歷。
《在線速遞》人工智慧模型或可預測急性腎損傷

該模型的建立是基於最近的研究工作，模擬電子病歷中的不良事件，並使用急性腎損傷這一常見且高病死率的疾病作為示例。該模型利用了涵蓋不同臨床環境的大型縱向電子病歷資料庫，共納入172家醫院和1062家門診，共703782名成人患者。該模型預測住院患者中急性腎損傷的發生率為55.8％，其中90.2％的患者需要後續透析治療。
2020-2026年中國電子病歷(EMR)行業現狀調研分析與發展趨勢預測報告

要注重國家和地方法規、規範和政策導向，注重標準和規範的應用，使系統滿足互操作性，以適應未來區域衛生信息共享以及居民電子健康檔案建立的趨勢。　　中國產業調研網發布的2020-2026年中國電子病歷（EMR）行業現狀調研分析與發展趨勢預測報告認為，未來電子病歷市場的競爭將更加激烈，特別是面對即將到來的大量二甲醫院電子病歷實施和應用熱潮。
新的模型旨在預測2型糖尿病患者心血管疾病的風險

赴美醫療服務機構和生元國際了解到，來自雪梨大學工程學院項目管理學院的研究人員開發了一個模型，旨在預測ii型糖尿病患者患心血管疾病的風險。該模型被發現具有較高的預測精度，其範圍為79%至88%。然而，誰將開發它並不總是明確的，測試和監測可能是耗時和昂貴的。」
謝國彤:疾病預測的機器學習、深度學習和經典回歸方法

一個疾病登記庫中每位患者的數據往往達到 2000 維，而真實電子病歷的數據甚至會達到幾萬維。如此高維度、稀疏的數據給預測帶來了挑戰。數據時序性：患者在一段時間內會有持續的醫療記錄，如住院期間的多次記錄，或者一年內的多次門診記錄。如果涉及可穿戴式設備收集的實時數據，更是每分每秒都在變化。為了從數據中更好的提煉預測信號，必須對數據的時間序列信息進行分析挖掘。
用巨大疾病知識網絡構建精準醫學模式,電子病歷為其核心

在精準醫學發展中，醫療衛生信息技術扮演著不可或缺的角色。其中以電子病歷為核心的醫院信息系統，為精準醫學知識網絡的構建起支撐性的作用。美國醫學信息協會最近就電子病歷系統的發展現狀和未來的發展方向做了一個調查，並發布了一份調查報告。該報告為對電子病歷未來5個應用方向並提出了10條建議，其中明確提出電子病歷對精準醫學計劃的支持。
風險模型方法研究——基於A股市場的應用

來源：中證指數在數據存儲與分析技術快速發展的今天，數量化方法對投資領域的滲透超越歷史任何時期。大量的創新性方法被提出並得到應用，以數據和模型為核心的現代投資方法體系已見雛形。在組合風險預測領域，線性風險模型方法不斷在理論框架內升級完善，成為組合管理者所採用的風險預測主流方法。
日本產研協作建成電子病歷量子密碼傳輸和備份系統

據日本信息通信研究機構官網報導，為推進量子密碼在醫療領域的應用，該機構聯合NEC、ZenmuTech兩家企業在醫療機構配合下，將電子病歷樣本數據採用量子密碼傳輸進行隱匿化處理，並經由網際網路通過秘密分散技術成功進行了備份。
多變量預測模型研究的報告指南：TRIPOD聲明

因此開發新預測模型的研究應始終包括某種形式的內部驗證，通過內部驗證來量化開發模型中預測性能的任何樂觀估計。內部驗證技術只需要使用開發模型的原始數據，它包括bootstrapping和交叉驗證等方法。內部驗證對於模型開發是很有必要的。
臨床預測模型:模型的建立

開發臨床預測模型是一項複雜的系統工程，涉及研究問題、數據集、變量、模型以及結果報告諸多環節，儘管有眾多文獻討論過其中的方法學問題[1-5]，《個體預後與診斷的多變量預測模型透明報告》（TRIPOD）研究組也給出了報告規範[6]，但仍有很多臨床預測模型在方法學上存在缺陷。在本系列文章開篇文章的基礎上[7]，本文將臨床預測模型建立的全過程歸納總結為8個步驟，並將其中的概念及重要原則做一系統介紹。
Nature 子刊重磅：騰訊與鍾南山團隊發布新冠危重症 AI 預測模型 Cox

在感染COVID-19的患者中，大多數呈輕度至中度症狀，但也有一部分患者的病情初期表現平穩，但會以很快的速度惡化，遭遇更高的健康風險。因此，快速識別出這類有潛在重症風險的患者，對於抗擊疫情意義重大。通過回溯1393例外部患者的檢驗數據，該模型的預測性能也得到了實踐驗證，證明了模型的可靠性與有效性。
SABER仿真技術在汽車系統技術的驗證和開發中的應用研究

SABER仿真技術在汽車系統技術的驗證和開發中的應用研究郭引弟，王豔超發表於 2020-04-16 09:51:44 汽車電子設備的配置已成為當今汽車發展的潮流
財務風險預警模型構建實證分析

這個過程可以通過SPSS統計分析軟體中的樣本顯著性檢驗功能，對數據進行檢驗。為了讓更多的指標入選，現將T檢驗的判別標準定為：｜T｜≥1.7。在雙尾檢驗的顯著性概率中，通過檢驗的指標較多，在前一年有十二個，在前兩年有八個。模型中包括過多的指標，會不利於對上市公司的財務危機進行有效的預測。因此，需再通過顯著性的指標中再次篩選。
電子病歷分級評價標準發布劃分9個等級

（三）引導電子病歷系統開發廠商的系統開發朝著功能實用、信息共享、更趨智能化方向發展，使之成為醫院提升醫療質量與安全的有力工具。二、評價對象已實施以電子病歷為核心醫院信息化建設的各級各類醫療機構。三、評價分級電子病歷系統應用水平劃分為9個等級。
衛生部發布關於印發《病曆書寫基本規範》的通知

第十九條　再次或多次入院記錄，是指患者因同一種疾病再次或多次住入同一醫療機構時書寫的記錄。要求及內容基本同入院記錄。主訴是記錄患者本次入院的主要症狀（或體徵）及持續時間；現病史中要求首先對本次住院前歷次有關住院診療經過進行小結，然後再書寫本次入院的現病史。第二十條　患者入院不足24小時出院的，可以書寫24小時內入出院記錄。
預測模型的偏倚風險考慮和PROBAST

個人覺得可能存在以下因素：1）對象與場景：即在哪些人中和何種環境下進行健康相關預測；2）指標和測量：即使用哪些指標進行預測，如對其進行測量；3）結局的選擇：即結局的測量以及金標準的選擇是否準確；4）算法的好壞：即模型採用的算法是否精當。5）現有的工具：預測模型研究的偏倚風險和適用性評估工具PROBAST。
北大開發微腫瘤預測模型:藥效準確性逾90%,待大規模驗證

研究團隊開發了一種全新原代腫瘤細胞自己「任性遊走」組裝形成微腫瘤的方法，建立了乳腺癌等癌種的微腫瘤模型。臨床實驗結果顯示，該微腫瘤模型預測患者藥效的準確性高達90%以上。這項研究的通訊作者為北京大學工學院生物醫學工程系終身教授席建忠、北京大學腫瘤醫院院長季加孚教授。值得注意的是，目前有多種分析腫瘤藥物敏感性的方法。
騰訊天衍實驗室聯合微眾銀行研發醫療聯邦學習,讓腦卒中預測準確率...

此前聯邦學習在金融、網際網路、智慧零智等領域已經有多個成功應用案例，但在醫療領域，由於醫療知識的專業性，電子病歷的複雜性對聯邦學習的構建帶來了種種困難。近日，騰訊天衍實驗室結合自身醫療機器學習與自然語言處理優勢，與微眾銀行共同將聯邦學習與醫療深度融合，有機整合醫療模型與機器學習。
融慧金科盛軍:如何快速破解金融模型開發與應用實操難題

「目前，國內金融機構在數據和模型算法能力上已基本成熟，但對於大多數中小銀行來說，在模型開發與應用中，可能會對模型的設計是否符合需求、目標變量和建模數據的選擇是否合理、算法的選擇和建模的方法是否恰當、模型的應用是否做到和策略規則的有機結合、模型效果的監控是否及時等事項，還沒有完全的體系化的把控。」
我國科學家揭示環狀RNA在預測II/III期結腸癌患者復發風險預測中的...

約60%患者初次診斷時已發展為局部晚期（II/III期），即使手術順利切除後仍有20-30%的復發風險。因此，對II/III期結腸癌患者的精確風險分層是術後治療策略的關鍵所在。目前的分期方法在預測II/III期結腸癌患者的復發風險方面有一定的局限。環狀RNA（circRNA）是一種新型的非編碼RNA，伴隨高通量測序技術的發展和進步，越來越多的環狀RNA被證實參與多種生物學功能，影響腫瘤的發生發展。

電子病歷在再入院風險預測模型開發與驗證中的應用

相關焦點

基於語音識別的移動電子病歷應用探索

《在線速遞》人工智慧模型或可預測急性腎損傷

2020-2026年中國電子病歷(EMR)行業現狀調研分析與發展趨勢預測報告

新的模型旨在預測2型糖尿病患者心血管疾病的風險

謝國彤:疾病預測的機器學習、深度學習和經典回歸方法

用巨大疾病知識網絡構建精準醫學模式,電子病歷為其核心

風險模型方法研究——基於A股市場的應用

日本產研協作建成電子病歷量子密碼傳輸和備份系統

多變量預測模型研究的報告指南：TRIPOD聲明

臨床預測模型:模型的建立

Nature 子刊重磅：騰訊與鍾南山團隊發布新冠危重症 AI 預測模型 Cox

SABER仿真技術在汽車系統技術的驗證和開發中的應用研究

財務風險預警模型構建實證分析

電子病歷分級評價標準發布 劃分9個等級

衛生部發布關於印發《病曆書寫基本規範》的通知

預測模型的偏倚風險考慮和PROBAST

北大開發微腫瘤預測模型:藥效準確性逾90%,待大規模驗證

騰訊天衍實驗室聯合微眾銀行研發醫療聯邦學習,讓腦卒中預測準確率...

融慧金科盛軍:如何快速破解金融模型開發與應用實操難題

我國科學家揭示環狀RNA在預測II/III期結腸癌患者復發風險預測中的...

電子病歷分級評價標準發布劃分9個等級