臨床預測模型:模型的建立

2020-12-05 騰訊網

  初稿,請大家討論。

  隨著精準醫學時代的到來,臨床預測模型在醫療診斷治療決策、病人預後管理以及公共衛生資源配置等方面的應用越來越多,其價值也愈發重要。開發臨床預測模型是一項複雜的系統工程,涉及研究問題、數據集、變量、模型以及結果報告諸多環節,儘管有眾多文獻討論過其中的方法學問題[1-5],《個體預後與診斷的多變量預測模型透明報告》(TRIPOD)研究組也給出了報告規範[6],但仍有很多臨床預測模型在方法學上存在缺陷。在本系列文章開篇文章的基礎上[7],本文將臨床預測模型建立的全過程歸納總結為8個步驟,並將其中的概念及重要原則做一系統介紹。

  1 確立研究問題

  並非所有的問題都適合用臨床預模型來回答,例如幹預/暴露措施的效應估與比較則適合用t檢驗/方差分析,卡方檢驗,Log-rank檢驗等統計學假設檢驗或者校正模型來回答。臨床預測模型適合回答疾病的診斷或預後相關問題,特別是哪些因素影響是否患有某病或是否發生某事件以及這些因素的組合如何準確的估計其患病或事件發生的概率。

  2 選擇數據來源

  不同的臨床預測模型問題適合用不同的研究設計數據來回答。對於診斷類問題,其預測因子與結局均在同一時點或很短的時間內,適合採用橫斷面研究數據構建診斷模型;對於預後類問題,其預測因子與結局有縱向的時間邏輯,適合採用隊列研究數據擬合預後模型。隨機對照臨床試驗可視為入選更為嚴格前瞻性隊列,因此也可用於建立預後模型,但在外推性受限。回顧性的隊列研究因其人群選擇偏倚和信息偏倚,不適合建立預後模型,但剿式病例對照或者病例隊列研究在罕見結局或者預測因子測量昂貴的研究中是經濟、可行的方案。

  3 篩選預測變量

  臨床預測模型中變量的篩選有三種策略:①基於文獻報導,②基於統計方法,③基於醫學認識。建立預測模型前,研究者應該系統檢索文獻,收集整理已經報導的預測因子以備用。目前並無廣泛認可的最優統計方法篩選預測因子,常見的預測因子篩選策略有兩種:全模型策略或者篩選模型策略。全模型策略是將所有的潛在因子納入統計模型,且不進行篩選。全模型策略的優勢是可以避免模型過度擬合以及預測因子的篩選偏倚[8],但在實踐操作中,全模型不好定義,研究者的認識、變量測量的質量以及數據集的樣本量等都會影響到最終預測因子變量清單的確定,且納入所有潛在的預測因子也不切實際。篩選模型策略是藉助統計模型評估預測因子與結局的關係,並基於一定的準則,比如P值,AIC/BIC值等來篩選變量。P

  篩選預測模型的預測因子雖有各種統計方法[11],但任何預測模型的變量篩選,都不能完全依賴於統計方法,應該結合專業知識以及專業領域的經驗。此外,在確定預測模型的預測因子時,一些實際的因素,如指標測量的難易度、測量成本、以及應用的難易度等也因考慮在內。

  4 處理預測變量

  預測模型中,處理變量時首先可能遇到的問題就是缺失值。雖說處理缺失值最好的方法是防止出現缺失值,但缺失值是任何研究都無法迴避的問題。當缺失的樣本例數大時,直接剔除不僅可能引入選擇偏倚,而且導致把握度下降[4],因此,缺失值插補是一個重要的彌補方法[12]。缺失值插補可利用病人未缺失的所有變量信息去估計其缺失變量最有可能的值。此外,不同的變量類型在納入模型時,也需做不同的處理。分類變量的某些類的頻數過低時,應考慮將相近的類合併;連續變量通常假定為線性關係納入模型,但研究者應該藉助限制性立方樣條(Restricted Cubic Splines, RCS)函數或者多項式(Fractional Polynomials, FPs)考察非線性擬合是否更為合適,如J型或U型曲線[13-15]。雖然也有研究者將聯繫變量切割後納入模型中,這在後期將預測模型推向大眾應用時是可取的,但不推薦在模型建立初期採用此策略[1, 2]。此外,連續變量變化的尺度通常為1個單位(如1歲),但考慮到實際效應,研究者也應該嘗試其它尺度,比如1個標準差或者10個單位(如10歲)。

  5 擬合預測模型

  在模型擬合階段,研究者需要考慮以下問題:(1)數據集的劃分;(2)預測模型的選擇;(3)係數估計的算法。使用全部的數據擬合模型,建立預測模型,可以最大程度的利用樣本,但這樣的模型不穩定,「遷移」能力差,當場景稍有變動,模型的預測能力有可能發生變化。因此,擬合預測模型前,研究者通常將數據集劃分為訓練集和驗證集, 以訓練集數據擬合預測模型,以驗證集數據評估模型[16]。劃分模擬與驗證數據集時,常見的策略包括隨機拆分樣本、交叉驗證(Cross-validation)[17]以及Boostrap重抽樣[18]。選擇預測模型時,研究者需考慮變量類型及數據來源。二分類變量結局多適於診斷模型或短期的預後模型,常用Logistic回歸擬合;事件-時間變量多見於長期的預後模型,常用Cox回歸擬合。此外,若結局為罕見的事件,可用泊松回歸擬合,若結局為於連續變量,可用線性回歸擬合。係數估計時,線性回歸中常用最小二乘估計法,Logistic和Cox回歸常用最大似然(maximum likelihood, ML)估計法。一些新的估計技術,如shrinkage技術[19]、懲罰最大似然估計[20]、以及LASSO[21]算法的運用也日漸普遍。

  6 評估預測模型

  建立的預測模型需要評估其性能,以考察其可重複性以及外推性,因此,嚴格的預測模型評估過程包括了內部以及外部數據的驗證。當使用和訓練集同源的數據集時,稱之為內部驗證。常用的內部驗證方法包括隨機拆分驗證、交叉驗證以及Bootstrap重抽樣, 其中Boostrap重抽樣是目前業界最為推崇的內部驗證方法[18]。當使用和訓練集不同源的數據集時,稱之為外部驗證。外部驗證可採用不同時間、不同地域、不同時間及地域的數據集[22]。

  無論是內部驗證還是外部驗證,均需要採用的一定的指標評估模型的性能。區分度(Discrimination)和校準度(Calibration)是兩個最常見的模型評價指標[23]。區分度是指模型區分是否患有待診斷的疾病(診斷模型)或是否發生預期的事件(預測模型)的能力,最常見的區分度刻畫指標如AUC,或者C統計量。校準度則是評估預測的概率與實際觀察到的概率的一致性,最常見的展現方式是校準度圖,即按預測的概率的10等份分人群,以每等份預測概率的均值為X軸,實際事件的比例為Y軸。理想的狀況下,校準度圖是一條截距為0,斜率為1的一條直線。關於模型的驗證,我們將在下一篇文章詳細討論,此處做簡要概念介紹。

  7 呈現預測模型

  為了讓臨床預測模型的得到更好的應用,研究者還需考慮模型的呈現方式。臨床預測模型本質上是預測因子的數學公式組合,為方便臨床應用,研究者常將不同的預測因子的取值賦予不同的評分,最終的累計得分對應一定的事件概率,此即危險因素評分。或者,依據得分高低劃分高危低危人群。若預測模型比較複雜,則可以EXCEL工具、網頁工具或者手機App等電子方式進行展示和應用。如預測10年ASVCD發生概率的工具(http://tools.acc.org/ASCVD-Risk-Estimator)。

  8 報告研究結果

  臨床預測模型最有效的分享和推廣方式便是在學術期刊上報告其結果。但此前很多臨床預測模型的報告質量堪憂,為此,《個體預後與診斷的多變量預測模型透明報告》(TRIPOD)從標題和摘要、介紹、方法、結果、討論以及其它七個方面,提出了22條檢查條目,以規範報告內容,提高研究質量[6]。研究者在撰寫研究報告時,可從http://www.tripod-statement.org/獲取更詳細的參考信息。

  本文系統梳理了臨床預測模型建立的全過程,相關概念以及重要原則,以期為臨床研究者提供概念性的認知,指導臨床預測模型類研究。臨床預測模型涉及的統計方法和操作流程較多,我們將在後續的文章中做具體介紹。

  參考文獻:

  [1] Steyerberg EW, Vergouwe Y. Towards better clinical prediction models: seven steps for development and an ABCD for validation [J].Eur Heart J, 2014, 35(29): 1925-31.

  [2] Lee YH, Bang H, Kim DJ. How to Establish ClinicalPrediction Models [J]. Endocrinol Metab (Seoul), 2016, 31(1): 38-44.

  ...

  [23]Alba AC, Agoritsas T, Walsh M, et al. Discrimination and Calibration ofClinical Prediction Models: Users' Guides to the Medical Literature [J]. JAMA,2017, 318(14): 1377-84.

相關焦點

  • 前沿研究丨COVID-19患者臨床結局改善可能性的預測列線圖模型
    導語近日,浙江大學李蘭娟院士課題組基於新冠肺炎患者的臨床數據,科學地構建了一個可用於早期預測新冠肺炎患者預後的、定量的列線圖模型。作為臨床決策工具之一,列線圖模型的構建對於臨床工作具有重要的指導意義。這項成果能夠將成功抗擊新冠肺炎的診療經驗準確、有效地分享給其他國家,助力抗擊疫情。
  • 從這篇22分+文章入手,帶你深度探討臨床預測模型研究思路
    實際上,研究的先行者們早已經考慮到並構建了方法學來解決這個問題——臨床預測模型。在臨床工作中,我們也時常會用到預測模型來評價患者的風險,如經典預測10年心血管事件風險的Framingham risk score和指導房顫患者抗凝的CHA2DS2-VASc評分。
  • 多種機器學習和統計模型預測個體患者臨床風險並不一致
    多種機器學習和統計模型預測個體患者臨床風險並不一致 作者:小柯機器人 發布時間:2020/11/8 22:27:12 英國曼徹斯特大學Tjeerd Pieter van Staa團隊研究了多種機器學習和統計模型預測個體患者臨床風險的一致性
  • 研究建立轉移性黑素瘤患者對PD1治療的響應模型
    研究建立轉移性黑素瘤患者對PD1治療的響應模型 作者:小柯機器人 發布時間:2019/12/4 16:29:48 德國癌症研究中心Dirk Schadendorf、美國丹娜-法伯癌症研究院Eliezer M.
  • 建立標準化醫藥經濟學評估模型 提高醫保決策質量
    以高血壓為例目前國內外使用的高血壓風險預測評估模型,很大一部分參數都來自美國Framingham研究。這是一個自上世紀中葉開始的長期隊列隨訪研究,學者們在波士頓附近的Framingham小鎮建立了約5千人的研究隊列,通過長期的隨訪,觀察人們出現各種心血管事件的概率、時間、影響因素,從而獲得了建立預測和評估模型的各種參數。
  • 科學家建立金屬中納米孔洞俘獲氫的定量預測模型
    中國科學院合肥物質科學研究院固體物理研究所劉長松課題組吳學邦與麥吉爾大學宋俊合作,在金屬中的氫行為研究中取得新進展,首次建立了體心立方金屬中納米孔洞氫俘獲和聚集起泡的定量預測模型。該研究為理解氫致損傷,以及設計新型抗氫致損傷材料提供了可靠的理論基礎和工具。相關成果發表在《自然-材料》(Nature Materials)上。
  • 預測精準度明顯優於國外預測模型
    深圳特區報廣州11月28日電(記者 劉良龍)11月27日晚,廣東省南山醫藥創新研究院發布消息稱,由國家呼吸醫學中心、廣州呼吸健康研究院、國家呼吸系統疾病臨床醫學研究中心開發的全球新冠疫情科學預測系統(公測版)正式上線。
  • 兩個預測模型比較,再教你一招IDI
    在上一期的內容中,我們介紹了如果想要比較兩個疾病模型的預測能力,除了可以繪製兩個模型的ROC曲線並計算曲線下面積(AUC)外,還可以用定量的指標來比較新、舊模型預測準確率的改善程度,即淨重新分類改善指數NRI。
  • 《在線速遞》人工智慧模型或可預測急性腎損傷
    該模型的建立是基於最近的研究工作,模擬電子病歷中的不良事件,並使用急性腎損傷這一常見且高病死率的疾病作為示例。該模型利用了涵蓋不同臨床環境的大型縱向電子病歷資料庫,共納入172家醫院和1062家門診,共703782名成人患者。該模型預測住院患者中急性腎損傷的發生率為55.8%,其中90.2%的患者需要後續透析治療。
  • 多變量預測模型研究的報告指南:TRIPOD聲明
    臨床預測模型可以幫助臨床醫師評估患者發生某種疾病(診斷模型)或未來某一時間發生特定事件(預後模型)的可能性或風險,能夠輔助臨床醫師做出臨床決策。但是大多數證據表明,預測模型研究的報告質量較差。只有全面清晰的報告預測模型各個方面的信息,才能充分評估預測模型存在的偏倚風險和潛在有用性。
  • 免疫相關lncRNA預測模型想發7分+,你需要這樣分析
    文章利用TCGA資料庫中的肝癌病人患者的轉錄組數據,分析並確定了患者的免疫相關lncRNA特徵並建立了預測模型,預測病人的預後情況、腫瘤免疫浸潤和化學治療方法的效率。此外,本文修改了Lasso算法,得到了更為可靠的模型。計算了5年ROC曲線的AUC值和Akaike信息標準(AIC)值,並確定了分界點,從而建立了區分肝細胞癌患者高低風險的最佳模型。然後,本文從生存率、臨床病理特徵、浸潤腫瘤的免疫細胞、化學治療效果和免疫抑制的生物標誌物的角度重新評估了模型。鑑定出36個DEirlncRNA對,其中12個包含在Cox回歸模型中。
  • 數據建模中分類與預測模型
    因此,本文基於上期數據預處理部分之後,介紹如何在清洗過後的數據基礎之上建立分類與預測模型,為此種模型的構建方法進行簡單介紹,輔助投資者對自身分析邏輯中的分析框架進行量化分析,方便其多元化的交易分析。  一、分類與預測的介紹  數據建模中分類與預測模型主要是尋求合適的分類模型並在此基礎之上進行未來預測。
  • 根據HE染色切片即可預測微衛星不穩定性的深度學習模型!
    檢測結直腸癌微衛星不穩定性(MSI)對臨床決策至關重要,因為它可以區分預測不同治療反應和預後的患者。臨床推薦結直腸癌患者進行通用的MSI檢測,但許多患者仍未進行檢測。迫切需要可廣泛使用的、成本效益高的工具來幫助患者選擇進行檢測。
  • 基於R的生存資料預測模型構建與Nomogram繪製
    本章討論的構建預測模型也是一種「算命」,只是這是一種更為科學的「算命」。作為一個腫瘤科醫生,臨床上可能會遇到這樣的情況,一個55歲男性中晚期食管癌患者問道:醫生,請問我還能活多久?大多數時候我們會根據患者的臨床分期告訴患者,這種情況的中位生存時間是多少……其實這裡的臨床分期就是我們預測患者期望壽命的依據,或者如本文標題所說的「預測模型」,我們用某一臨床分期的所有患者中位生存時間來回答單個患者的問題,可能會存在問題,這裡的中位生存時間代表的是患病人群預期壽命的平均值,對於具體的個體來說有時並不準確。那我們是否有更科學、更準確的方法計算出單個患者的生存概率?
  • 論文推薦王苗苗:無縫線性回歸與預測模型
    E-mail:5wmmgps@tongji.edu.cn通信作者: 李博峰bofeng_li@tongji.edu.cn摘要:建立回歸模型常採用最小二乘方法並忽略自變量觀測誤差。儘管同時顧及自變量和因變量觀測誤差的總體最小二乘方法近年來得到了廣泛研究,但在模型預測時,依然忽略了待預測自變量的觀測誤差。
  • 預測模型的偏倚風險考慮和PROBAST
    疾病的發生、進展或者預後,我們一樣需要去對其進行預測,於是便出現了各式各樣的預測模型。隨著更大量數據的積累和各種算法的跟進,預測模型又有了「更多的原材料」和「更好的加工方法」。預測的準不準,是評價預測模型好壞的關鍵。那麼準不準會受到哪些影響因素呢?
  • 科學網— 建立果蠅繁殖與衰老關係模型
    死亡時間的準確預測在生物醫學領域很重要,可以讓患者更好地考慮自己的未來,也讓醫生能更準確地做出診斷。將非人類物種的生命結束模式用於預測人類生存時間的生物醫學模型中,特別是以果蠅作為模式生物建立的相關衰老和死亡模型對指導醫學工作具有重要意義。 研究人員採集了黑腹果蠅、墨西哥實蠅和地中海實蠅的雌蠅,並統計了個體單日繁殖量。
  • 北大開發微腫瘤預測模型:藥效準確性逾90%,待大規模驗證
    研究團隊開發了一種全新原代腫瘤細胞自己「任性遊走」組裝形成微腫瘤的方法,建立了乳腺癌等癌種的微腫瘤模型。臨床實驗結果顯示,該微腫瘤模型預測患者藥效的準確性高達90%以上。這項研究的通訊作者為北京大學工學院生物醫學工程系終身教授席建忠、北京大學腫瘤醫院院長季加孚教授。值得注意的是,目前有多種分析腫瘤藥物敏感性的方法。
  • 谷歌官方公布:票房預測模型
    谷歌公布了一項重要研究成果–電影票房預測模型。該模型能夠提前一個月預測電影上映首周的票房收入,準確度高達94%。這在業內引起了強烈討論,不少內人士認為該模型非常適合好萊塢電影公司通過預測票房來及時調整電影營銷戰略,但同時也有吐槽者暗示谷歌的票房預測模型別有用心,旨在鼓動電影公司購買其搜尋引擎廣告。那麼,孰是孰非,谷歌票房預測模型以及大數據在電影行業的應用是噓頭,還是大有來頭,讓我們來一探究竟。
  • 教你用R畫列線圖(Nomogram),讓預測模型結果可視化!
    認識列線圖  列線圖(Alignment Diagram),又稱諾莫圖(Nomogram圖),它是建立在多因素回歸分析的基礎上,將多個預測指標進行整合,然後採用帶有刻度的線段,按照一定的比例繪製在同一平面上,從而用以表達預測模型中各個變量之間的相互關係。