全文6071字,歡迎關注!
本期MEWS為大家帶來Diehr, P.,Derleth, A.,Newman, A. B.,Liming Cai的《The number of sick persons in a cohort》關於特定人群隨年齡變化的患病人數研究,不容錯過!
研究背景
美國人口正經歷老齡化,同時人們的平均預期壽命正在增加。這些趨勢可能會增加與年齡相關的慢性病、損傷和殘疾的風險人數。了解健康和發病率隨時間的自然軌跡很重要,但健康和死亡的模式及其相關的保健需求和支出隨時間的推移是複雜的。
目前有兩種研究方法。
一種方法是從某個時間點開始跟蹤一個定義明確的「研究」群組,直到死亡,並在每個時間將多少人健康(根據某種定義)、多少人生病、多少人死亡製成表格。研究隊列可能是人口的隨機樣本,通常包括不同年齡的人。時間的度量是自隊列中登記以來的年數。
另一種方法是估計從一種健康狀態轉換到另一種健康狀態在特定年齡下的概率,並使用多狀態生命表方法來估計出生後每年健康、患病或死亡的人數,其中出生隊列中的時間度量是年齡。在這裡,我們使用八種不同的「患病」定義,在長達14年的研究隊列中呈現了一段時間內病人的數量。我們還估計了出生隊列中每年患病的人數,使用了從三個大數據集來估計的轉移概率。
研究方法
研究設計:心血管健康研究
心血管健康研究(CHS)是一項基於人群的縱向研究,對5888名65歲及以上的成年人進行了基線研究,旨在確定與冠心病和中風相關的因素。參與者是從美國四個縣的醫療保險資格列表中隨機抽樣招募的。約59%的合格人員同意參加。由此產生的樣本比那些拒絕參與的人更年輕,受教育程度更高,更有可能結婚,活動限制也更少。對兩個社區衛生服務研究隊列進行了隨訪,一個進行了9年的隨訪,另一個進行了6年的全面隨訪。一些分析忽略了第二組,因為其隨訪時間較短。基線時,平均年齡為73歲(65至105歲),58%為女性,84%為白人。數據收集始於1990年左右,1999年對所有存活受試者的隨訪幾乎已經完成(一些測量持續到2004年)。
心血管研究中的健康相關變量
為了提供廣泛的健康信息,我們選擇了八個常用的健康相關變量,並為每個變量定義了「生病」。這些定義包括具有低於80的改良迷你精神狀態檢查得分(MMSE),在日常生活的活動或工具活動中具有一個或多個困難(日常生活能力和),流行病學研究中心抑鬱症得分高於10(CESD),在過去兩周中在床上度過的任何日子(臥床日),需要10秒以上才能行走15英尺(定時行走),以及流行性心臟病(心血管疾病)。心血管疾病被定義為在調查時或之前患有心絞痛、冠心病、充血性心力衰竭、跛行、心肌梗死、中風、短暫性腦缺血發作、血管成形術或冠狀動脈旁路手術。我們假設一個按照以上定義生病的人(有心血管疾病)以後不可能變得健康(沒有心血管疾病)。這八項措施包括自我報告和臨床定義,以及一項無法恢復的定義。本文使用的主要健康變量是健康自評(EVGGFP),要麼是優秀、非常好或良好(E/VG/G =健康),要麼是一般或差(F/P =生病)。EVGGFP之所以被挑選出來,是因為它每半年收集一次,甚至在1999年後繼續通過電話收集,它為每個人提供了多達29個可用於計算轉移概率的指標。其他變量僅每年收集一次,1999年後便沒有再收集。缺失數據的數量很少,人們經常在錯過訪問後返回,這使得我們可以使用簡單的插補方法來估算缺失數據,該方法在社區衛生服務數據集中表現良好(恩格斯和迪爾,2003年)。第一個和最後一個已知測量值之間缺失的數據是從最後一個已知測量值的時間日誌上的變量的個人特定回歸估算的。
當最後一次已知觀察和死亡之間的測量值缺失時,我們使用最後一次已知觀察的結轉值進行估算,以便接近死亡的轉移概率的偏差方向變得清晰。這裡一個潛在的偏見是,對於那些在那個時期的人來說,沒有從生病到健康(這可能是合理的)或從健康到生病的轉換。鑑於有大量額外的轉換對可用於估計這些轉換,這應該不是問題。更重要的是健康人死亡率的潛在偏差。在之前已知EVGGFP值的三分之二的死亡中,大約62%在死亡前一年患病(一般或較差)。大約三分之一的死亡病例在死亡前一年都沒有EVGGFP,然而在大約56%的時間內處於生病狀態。由於缺少數據的人比提供數據的人更容易生病,我們預計在死亡前一年會有超過62%的人生病。因此,大約14%的死亡前值被認為是「健康的」,其中一些可能被錯誤分類。由於這個原因,健康人的估計死亡率可能會偏高。對於1999年仍然活著的人,大約5%的相關數據必須進行估算。對於死亡的人,20%至29%的定時行走數據被估算;10%至19%是CESD、迷你精神病院、EVGGFP、ADL和IADL的估算值;不到10%的數據是根據臥床天數估算的。
我們將「轉換對」定義為同一個人相隔一年測量的兩個EVGGFP值。5888名社區衛生服務參與者貢獻了大約150000個轉換對以用於估計不同年齡從一個狀態轉移到另一個狀態的概率。
更多數據來源
為了增加轉換數據的數量和年齡範圍,我們還使用了來自兩個大型全國性調查的EVGGFP數據,即醫療保險當前受益人研究和醫療支出小組調查。在MCBS,人們被跟蹤2至6年,約41,000人貢獻了約98,000對轉換對。與社區衛生服務不同,MCBS的樣本比一般人群的病情稍重。在MEPS,大約93000人為0至64歲的人貢獻了大約224000對轉換對,為大於或等於65歲的人貢獻了29000對轉換對。MEPS沒有調查被收容人員。因為這個原因而沒有被調查的少數人被指定為「健康不良」,我們將數據缺失歸因於其他原因,如社區衛生服務。MEPS設定90歲以上(後來是85歲)的人為90歲(85歲)。此外在調查中,被訪問者一個人回答了家庭中的每個人的信息,這意味著MEPS信息通常不是「自我」報告的。我們忽略了調查權重,以使數據與社區衛生服務數據一致,因此不能對美國人口進行無偏估計。在兩次調查中,失訪人數都很低。
關於預期壽命的數據來自《美國統計摘要》。對美國人健康狀況的年齡估計來自全國健康訪談調查,該調查只調查非機構收容人員。按年齡和計劃生育年齡分列的醫療支出數據是根據MEPS在2002年利用歐洲醫療網方案估算的結果。我們擬合了年齡和對數年齡的支出回歸,並對大於85歲的年齡使用回歸估計。
轉移概率計算
我們結合了所有三個數據集的轉換對,計算了每個年齡的轉換概率,並使用移動平均平滑了年齡曲線來修勻。對65歲以下年齡的估計是基於每年約3400對轉換對,而65歲以上年齡的估計是基於每年約8000對轉換對。
人群未來健康狀態
研究隊列顯示了社區衛生服務隊列在隨訪期間的實際行為。為了獲得更普遍的發現,我們使用EVGGFP的轉移概率來預測一個綜合出生隊列的健康、患病和死亡人數,該隊列在起始時有98000名健康人和2000名患病人,選擇與國家統計數據一致。這是使用標準的多狀態壽命表方法完成的,該方法在電子表格中實現,部分在Stata程序中實現。我們還創建了一個由5201人組成的綜合社區衛生服務隊列,其初始年齡和健康分布與社區衛生服務基線人群相匹配,用於與社區衛生服務研究隊列進行比較。合成隊列部分給出了一個計算示例。
分析過程
我們首先計算了在社區衛生服務研究隊列中隨訪的14年中,所有八種疾病定義的患病人數。接下來,我們使用標準的多狀態生命表方法,使用估計的轉移概率來預測綜合出生隊列和綜合社區衛生服務隊列中健康、患病和死亡人數。我們將特定健康和特定年齡的支出估計值乘以每個年齡和健康狀態下的預計人數,以估計終生醫療支出。
研究發現
社區衛生服務研究隊列中健康、患病和死亡人數
圖1描述了第一個社區衛生服務隊列。它顯示了基線後14年內健康(E/VG/G)、患病(F/P)或死亡的人數。由上圖可以看出,隨著時間的推移,健康人數減少,死亡人數增加,但患病人數(實線)大致不變。這是顯示當前調查的圖表。男性和女性的情況類似(未顯示)。
圖2顯示了每年隨訪的健康、患病或死亡人數,使用了不同的「患病」定義,如上所述。(為了便於繪圖,Y軸是每個健康狀態下5201人中的百分比,而不是計數)。括號中的數字是基於該變量的每年平均患病人數。患病人數(實線)隨著時間的推移總是近似恆定的,即使「患病」在每個圖中的定義不同。標有EVGGFP-1的圖表相當於圖1中的前九年,EVGGFP-2顯示了相同的變量,但針對第二個隊列(所有非裔美國人)。EVGGFP-2的患病百分比高於EVGGFP-1,但隨著時間的推移也相當穩定。EVGGFP線下的區域有時被稱為「健康壽命年」,圖中ADL的相應區域被稱為「活躍預期壽命」。
綜合隊列中健康、患病和死亡人數
我們使用三種健康狀態(健康、患病和死亡)之間的估計轉移概率來預測合成隊列中健康、患病和死亡的人數。
健康狀態和轉移概率
這裡我們把健康定義為「E/VG/G」健康,把生病定義為「F/P」健康。這三種狀態之間的轉換概率是從500000個轉換對中估計出來的,並在一份在線技術報告中列出。我們分別觀察健康的人在一年後維持健康的概率;1年後患病的概率;以及一年後死亡的概率。同樣,最初生病的人也有相關的概率P(H|S)、P(S|S)和P(D|S)。估計的轉移概率隨著年齡而變化,如圖3所示。65歲以下的概率僅基於MEPS數據,而65歲及以上的概率是根據所有三個數據集計算的。儘管平滑,但在一些概率估計中,65歲附近和95歲以上有明顯的不連續性.
P(H|H)和P(H|S)隨著年齡的增長而降低的發現反映了臨床經驗,即老年人不太可能保持健康或從疾病中康復。P(D|H)、P(D|S)、P(S|H)隨年齡單調增加,這也不足為奇。但是我們事先不知道患病的概率會隨著年齡的增長而變化。根據定義,P(S|S)= 1–P(H|S)–P(D|S),但由於P(H|S)隨年齡增長而減少,而P(D|S)則增加,所以年齡對P(S|S)的影響不明顯。在這裡,P(S|S)在大約50歲之前一直增加,在大約80歲之前相當平穩,之後下降,大概是因為病人更有可能死亡而不是繼續患病。三組數據中65歲及以上人群的趨勢相當相似,其中,在患病的狀態下保持患病的概率P(S|S)差異最大。
合成隊列
對於那些不熟悉生命表計算的人,我們舉一個簡單的例子。考慮一個隊列,在起始時有特定數量的健康和患病的人,並且在三種狀態中有特定的轉移概率:健康、患病和死亡。關於特異性,使用65歲時的概率(見圖3),如下:P(H|H)=0.90;p(S|H)=0.09;p(D|H)=0.01;p(H|S)=0.34;p(S|S)=0.61;和P(D|S)=0.05。對於一個65歲的人工隊列,其中(比方說)100人健康,100人在65歲時生病,我們可以估計一年後,在66歲時處於每個健康狀態的人數。在100名健康的人中,概率顯示0.09 * 100 = 9人將在一年後生病,1人死亡,90人仍然健康。在那些開始生病的人中,61人將繼續生病,34人將變得健康,5人將死亡。因此,在66歲時,將有90 + 34 = 124名健康人、70名病人和6名死者。這些計算可以在66歲時重複,使用該年齡特有的轉移概率,並再次重複,直到所有參與者都死亡。在這一點上,可以計算健康狀態和患病狀態下的總人年數,以得出健康壽命年數、患病壽命年數(發病率)和壽命年數(預期壽命)的估計值。
我們估計了100000名出生隊列中的健康、患病和死亡人數,其中98%在0歲時健康(生命和健康統計,1990年),如圖4所示。健康人數下降,死亡人數增加,這是意料之中的。患病人數在大約55歲之前緩慢增加,在大約80歲之前相當平穩,之後下降。死亡曲線下的面積(除以100,000)是平均死亡年數= 23.8,100–23.8是平均預期壽命,即76.2歲。鑑於數據的局限性,這相當接近美國人口的預期壽命(77.3歲)。健康曲線下方的區域是從出生到100歲的66.9年健康壽命。患病曲線以下的區域是患病壽命9.3年。
實際的社區衛生服務研究隊列是出生隊列和基準人群健康狀態的混合。從圖4中可以清楚地看出,基準人群主要由55歲至80歲的人組成的群體,隨著時間的推移,患病人數將保持相當穩定,而55歲以下的人過多將導致患病人數隨著時間的推移而增加,而80歲以上的人過多將導致患病人數減少。使用社區衛生服務隊列的起始年齡和健康狀況分布,綜合社區衛生服務隊列中的估計患病人數在14年的隨訪中大致保持不變,如真實數據的圖1所示。
出生隊列的醫療支出
在圖4中,預期醫療支出最高的患病人數在55歲至80歲之間大致保持不變,而醫療支出較低的群體的規模隨著時間的推移而下降。如果醫療支出只是健康狀況的一個函數,那麼55歲以後群組的成本將會降低,因為患病人數將保持不變,但健康人數將會下降。然而,醫療支出隨著年齡和健康狀況變差而增加。我們將估計的平均年齡和特定健康成本乘以每個健康狀態和年齡的預計人數。100000名出生隊列的估計年度總費用將在大約10歲以後隨著年齡單調增加,從61歲到73歲將相當穩定地保持在每年大約4.2億到4.3億美元,之後將下降。
研究總結和討論
在這篇文章中,我們使用了來自兩個社區衛生服務研究隊列的數據,表明無論如何定義「患病」,患病人數隨著時間的推移驚人地穩定。然後,我們結合三個大數據集來估計轉移概率,並使用多狀態生命表方法來創建一個綜合出生隊列。我們還根據這些轉移概率建立了一個綜合社區衛生服務隊列,以證明社區衛生服務數據中記錄的穩定性可以從轉移模型中預測。
我們發現,健康狀況不佳的人數在出生時很低,此人數在55歲時達到最大值,且在55歲至80歲之間大致保持不變,之後下降。年老時患病人數沒有增加,但健康人數有所下降。這導致隨著時間的推移,在14年甚至更長的時間裡,在老年人的「研究」隊列中,患病人數保持不變。即使當「生病」有不同的定義時,在大部分情況下這種現象依然成立。該群體的醫療支出在65歲左右最高,此後有所下降,因為該群體中存活的人數較少,足以抵消每個存活者不斷上升的支出。這些有趣的發現可能有助於概念化一個人群或一個群體的健康和醫療支出將如何隨著時間的推移而變化。它還可能表明,健康促進和疾病預防將是年輕一代的最佳公共衛生戰略,因為需要治癒或預防死亡的病人相對較少。
參考資料:
Diehr, P.,Derleth, A.,Newman, A. B.,Liming Cai. (2007). The number of sick persons in a cohort. Research on Aging An International Bimonthly Journal, 29(6), 555-575.
聲明:MEWS矩陣所刊載內容之智慧財產權為MEWS矩陣及相關權利人專屬所有或持有。未經許可,禁止進行轉載、摘編、複製及建立鏡像等任何使用。