一文讀懂|診斷準確度評價指標

2020-12-09 宏雅基因

診斷醫學（diagnostic medicine）是通過對患者的症狀、體徵以及各種檢測結果來識別那些患有某種疾病的病人，同時能夠排查那些未患該種疾病受試者的過程。那麼，診斷試驗準確度就是在診斷試驗中區分不同疾病狀態的能力；診斷試驗主要目的是①提供患者身體狀況的可靠信息；②幫助醫生制定正確的治療計劃；③通過研究了解疾病的機制和自然病史。

衡量一種診斷方法的準確度需要將診斷試驗結果與真實情況進行比較，「金標準（gold standard）」能夠說明受試者的真實情況，即患病還是未患病。因此，診斷試驗結果與金標準的比較能反應診斷方法的準確度。

1、靈敏度和特異度

靈敏度（sensitivity）和特異度（specificity）是評價診斷準確度的兩個基本指標，可採用決策矩陣（decision matrix）或2×2列聯表進行解釋。

靈敏度是指當真實情況為患病時診斷試驗發現患病的能力，Se=P（T=1|D=1）=S1/N1；

特異度是指當真實情況未患病時診斷試驗排除患病的能力，Sp=P（T=0|D=0）=R0/N0。

假陽性率（誤診率）是指當真實情況未患病時診斷試驗結果為陽性，FPR=（T=1|D=0）；

假陰性率（漏診率）是指當真實情況為患病時診斷試驗結果為陰性，FNR=（T=0|D=1）。

另外，在多項診斷試驗比較時，並且試驗結果是定量型的，可以在固定FPR條件下計算靈敏度，或在類似固定靈敏度的條件下計算FPR，這樣在實際臨床情況下，評價多項診斷試驗更優。

2、靈敏度和特異度的綜合指標

比較兩個及兩個以上診斷試驗的準確度時，需要同時考慮靈敏度和特異度，此高彼低，因此有時很難決定哪個試驗最優。通過單一數值綜合反映靈敏度和特異度非常必要。

①正確率

正確率相當於真陽性和真陰性在整個樣本中所佔比例，P（TP or TN）=Se × P（D=1）+Sp（D=0），它就是靈敏度與特異度分別乘以患病率和非患病率為權重的加權平均值。

②優勢比

優勢比，又稱風險比值比（odds ratio，OR）。OR=[Se/（1-Se）]/[（1-Se）/Sp]，其實就是患病組中試驗陽性與陰性結果的比值，未患病組中試驗陽性與陰性的比值，這兩比值的比。⑴優勢比為1表示患病組與未患病組獲得陽性結果的可能性相同（Se=FPR）；⑵優勢比大於1表示患病組獲得陽性結果的可能性更大；⑶優勢比小於1表示未患病組比患病組獲得陽性結果的可能性更大。

③約登指數

約登指數記為Se+Sp-1或Se - FPR，最大值為1，最小值為0，反映了相對於未患病組，患病組獲得陽性結果的可能性大小。

3、受試者工作曲線

ROC曲線圖以診斷試驗的靈敏度作為縱坐標，假陽性率FPR（1-Sp）為橫坐標，不同決策閾值可以產生圖中不同的點，將圖中所有可能閾值產生的點用線段連接，就形成了經驗ROC曲線。該曲線反映了隨著決策閾值的變化，靈敏度和FPR之間相互制衡的關係。而採用怎樣的決策閾值使得試驗具有怎樣的特徵，取決於具體的臨床應用。

實際中，ROC曲線最常用的指標是ROC曲線下的面積（AUC）。AUC有3個解釋：⑴所有可能特異度值的平均靈敏度；⑵所有可能靈敏度的平均特異度值；⑶隨機選擇一個患病者和一個未患病這，患病組的結果比未患病這的結果更被懷疑患病的概率。

舉例：PAX1基因甲基化檢測對宮頸癌癌前病變CIN3+病變的試驗，ROC曲線下的面積AUC=0.955，說明PAX1檢測對於宮頸癌前病變的診斷具有很優異的性能。

4、似然比

似然比（likelihood ratio，LR），患病組出現某結果的概率與未患病組出現相同結果的概率之比，LR(t)=[P(T=t|D=1)]/[P(T=t|D=0)]，那麼就可知陽性似然比（LR+）是靈敏度與FPR之比，陰性似然比(LR-)是FNR與特異度之比。反映某特定結果（T=t）相對於未患病組更傾向於患病組的證據力度。⑴LR=1，表示該檢測結果出現在患病組與未患病組中的可能性相同；⑵LR＞1，表示該檢測結果出現在患病組的可能性大於未患病組；LR＜1，表示該檢測結果出現在未患病者中的可能性更大。LR值越大，與未患病組相比，患病組出現該結果的可能性越大。

5、陰性和陽性預測值

對於檢測結果為陽性的患者，需要知道有多大的概率「患病」，而對於檢測結果為陰性的患者，需要知道有多大的概率「未患病」，這分別就是陽性預測值（PPV）和陰性預測值（NPV）。這兩預測值不僅取決於診斷方法的靈敏度和特異度，還取決於這種疾病在診斷模板人群中的患病率。陽性預測值PPV=P(D=1|T=1)=Se×P(D=1/[Se×P(D=1)+(1-Sp)×P(D=0)]；陰性預測值NPV=P(D=0|T=0)=Sp×P(D=0/[Sp×P(D=0)+(1-Se)×P(D=1)]。

6、多項試驗的結果解釋

診斷試驗很少有靈敏度與特異度均很高的情況，通常臨床醫生診斷患者時採用兩個或多個檢測，執行方式可以是平行（parallel），即同時執行並結合起來介紹；可以說序貫（serially），即第一種檢測結果決定是否執行第二種檢測。

平行聯合診斷分為OR和AND規則。OR規則也就是「信任陽性」，任一結果為陽性，則為陽性；AND規則也就是「信任陰性」，任一結果為陰性，則為陰性。

序貫診斷試驗的決策規則也是分為OR和AND規則。OR規則，若第一個檢測為陽性則診斷為陽性，反之繼續進行第二個檢測，若第二個檢測結果為陽性則診斷為陽性，否則診斷為陰性；AND規則，若第一個檢測為陽性則繼續進行第二個檢測，若第二個檢測也是陽性，則診斷為陽性，反之診斷為陰性。

最後總結一下，多項診斷試驗比較時，應該根據試驗方案，選擇適當的評價指標進行比較。

【本文由宏雅基因原創，感謝您的關注，圖片均來源於網絡，如有侵權，請聯繫刪除！】

相關焦點

如何聯合多個指標提升診斷準確度?教程來了!

本文將以在體外人工受孕(IVF)中，三種卵巢儲備功能檢測(ovarian reserve tests)用於預測卵巢低反應(poor ovarian response)作為例子，講解如何評價多個診斷試驗聯合的診斷準確性。
一文讀懂小兒貧血的診斷與治療

教師：我們先不急於確定該患兒屬哪一種貧血，對於一個貧血的病人應該怎樣去診斷。實習醫生C：首先確定患兒是否有貧血，其次是貧血的分度及分類，明確貧血的病因。教師：對，我們時常說同學們一定要培養自己的臨床思維能力，具體到這個病人，應該如何做出診斷與鑑別診斷呢？
一文讀懂小兒先天性心臟病的診斷與治療

根據這些特點，可考慮診斷為：支氣管肺炎合併心力衰竭；先天性心臟病？教師：同學對支氣管肺炎的掌握不錯，但對心臟方面的問題似乎不夠清楚或帶有疑問。的確，對有心臟雜音的病例，應該排除無害性雜音。
一文讀懂妊娠期肝功能異常的鑑別診斷

如患者僅有鹼性磷酸酶（ALP）、甲胎蛋白（AFP）等指標輕微升高，應首先考慮妊娠期生理變化所致，注意檢測肝功能情況，必要時進一步完善病因學鑑別。如患者已有較為明確的肝功能異常表現，則應首先排查上述各種類型的非妊娠期特有肝病。在排除非妊娠期特有肝病的基礎上再考慮對各種類型的妊娠期特有肝病進行鑑別。
AI算法可快速診斷新冠肺炎患者準確度與資深胸放射科醫生相當

本文轉自【科技日報】；科技日報北京5月20日電（記者張夢然）運用人工智慧（AI）算法檢查胸部CT影像和病史，可以快速準確地診斷新冠肺炎患者。該人工智慧系統的AUC（曲線下面積，一個用于衡量機器學習準確度的指標）為0.92，展現出與一名資深胸放射科醫生相當的靈敏度。這項機器學習領域最新成果19日發表於英國《自然·醫學》雜誌。提高檢測新冠病毒的速度與準確度，是當前迫切所需的。目前多採用的方法是新冠病毒特異性逆轉錄聚合酶鏈式反應（RT-PCR）。
一文讀懂:先心病的圍產期超聲篩查、診斷和治療

孕中早期篩查一般採用以下的篩查指標：頸後透明層（NT）厚度、靜脈導管（DV）都卜勒血流、心臟直接相關指標、其餘中胚層系統標記等。而在這個時期直接進行胎兒超聲心動圖檢查則較為困難。
一文讀懂電容傳感器

藍色標題，獲取文章】 10、一文讀懂光纖傳感器 11、一文讀懂溫溼度傳感器 12
獨家 | 一文讀懂Adaboost

【集成學習】系列往期回顧：獨家 | 一文讀懂集成學習（附學習資源）參考資料：1. 李航.《統計學習方法》2. 周志華.《機器學習》3. 曹瑩，苗啟廣，劉家辰，高琳. AdaBoost 算法研究進展與展望.
目標檢測的性能評價指標

一般來說目標檢測問題的評價指標有：map（平均準確度均值），速度指標（FPS即每秒處理的圖片數量或者處理每張圖片所需的時間，當然必須在同一硬體條件下進行比較），下面對這2個評價指標仔細介紹。如有不對的地方，還望告知。
柳葉刀:新的血液指標或可快速診斷先兆子癇

最新一期《柳葉刀》上的一篇文章給「疑似先兆子癇」的診斷提供了一種更為快捷的方法，即通過簡單的血液檢查就有望評估常見且可能致命的妊娠併發症風險。　　來自倫敦國王學院的科學家團隊發現，通過測量孕婦血液中胎盤生長因子（placental growth factor，PlGF）的濃度，醫生能夠在更快地診斷出先兆子癇。
一文讀懂真菌感染診斷的G試驗和GM試驗

G試驗檢測值95 pg/ml定義為陽性，建議結合臨床症狀診斷治療。主要針對於侵襲性麴黴菌感染的早期診斷。麴黴菌感染部位主要集中在肺部，從而引起肺部侵襲性麴黴，診斷麴黴菌在肺部是定植還是侵襲性生長，關鍵在於其是否合成GM。
一文讀懂回遷指標/現房

全民地產經紀平臺名稱：回遷指標/現房小編從業地產12年，深耕深圳地產行業各種規則，依據個人經驗以大白話形式寫出來，共大家借鑑參考。一回遷指標房：開發商還未建成，項目還處在立項，籤約，徵收，收樓，拆除，建設等各種階段，叫做回遷指標房。二回遷現房：項目已經封頂，交樓前部分項目可以再次更名，交樓後直接按二手房買賣。三購房名額：無需名額，無需社保，不限年齡，不限戶籍，不限家庭套數。
一文讀懂磁傳感器(必須收藏)

【點擊藍色標題，獲取文章】 >、一文讀懂接近傳感器 3、一文讀懂磁傳感器 4、一文讀懂流量傳感器
一文讀懂質量管理五大核心工具之MSA!

現在要用一把千分尺測量槽的直徑。千分尺長期測量這一款產品，兩個接觸面上因為磨損出現了一個和產品直徑相對應的圓弧（如紅線所示）。校驗時測量標準塊用的接觸面的最高點，因此校驗是合格的。但如果拿來測量產品，就會因為圓弧而有一定的誤差。
一文讀懂「2020限塑令」!

一文讀懂「2020限塑令」！06 16:58 來源：澎湃新聞·澎湃號·政務一張圖讀懂限塑令新規
公共部門績效評價指標體系的設計方法*——以稅務稽查為例

一、稅務稽查績效評價指標體系設計國家稅務總局曾提出了稅務稽查工作質量評價體系。包括稅務稽查執法、稅務稽查工作管理，核心是對稅務稽查執法的合法性、公正性和公平性進行考核。具體而言，稅務稽查部門的財務維度應注重成本、核算準確度、處罰等相關指標的考核，但是需要注意的是可以多運用比率指標，而不是對具體的額度進行規定，以防止出現稽查「先緊後松」或「先松後緊」的無效率工作方法。 3.內部流程維度。內部流程維度指標是由顧客的相關的價值理念所驅動的。
一文讀懂小兒佝僂病的診斷與治療

教師：能否再具體談談本例的診斷和診斷依據？實習醫生C：該患兒可能是維生素D缺乏性佝僂病，低鈣驚厥。患者為早產兒，但現身高已接近足月兒標準，其生長速度較足月兒快但體內儲鈣不足。生後人工餵養，未補充魚肝油及鈣劑。居住環境為老城區，很少戶外活動，故此內源性及外源性維生素D攝入均不足。
機器學習算法常用評價指標總結

現在以捕鯉魚為目的。撒一大網，逮著了700條鯉魚，200隻蝦，100隻鱉。那3. 綜合評價指標F-measure　　Precision和Recall指標有時候會出現的矛盾的情況，這樣就需要綜合考慮他們，最常見的方法就是F-Measure（又稱為F-Score）。　　F-Measure是Precision和Recall加權調和平均：
診斷糖尿病的新指標終於來了,糖化血紅蛋白≥6.5%

相信對於糖尿病患者來說，空腹血糖、餐後2h血糖和糖化血紅蛋白（HbA1c）這幾個指標都不會陌生，它們都是糖尿病的重要的診斷與評價指標。隨著國內糖尿病發病率的逐年上升，我國在糖尿病的防治上也越來越重視，這在每隔2-3年就更新一版的《中國2型糖尿病防治指南》中已充分體現。
一文讀懂丨乳腺癌診斷「金標準」的病理報告,究竟怎麼看?

1 病理分類拿到病理報告最先注意的是病理診斷中的XXX癌，浸潤性癌，非浸潤性癌，早期浸潤性癌，哪個更嚴重一些？不過組織學分級僅僅是診斷工具，並不能以一概全。所以當你在病理報告上看到了三級，也不必過於悲觀，雖然敵人很強大但是醫生也會拿出更好的裝備和它奮戰到底，積極配合醫生治療顯得尤為重要。

一文讀懂|診斷準確度評價指標

相關焦點

如何聯合多個指標提升診斷準確度?教程來了!

一文讀懂小兒貧血的診斷與治療

一文讀懂小兒先天性心臟病的診斷與治療

一文讀懂妊娠期肝功能異常的鑑別診斷

AI算法可快速診斷新冠肺炎患者 準確度與資深胸放射科醫生相當

一文讀懂:先心病的圍產期超聲篩查、診斷和治療

一文讀懂電容傳感器

獨家 | 一文讀懂Adaboost

目標檢測的性能評價指標

柳葉刀:新的血液指標或可快速診斷先兆子癇

一文讀懂真菌感染診斷的G試驗和GM試驗

一文讀懂回遷指標/現房

一文讀懂磁傳感器(必須收藏)

一文讀懂質量管理五大核心工具之MSA!

一文讀懂「2020限塑令」!

公共部門績效評價指標體系的設計方法*——以稅務稽查為例

一文讀懂小兒佝僂病的診斷與治療

機器學習算法常用評價指標總結

診斷糖尿病的新指標終於來了,糖化血紅蛋白≥6.5%

一文讀懂丨乳腺癌診斷「金標準」 的病理報告,究竟怎麼看?

AI算法可快速診斷新冠肺炎患者準確度與資深胸放射科醫生相當

一文讀懂丨乳腺癌診斷「金標準」的病理報告,究竟怎麼看?