衛計委資料顯示,每年新增肺癌患者逾60萬,50餘萬人死於肺癌。並且,肺癌的死亡率在逐年上升,形勢非常嚴峻。肺癌早已超越了交通事故、自然災害等,成為影響中國人口死亡的最主要因素之一。
目前常用的胸部X線片、CT等醫學影像檢查對於肺癌的篩查效果並不理想,很難看出3毫米以下的結節。以大數據為驅動的人工智慧應用到了醫療健康領域後,誕生了影像組學,即從醫療大數據中提取數據,利用AI方法挖掘腫瘤信息,捕捉和發現小的結節,就可以減少漏診,實現臨床輔助決策。
PereDoc科技團隊抓住這一醫學發展的新方向,於8月初率先建立了肺結節3D CT醫學影像診斷金標註資料庫,使其更快更好地應用於臨床精準治療,造福患者。
喚醒沉睡的數據
「我們喚醒了那些沉睡的數據。」8月16日,PereDoc科技團隊的CTO在接受騰訊健康記者採訪時,自豪地說。
高質量的CT病例影像是一切研究的數據基礎,PereDoc通過對許多肺癌高風險病例、肺癌確診病例、非肺癌的確診病例及特殊病例等數據標註後進行研究分析,挖掘病例數據背後的巨大價值。豐富的高質量案例、高效的數據分析和專業的醫學專家支持,是團隊後續研究工作的「基石」。
邁出了可喜的第一步後,接下來的圖像預處理和特徵提取過程仍然舉步維艱。由於不同醫學影像的格式和存儲方式不同,首先須對圖像進行預處理,以實現數據的規範統一。
接下來,問題又出現了,從影像中提取的大量圖像特徵是冗餘的,PereDoc科技團隊採用深度學習技術,挑選出關鍵特徵,來構建輔助診斷模型。
PereDoc科技CTO指出,在浩繁龐雜的信息中一點點剝離冗餘,讓關鍵特徵一步步顯現出來的過程,都是在專業醫師和專家的參與下完成的。
構建肺結節3D CT醫學影像診斷金標註資料庫
大量CT病例及特殊病例的梳理工作完成後,PereDoc科技團隊開發出了3D肺結節CT病例標註工具,對圖像進行非常直觀的3D標註。
對於肺癌高風險病例及肺癌確診病例,標註工具分別標註出了結節位置,結節尺寸,結節或腫塊形態特徵及周圍情況,強化特徵,轉移情況、區域淋巴結、骨質破壞等病例特徵,由專家評估結節的惡性程度。
肺結節3D CT醫學影像診斷金標註資料庫被構建起來。「在肺結節3D標註庫的基礎上,對AI採用深度學習技術進行訓練。」 PereDoc科技CTO舉例說,「比如,在採用含有病理標註的樣本進行診斷訓練時,需要高質量經過標註的數據來對神經網絡進行訓練,在有醫學專家進行監督的學習下,不斷對參數進行調整,開發出高準確率低假陽性的智能診斷算法,通過多次訓練持續優化,我們就得到了專家級的肺結節多模態智能醫學影像診斷神經網絡。對於具有臨床意義的肺部2毫米-5毫米的細小結節識別準確率達到92%左右,而對於大於5毫米的小結節識別準確率甚至可以達到令人匪夷所思的98%!」 PereDoc科技CTO興奮地說,「準確率如此之高也是我們始料未及的。」同時,該系統的假陽性率目前已降低到15%。
PereDoc科技CTO把機器標註出的細小的結節圖片和專家標註出的結節圖片放在一起進行比對,記者驚訝地發現,兩者幾乎一模一樣。甚至有一部分是專家沒有發現,而在AI的提示下才勾畫出來的。
讓醫生的效率提高十幾倍
「現在,我們有了一個訓練好的診斷模型,其診斷準確率已經達到全國一流三甲醫院的影像科權威專家的看片水平。」 PereDoc科技CTO表示,基於目前的輿論和相關政策,系統只會為醫生提供輔助信息,最終的決策依然需要醫生來做出,「這已經極大提高了醫生的工作效率,從2分鐘縮短到10秒鐘,效率提高了十幾倍。」
「我們的理想就是希望用人工智慧解決中國人看病難的問題,希望這項技術能惠及全國包括各地級市、區、縣級醫療資源相對匱乏的醫院,來幫助醫生提高看片的效率,讓醫生們有更多的時間和精力讓更多的患者得到及時有效的診治。我們希望通過這樣,來為被病痛纏繞的患者爭取更多的時間。」 PereDoc科技CTO說。
PereDoc科技團隊構建的這一高質量的肺結節3D CT醫學影像診斷金標註資料庫,是醫療人工智慧應用的關鍵數據基礎設施,對智能醫療起到了極大推動作用。同時開發出的高準確率低假陽性的智能診斷算法,則是智能診斷的共性基礎技術,同樣的訓練技術,可用於肺結節CT智能診斷,也能應用於甲狀腺癌、乳腺癌、腦瘤、腎癌、肝癌等重大疾病,具有重要的醫學價值和社會價值。
總結AI的表現,PereDoc科技CTO興奮地告訴我們:「可以說,我們的影像組學、大數據和人工智慧,在療效評估、輔助診斷、預後預測方面,在技術上、方法上、效果上,達到全球領先水平,甚至某一些方面是超前的。」