01卷積神經網絡在醫學圖像的分析與診斷大放異彩
在深度學習中,卷積神經網絡已經在醫學圖像識別中被廣泛應用,各種不同的算法也是層出不窮。卷積神經網絡(CNN)屬於一類DL模型,該模型主要用於計算機視覺。卷積神經網絡(Convolutional Neural Network, CNN)是一種前饋神經網絡,它的人工神經元可以響應一部分覆蓋範圍內的周圍單元,對於大型圖像處理有出色表現。
02卷積神經網絡概念
卷積神經網絡由一個或多個卷積層和頂端的全連通層(對應經典的神經網絡)組成,同時也包括關聯權重和池化層(pooling layer)。這一結構使得卷積神經網絡能夠利用輸入數據的二維結構。與其他深度學習結構相比,卷積神經網絡在圖像和語音識別方面能夠給出更好的結果。這一模型也可以使用反向傳播算法進行訓練。相比較其他深度、前饋神經網絡,卷積神經網絡需要考量的參數更少,使之成為一種頗具吸引力的深度學習結構。
這些模型具有多個處理層,可從輸入像素數據中學習分層特徵表示。早期網絡層中的功能是通過本地接收域,權重共享和池化機制抽象化的,從而形成了豐富的功能表示,可以學習和分類輸入到各自類中。由於缺乏足夠廣泛的醫學圖像數據,CNN接受了像ImageNet這樣的大規模數據收集用於將學習的表示形式的知識以通用圖像特徵的形式傳遞給治療任務。
03國內外卷積神經網絡的醫學圖像分析的成就與不足
深入的CNN取得了驚人的成功, 在一項國際研究中,研究人員評估,可視化和解釋了CNN模型在將小兒CXR分類以檢測肺炎,並進一步區分細菌性肺炎和病毒性肺炎以促進需要緊急醫療幹預的快速轉診方面的預測, CNN在研究的數據集中進行了端到端的培訓,以提供準確,及時的病理診斷。
在醫學圖像分析中,深度學習分類通常利用醫學圖像中描述的目標病變,並將這些病變分為兩類或更多類。例如,深度學習經常用於在計算機斷層掃描(CT)圖像上將肺結節分類為良性或惡性。
由於2D圖像經常在計算機視覺中使用,因此針對2D圖像開發的深度學習網絡(2D-CNN)不會直接應用於放射學中獲得的3D圖像。為了將深度學習應用於3D放射圖像,目前的研究使用了不同的方法,例如自定義架構。基於多平面重建從一個結節候選中提取了不同方向的2D圖像斑塊,並將這些斑塊用於單獨的流中並合併在完全連接的層中,以獲得最終的分類輸出。
先前的一項研究使用3D-CNN來完全捕獲肺結節的空間3D上下文信息。他們的3D-CNN使用LIDC-IDRI資料庫進行了二元分類(良性或惡性結節)和三元分類(良性肺結節以及原發性和繼發性惡性肺癌)。他們在3D-CNN中使用了多視圖策略,其輸入是通過裁剪三個大小不同的肺結節3D斑塊,然後將它們調整為相同大小來獲得的。他們還在其3D-CNN中使用了3D Inception模型,該模型將網絡路徑劃分為具有不同卷積和池化運算符的多個分支。
時間序列數據通常是在放射學圖像中獲得的,例如動態對比增強CT / MRI或動態放射性同位素(RI)/正電子發射斷層掃描(PET)。先前的一項研究使用了三個階段的肝臟腫塊的CT圖像集(非增強型CT,以及動脈和延遲階段的增強型CT)對2D-CNN進行肝臟腫塊的分類。為了利用時間序列數據,該研究將三相CT圖像用作具有三個通道的2D圖像,這對應於2D-CNN的計算機視覺中的RGB顏色通道。研究表明,使用三相CT圖像的2D-CNN優於使用雙相或單相CT圖像的2D-CNN。
卷積神經網絡在醫學圖像分析中還要進行分割,器官或解剖結構的分割是醫學圖像分析的基本圖像處理技術,例如在臨床參數(器官體積和形狀)的定量評估和計算機輔助診斷(CAD)系統。圖像分類取決於目標病變的分割。分割可以由放射科醫生或專門人員手動執行,這是一個耗時的過程。但是,也可以將卷積神經網絡應用於此任務。
在大多數情況下,分割系統直接接收整個圖像並輸出其分割結果。分割系統的訓練數據包括醫學圖像,其中包含感興趣的器官或結構以及分割結果,後者主要來自先前執行的手動細分,與分類相反,因為將整個圖像輸入到分割系統,所系統必須捕獲整個圖像的全局空間上下文以進行有效的分割。
目前每年在美國進行近4000萬次乳腺攝影檢查。這些檢查主要針對旨在早期發現乳腺癌的篩查程序。之前已經進行了基於卷積神經網絡的CADe系統與依賴手工成像功能的參考CADe系統之間的比較。兩種系統都在約45000張圖像的大型數據集上進行了訓練。這兩個系統共享候選檢測系統。
基於CNN的CADe系統根據候選人的關注區域對其進行分類,而參考CADe系統則根據從傳統分割算法的結果中獲得的手工成像特徵對其進行分類。結果表明,基於卷積神經網絡的CADe系統在低靈敏度方面優於參考CADe系統,並在高靈敏度下實現了可比的性能。