李倩 發表於 2018-07-09 09:56:09
醫學圖像配準是一種常見的技術,將不同時期病人的磁共振( MRI )或CT等醫學影像的結果進行匹配,來更詳細地比較和分析解大腦解剖結構方面的差異。如果病人有腦瘤,醫生可以將幾個月前的腦部掃描結果重疊到最近的掃描圖像上,以分析腫瘤微小的病程發展。
然而,這一過程通常需要兩個小時或更長時間,因為傳統系統會在待比對的圖像中一絲不苟的對齊一百萬個像素點中的每一個。為了解決這一問題,MIT的研究人員描述了一種機器學習算法,通過使用新的學習技術,將腦部掃描和其他三維圖像的配準速度提高1000倍以上。
該算法在配準成千上萬對圖像的過程中,通過「學習」來工作。在此過程中,獲取有關如何對齊圖像的信息,並估計一些最佳對齊參數。訓練後,運用這些參數一次性將一幅圖像的所有像素映射到另一幅圖像上。該算法使利用普通計算機進行配準的時間減少到一兩分鐘,或者使利用卓越性能的GPU進行配準的時間減少到不到一秒鐘。
「當可以對齊其中一對或另一對MRI掃描圖像時,配準MRI圖像的任務就不應該困難了 。」 這兩篇論文的共同作者,麻省理工學院計算機科學與人工智慧實驗室( CSAIL )和工程與計算機科學系( EECS )研究生 Guha Balakrishnan說:「在進行對齊配準時,是可以學到一些信息並繼承下來的。如果能從以前的圖像配準中學到一些東西,就能以同樣的精度更快地完成新的任務。"
這些論文在剛剛過去的計算機視覺和模式識別會議(Conference on Computer Vision and Pattern Recognition,CVPR )以及9月舉行的醫學圖像計算和計算機輔助幹預會議(Medical Image Computing and Computer Assisted Interventions Conference, MICCAI )上發表,共同作者有: 麻薩諸塞州總醫院和CSAIL的博士後Adrian Dalca,CSAIL研究生Amy Zhao,在CSAIL做過博士後,現任康奈爾大學教授的Mert R. Sabuncu以及麻省理工學院電氣工程教授John Guttag。
留住知識
MRI掃描結果基本上是數百個堆疊的二維圖像,形成龐大的三維圖像,稱為「體積」(volume),它包含了一百萬個或更多的三維像素,稱為「體素」(voxel)。因此,將第一個3D圖像的所有體素與第二個圖像的所有體素對齊非常耗時。此外,掃描結果可以來自不同的機器,並且具有不同的空間方向,這意味著匹配體素的計算更加複雜。「你有兩個不同大腦的不同圖像,把它們疊放在一起,然後你開始轉動其中一個,直到兩個可以匹配上。數學上,這個優化過程需要很長時間,」CVPR論文的資深作者、MICCAI論文的主要作者Dalca說。
當分析來自大量人群的掃描時,這個過程變得特別緩慢。例如,神經科學家分析數百名患有特定疾病或症狀的患者的大腦結構的變化時,可能需要數百小時。「那是因為這些算法有一個主要缺陷:它們從不會從已有的經驗中學習。在每次配準之後,它們清楚了與體素位置有關的所有數據。:「從本質上說,給一對新的圖像,算法要從零開始。」Balakrishnan說,「經過100次配準後,算法應該從校準中學到了一些東西。我們的研究就是基於這樣的想法開始的。」
研究人員的算法被稱為「VoxelMorph」,基於卷積神經網絡( CNN ),CNN是一種常用於圖像處理的機器學習方法。這些網絡由許多節點組成,這些節點跨幾個計算層來處理圖像和其他信息。
在CVPR論文中,研究人員在7000張公開的MRI腦部掃描圖像上訓練了他們的算法,然後在另外250張掃描圖像上進行了測試。訓練中,大腦掃描圖像被成對輸入算法中。使用CNN和稱為空間轉換器的修改計算層,來捕獲一張MRI掃描圖與另一張MRI掃描圖的相似體素。在此過程中,該算法學習關於體素組的信息,例如兩次掃描共有的解剖形狀,用於計算可應用於任何圖像配準的優化參數。當輸入兩次新掃描時,一個簡單的數學「函數」使用這些優化參數快速計算兩次掃描中每個體素的精確對齊。
簡而言之,算法的CNN組件在訓練期間獲得所有必要的信息,使得在每次新配準時,可以使用一個易於計算的函數評估來執行整個配準。
研究人員發現,他們的算法可以在兩分鐘內用傳統的中央處理器精確地配準所有的250次大腦掃描測試圖像(在訓練之後進行的圖像配準測試),並在不到一秒鐘內用圖形處理單元完成配準。
重要的是,該算法是「無監督的」算法,意味著不需要圖像數據之外的附加信息。一些配準算法雖然嵌入了CNN模型,但是需要一個「基準線」,這意味著要首先運行另一種傳統算法來計算精確配準。而這種算法在沒有這些數據的情況下仍保持了準確性。
MICCAI論文開發了一種改進的VoxelMorph算法,Balakrishnan說,「我們對每個配準都非常有自信」。這個算法保證了配準的「平滑性」,這意味著它不會在合成圖像中產生褶皺、孔洞或通常的變形。本文提出了一個數學模型,該模型用一種稱為骰子分數的的指標來驗證算法的準確性,骰子分數是評價重疊圖像準確性的一種標準度量。在17個腦區中,改進的VoxelMorph算法的精確度與常用的最先進的配準算法相同,同時在方法和用時方面有了很大的提升。
大腦掃描圖像配準以外的應用
研究人員說,除了分析腦部掃描圖像之外,快速算法還有更廣泛的潛在應用。例如,麻省理工學院的同事目前正在肺部圖像上運行該算法。
該算法還為手術過程中的圖像配準奠定了基礎。在一些手術進行之前或實施中會使用不同質量和速度的掃描儀器進行圖像採集。但這些圖像直到手術後才會進行配準。例如,在切除腦腫瘤時,外科醫生有時會在手術前後掃描病人的大腦,對比是否切除了所有腫瘤。如果還有沒有切除乾淨的部分,就重回手術室再進行切除。
Dalca說,有了新的算法,外科醫生幾乎可以實時地配準掃描圖像,從而更清楚地了解手術進展。「但目前在手術過程中無法真正重疊影像,因為這個過程需要兩個小時,而且手術仍在進行中。」他說「如果這個過程只要一秒鐘,那它就可以在實際中應用了。」
「現在有非常多的工作使用的的深度學習框架缺乏創造力或想像力。而這項工作不需要依賴大量的研究,它非常巧妙地將非線性映射當做一個學習任務。學習需要幾個小時,但是使用網絡的時候只需要幾秒鐘。「 哈佛醫學院放射學教授、麻薩諸塞州總醫院神經科學家Bruce Fischl說,「這種方法將大量繁雜的工作(圖像配準)變成了只要進行一次的學習過程,並將耗時數小時的工作在數秒內完成,這為醫學影像和臨床實踐開闢了新的可能!譬如,當患者還躺在掃描儀器裡時,算法就可以運行算法完成計算,當時就能夠決定需要獲取什麼類型的數據以及應該聚焦到大腦的哪個部位,而無需要求患者在幾天或幾周之後再返回進行檢查。」Fischl補充說,他的實驗室開發了用於神經影像分析的開源軟體工具,希望能很快使用這種算法。他說:「我們最大的缺點是分析資料庫所花的時間太長,而且到目前為止,分析中計算密集程度較高的部分是非線性映射,所以這些工具對我來說非常有意義。」
打開APP閱讀更多精彩內容聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容圖片侵權或者其他問題,請聯繫本站作侵刪。 侵權投訴