深度學習下的醫學圖像分析(四)

2020-11-23 雷鋒網

雷鋒網按:本文由圖普科技編譯自《Medical Image Analysis with Deep Learning Part4》,是最近發表的《深度學習下的醫學圖像分析(三)》的後續文章。雷鋒網(公眾號:雷鋒網)獨家首發。

對與深度學習相關的醫療保障工作而言,2017年的「Nvidia GTC大會」絕對是一個絕佳的信息來源。在大會上,有諸如Ian GoodFellow和Jeremy Howard的深度學習專家分享了他們對深度學習的見解;還有一些頂級醫學院(例如西奈山醫學院、紐約大學醫學院、麻省綜合醫院等)和Kaggle在大會上介紹他們的建模戰略。

 在上一篇文章中,我們談論了深度學習相關的基本內容。本文,我們將關注於醫學圖像及其格式。

 本文分為三個部分——醫學圖像及其組成、醫學圖像格式和醫學圖像的格式轉換。本文希望通過對深度學習的相關知識的介紹,最終達到醫學圖像分析的目的。

醫學圖像及其組成 

由Michele Larobina和Loredana Murino發表的論文,對本文即將展開的討論來說是一個很好的信息參考。Michele Larobina和Loredana Murino二人是義大利「生物架構和生物成像協會」(IBB)的成員。IBB是義大利「國家研究委員會」的組成部分,同時也是義大利最大的公共研究機構。我們的另一個參考信息資源是一篇題為《Working with the DICOM and NIfTI data standards in R》的論文。

醫學圖像是反映解剖區域內部結構或內部功能的圖像,它是由一組圖像元素——像素(2D)或立體像素(3D)——組成的。醫學圖像是由採樣或重建產生的離散性圖像表徵,它能將數值映射到不同的空間位置上。像素的數量是用來描述某一成像設備下的醫學成像的,同時也是描述解剖及其功能細節的一種表達方式。像素所表達的具體數值是由成像設備、成像協議、影像重建以及後期加工所決定的。

 

醫學圖像組成醫學圖像有四個關鍵成分——像素深度、光度表示、元數據和像素數據。這些成分與圖像大小和圖像解析度有關。

 圖像深度(又稱比特深度或顏色深度)是用來編碼每個像素信息的比特數。比如說,一個8比特的光柵可以有256個從0到255數值不等的圖像深度。 

來源: desktop.arcgis.com/en/arcmap/10.3/manage-data/raster-and-images/bit-depth-capacity-for-raster-dataset-cells.htm 

「光度表示」解釋了像素數據如何以正確的圖像格式(單色或彩色圖片)顯示。為了說明像素數值中是否存在色彩信息,我們將引入「每像素採樣數」的概念。單色圖像只有一個「每像素採樣」,而且圖像中沒有色彩信息。圖像是依靠由黑到白的灰階來顯示的,灰階的數目很明顯取決於用來儲存樣本的比特數。在這裡,灰階數與像素深度是一致的。醫療放射圖像,比如CT圖像和磁共振(MR)圖像,是一個灰階的「光度表示」。而核醫學圖像,比如正電子發射斷層圖像(PET)和單光子發射斷層圖像(SPECT),通常都是以彩色映射或調色板來顯示的。

 「元數據」是用於描述圖形象的信息。它可能看起來會比較奇怪,但是在任何一個文件格式中,除了像素數據之外,圖像還有一些其他的相關信息。這樣的圖像信息被稱為「元數據」,它通常以「數據頭」的格式被儲存在文件的開頭,涵蓋了圖像矩陣維度、空間解析度、像素深度和光度表示等信息。

 「像素數據」是儲存像素數值的位置。根據數據類型的不同,像素數據使用數值顯示所需的最小字節數,以整點或浮點數的格式儲存。  圖像大小=數據頭大小(包括元數據)+行數  欄數*像素深度*(圖像幀數)

 醫學圖像格式  

放射圖像有6種主要的格式,分別為DICOM(醫學數字成像和通訊)、NIFTI(神經影像信息技術)、PAR/REC(Philips磁共振掃描格式)、ANALYZE(Mayo醫學成像)、NRRD(近原始柵格數據)和MNIC。

2017年5月的醫學圖像格式 

在上圖的五個格式中,DICOM和NIFTI是接受度最高的。

 DICOM表示「醫學數字成像和通訊」。DICOM是由「美國國家電氣製造商協會」(NEMA)發布的標準,這一標準規範了醫學成像的管理、儲存、列印和信息傳輸,這些都是掃描儀或醫院「醫療影像儲傳系統」(PACS)中的文件格式。DICOM包括了一個文件格式和一個網絡通訊協議,其中的網絡通訊協議是醫療實體間使用TCP/IP進行溝通的一個規範和準則。一個DICOM文件由一個數據頭和圖像數據組成的。數據頭的大小取決於數據信息的多少。數據頭中的內容包括病人編號、病人姓名等等。同時,它還決定了圖像幀數以及解析度。這是圖片查看器用於顯示圖像的。即使是一個單一的圖像獲取,都會有很多DICOM文件。

 

來源: https://www.leadtools.com/sdk/medical/dicom-spec1 

Pydicom是用於讀取DICOM文件的Python庫,詳情請參閱文本第一部分的代碼示例。「oro.dicom」是用於讀取DICOM數據的 R-package。 

使用oro.dicom工具包來讀取未壓縮的DICOM文件 

 「神經成像信息技術創新」將NIFTI格式視為ANALYZE7.5格式的替代品。NIFTI最初是用於神經成像的,但它也適用於一些其他的領域。NIFTI中一個主要的特點在於它包含了兩個仿射坐標定義,這兩個仿射坐標定義能夠將每個立體元素指標(i,j,k)和空間位置(x,y,z)聯繫起來。Nibabel是用於讀取nifti文件的一個朋友Python庫,「oro.nifti」是用於讀取nifti數據的一個R工具包。

DICOM和NIFTI之間最主要的區別在於NIFTI中的原始圖像數據是以3D圖像的格式儲存的,而DICOM是以3D圖像片段的格式儲存的。這就是為什麼在一些機器學習應用程式中NIFTI比DICOM更受歡迎,因為它是3D圖像模型。處理一個單個的NIFTI文件,與處理上百個DICOM文件相比要輕鬆得多。NIFTI的每一張3D圖像中只需儲存兩個文件,而在DICOM中則要儲存更多文件。  

靈活的NRRD格式中包含了一個單個的數據頭文件和既能分開又能合併的圖像文件。一個NRRD數據頭能夠為科學可視化和醫學圖像處理準確地表示N維度的柵格信息。「國家醫學圖像計算聯盟」(NA-MIC)開發了一種用NRRD格式來表示「擴散加權圖像」(DWI)和「擴散張量圖像」(DTI)的方法。NRRD的「擴散加權圖像」和「擴散張量圖像」數據可以被解讀為一個「3D切片機」,能夠直觀地確定張量圖像的方向與神經解剖的預期是一致的。一個NRRD文件的大致格式(帶有數據頭)如下圖所示:

來源 http://teem.sourceforge.net/nrrd/format.html#general.1 

 MINC代表的是「醫學成像NetCDF工具包」。MINC文件格式的開發始於1992年「蒙特利神經研究所」(MNI)。目前,McGill的「腦成像中心」(BCI)正積極地對MINC進行進一步開發。MINC格式的第一個版本(Minc1)是建立在標準的「網絡常見格式」(NetCDF)之上的;而第二個版本的MINC格式,即Minc2,則是以「分級數據格式第五版」(HDF5)為基礎建立的。HDF5支持無限制的多種數據類型,它適用於靈活高效的I/O和高容量、複雜的數據。正是有了這些新的特性和功能,Minc2才能處理大量的、複雜的資料庫。以下是一些研究性論文針對這些格式數據頭所作的比較:

來源:出版於2014年的《醫學圖像格式》

 格式轉換

 dicom2nii是將DICOM格式轉換為NIFTI格式的常見工具。一個讀取和編寫NIFTI文件的Python庫是nibabel。如果想要將DICOM格式轉換為NIFTI格式,有很多自動轉換的工具,比如dcm2nii。Python2的「dcmstack」能讓一系列DICOM圖像堆疊成多維度的數組,這些數組能夠被編寫為帶有「數據頭擴展」(DcmMeta擴展)的NIFTI文件,其中的「數據頭擴展」其實就是一份DICOM文件元數據的摘要。 

 BIC的MINC團隊開發了一種將DICOM轉換為MINC圖像的工具,這個程序是用C語言編寫的,點擊此連結查看github報告。由NIFTI或ANALYZE轉換為MINC格式在BIC的MINC團隊開發了另外一種能夠將NIFTI或ANALYZE圖像轉換為MINC圖像的工具,這個程序叫做nii2mnc。點擊此連結查看包括nii2mnc在內的一系列轉換工具。 

總結 

我們在本文介紹了好幾種可以用於儲存成像和深度學習的格式。我們的目標就是利用最佳的格式,讓我們的卷積神經網絡作出準確的預測。

 在下一篇文章中,我們將討論如何利用其中一種格式從CT掃描圖像中進行肺部切割。

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 深度學習下的醫學圖像分析(一)
    近年來,深度學習技術一直都處於科研界的前沿。憑藉深度學習,我們開始對圖像和視頻進行分析,並將其應用於各種各樣的設備,比如自動駕駛汽車、無人駕駛飛機,等等。A Neural Algorithm of  Artistic  Style是一篇最新發表的研究性論文,論文向我們介紹了如何將一種風格和氣質從藝術家身上轉移至一張圖像,並由此創建出另一張新圖像。
  • 深度學習下的醫學圖像分析(二)
    《深度學習下的醫學圖像分析(一)》的後續文章。 在《深度學習下的醫學圖像分析》系列的第一篇文章中,我們介紹了一些使用OpenCV和DICOM圖像基礎知識進行圖像處理的過程。本文,我們將從「卷積神經網絡」的角度討論深度學習。
  • 前沿研究丨深度學習在醫學超聲圖像分析中的應用
    文章指出,在醫學超聲圖像分析中,深度學習展示了巨大的應用潛力,簡要介紹了一些流行的深度學習結構,討論了深度學習方法在超聲圖像分析的各種特定任務(如圖像分類、物體檢測與目標分割)中的應用。文章指出了深度學習在醫學超聲圖像分析應用中所面臨的挑戰以及潛在的發展趨勢。
  • 深度學習在醫學影像中的研究進展及發展趨勢
    隨著深度學習的出現,利用深度神經網絡分析醫學影像已成為目前研究的主流。根據醫學影像分析的流程,從醫學影像數據的產生、醫學影像的預處理,到醫學影像的分類預測,充分闡述了深度學習在每一環節的應用研究現狀,並根據其面臨的問題,對未來的發展趨勢進行了展望。關鍵詞:深度學習 ; 醫學影像 ; 圖像處理 ; 人工智慧 ; 卷積神經網絡論文引用格式:王麗會,秦永彬.
  • 超全深度學習細粒度圖像分析:項目、綜述、教程一網打盡
    選自arXiv作者:Xiu-Shen Wei、Jianxin Wu、Quan Cui機器之心編譯參與:李詩萌、張倩在本文中,來自曠視科技、南京大學和早稻田大學的研究者對基於深度學習的細粒度圖像分析進行了綜述,從細粒度圖像識別、檢索和生成三個方向展開論述。此外,他們還對該領域未來的發展方向進行了討論。
  • 一文探討可解釋深度學習技術在醫療圖像診斷中的應用
    然後,結合三篇文章具體分析了可解釋深度學習模型在醫療圖像分析中的應用。作為一種領先的人工智慧方法,深度學習應用於各種醫學診斷任務都是非常有效的,在某些方面甚至超過了人類專家。其中,一些計算機視覺方面的最新技術已經應用於醫學成像任務中,如阿爾茨海默病的分類、肺癌檢測、視網膜疾病檢測等。
  • 深度學習與圖像識別 圖像檢測
    來源:http://blog.csdn.net/omenglishuixiang1234/article/details/53305842  點擊閱讀原文直接進入主要做了基於深度學習的圖像識別與檢測的研究,下面是一些整理內容1、深度學習的優勢(1)從統計,計算的角度看,DL
  • 深度學習可超快分析三維醫學影像
    英國《自然·醫學》雜誌13日在線發表的兩項獨立研究顯示,最新的人工智慧(AI)已可以基於三維醫學影像,對神經系統疾病和視網膜疾病給出快速、準確的自動診斷。這意味著深度學習算法已成功應用於三維醫學影像的超快分析。
  • 關於MATLAB 圖像處理與深度學習的作用分析和介紹
    接下來我們將介紹如何創建該算法,並說明為何深度學習和圖像處理對於對象檢測和圖像分類同樣十分有用。 圖像處理與深度學習 我們重點介紹兩種技術: 圖像處理 按像素級別變換或者修改圖像。比如,過濾、模糊、去模糊和邊緣檢測等; 深度學習 通過學習樣本圖像自動識別圖像特點。近幾年,深度學習已經徹底改變了圖像處理領域。
  • 透過ISICDM,看醫學圖像分析的未來趨勢與挑戰
    在此大環境下,電子科技大學李純明教授作為ISICDM會議的發起人和程序主席,匯聚了理、工、醫三方知名專家,力促人工智慧+醫學圖像的進一步研究與應用落地。雷鋒網作為兩屆ISICDM的獨家媒體,透過這兩年的報告內容,總結出以下四個趨勢:深度學習遭遇瓶頸,基礎理論研究成熱點
  • 復旦大學宋志堅教授:深度學習在mpMRI圖像處理、醫療數據增強方面...
    在8月24日上午的數字醫學與智能診療分會上,復旦大學的宋志堅發表了題為《深度學習用於計算機輔助診斷與治療:面臨的問題、機遇與挑戰》的演講。其中就包含了對人工智慧所寄予的希望,深度學習是人工智慧的核心技術之一。但是,目前深度學習還存在四個方面的問題(尤其是在醫學上的應用):個別輿論宣傳偏離了科學本身、監管政策、黑箱問題、隱私與黑客攻擊以及數據的數量與質量。
  • 詳解:智能醫學影像分析的前沿與挑戰 | 雷鋒網公開課
    本次公開課主要分為四部分:一是醫學成像的概念及其類型與方式,以及人工智慧及深度學習等技術的介紹;二是深度學習如何應用於醫學影像處理等醫療領域;三是深度學習目前遇到的困難與需要突破的方向上面提到的四個主要問題,都可以通過深度學習的方式來促進診斷,即將需要治療的地方做明確的辨識,輔助醫師做更有效地診斷,找到病灶。深度學習在醫學影像上的應用
  • 深度學習使人工智慧可超快分析三維醫學影像
    在醫學影像方面更是具有其獨特的價值。本文引用地址:http://www.eepw.com.cn/article/201808/390565.htm  據了解,前沿的人工智慧已可以用於三維醫學影像,對神經系統疾病和視網膜疾病做出快速、準確的醫療診斷。  人工智慧可以識別二維的醫學影像,但是對於三維的醫學影像分析效果不是很理想。
  • 上海交大發布 MedMNIST 醫學圖像分析數據集 & 新基準
    ,近日上海交通大學發布了 MedMNIST 數據集,有望促進醫學圖像分析的發展。令人頭禿的醫學圖像分析醫學圖像分析是一個公認的「老大難」課題。樂觀估計,經過多年的學習和研究,你終於掌握了計算機視覺和臨床醫學的雙向技能,那接下來的操作也能讓你愁到頭禿,因為這些數據來源五花八門,有 X 射線、CT、超聲……分析處理這麼多個不同模式的非標準數據集,也太難了!
  • 深度學習之圖像超分辨重建技術
    圖9 RAISR在2x上採樣率時與SRCNN, A+等超分辨算法的技術指標對比左圖為PSNR-runtime指標,右圖為SSIM-runtime指標【4】 結語超分辨重建在醫學影像處理、壓縮圖像增強等方面具有廣闊的應用前景,近年來一直是深度學習研究的熱門領域
  • 圖像識別中的深度學習【香港中文大學王曉剛】
    深度學習是近十年來人工智慧領域取得的重要突破。它在語音識別、自然語言處理、計算機視覺、圖像與視頻分析、多媒體等諸多領域的應用取得了巨大成功。現有的深度學習模型屬於神經網絡。神經網絡的起源可追溯到20世紀40年代,曾經在八九十年代流行。神經網絡試圖通過模擬大腦認知的機理解決各種機器學習問題。
  • 如何將深度學習應用於無人機圖像的目標檢測
    本文全面概述了基於深度學習的對無人機航拍圖像進行物體檢測的方法。隨著基於深度學習的計算機視覺為這些無人機「提供動力」,行業專家們預測無人機將在以前難以想像的應用場景中被前所未有地廣泛使用。我們將探索一些應用以及伴隨著它們的挑戰,這些應用基於深度學習完成了基於無人機的自動化監測。在最後,我們將展示一個使用Nanonets機器學習框架對非洲住房項目進行遠程監測的案例。
  • 吳博:目標檢測集成框架在醫學圖像 AI 輔助分析中的應用 | AI 研習...
    用於醫學圖像分析時的範疇,設置相關的任務及採用合理的模型方法?分享主題:目標檢測集成框架在醫學圖像 AI 輔助分析中的應用分享提綱:1. 醫學圖像分析的任務類型和對象 2. 目標檢測已有框架用於醫學圖像分析的流程 3.
  • 一場深度學習引發的圖像壓縮革命
    此時,另一條路擺在他們眼前,那就是深度學習。方向的轉變並非一帆風順。「我們當時考慮把傳統方法裡的思路與深度學習想結合。比如傳統方法有周圍像素預測,我們結合這種方法進行研究,但發現預測效果不好。之後我們還想到了傳統方法裡的 DCT 變換,將其與深度學習融合之後,發現效果也不好。
  • 基於PyTorch圖像特徵工程的深度學習圖像增強
    介紹在深度學習黑客競賽中表現出色的技巧(或者坦率地說,是任何數據科學黑客競賽) 通常歸結為特徵工程。 當您獲得的數據不足以建立一個成功的深度學習模型時,你能發揮多少創造力?我是根據自己參加多次深度學習黑客競賽的經驗而談的,在這次深度黑客競賽中,我們獲得了包含數百張圖像的數據集——根本不足以贏得甚至完成排行榜的頂級排名。那我們怎麼處理這個問題呢?