吳博:目標檢測集成框架在醫學圖像 AI 輔助分析中的應用 | AI 研習...

2020-11-23 雷鋒網

如何界定 AI 用於醫學圖像分析時的範疇,設置相關的任務及採用合理的模型方法?醫學圖像分析中目標檢測任務的普遍性,使得開發目標檢測集成框架顯得必要。

近日,在雷鋒網 AI 研習社公開課上,深圳市宜遠智能科技有限公司負責人吳博剖析了目標檢測已有的框架,重點分享如何對目標檢測框架進行改造,以便在醫學圖像分析中產生更好的效果。公開課回放視頻網址:http://www.mooc.ai/open/course/559?=aitechtalkwubo

吳博

學術背景:先後在清華大學、香港浸會大學求學,並在英國利茲大學完成博士後,師從計算機視覺專家唐遠炎教授等人。在 ICML/ACL 等頂級會議發表過多篇人工智慧論文。

工業界經驗:2017 年創立醫療 AI 公司——宜遠智能,該公司集結了 20 多名人工智慧博士以及眾多海內外醫學顧問,為醫療健康領域提供 AI 增強解決方案,並與多家知名醫院達成合作,並推出成型產品。創立宜遠智能之前,吳博曾在愛立信大數據研究院任職,還曾主導過百億級虛擬品電商、數字貨幣系統的業務及數據架構建設與運營。

分享主題:目標檢測集成框架在醫學圖像 AI 輔助分析中的應用

分享提綱:

1. 醫學圖像分析的任務類型和對象 

2. 目標檢測已有框架用於醫學圖像分析的流程 

3. 如何與醫生合作做好 AI 

雷鋒網 AI 研習社將其分享內容整理如下:

今天給大家講一下目標檢測集成框架在醫學圖像 AI 輔助分析中的應用。

醫學圖像分析任務類型和研究對象 

醫學圖像分析的任務類型主要有:

分類與識別:這是最簡單最直接的任務類型。左邊的圖是吳恩達教授之前做的一個 X 光模型,這個模型中主要做分類,判斷是否有肺炎等病症。圖像分類與識別是常見的圖像分析(MIA: Medical Image Analysis) 任務,是圖像檢索的基本單元。

像 ImageNet 被 AlexNet、VGG、GoogleNet、ResNet、SENet 等深度神經網絡從 72% 的準確率,逐步提升到 97.75%,超越人眼 94.9% 的水平。而醫學圖像的分類也非常具有現實意義,比如可以判斷人是有病還是無病、以及是哪類病,像 Nature、Science 雜誌就發表過皮膚癌、胸片、眼底照等醫學場景的圖像分類模型。

但在實操過程中,我們發現將醫學影像當成一個分類問題來處理,任務設置未免過於宏大和粗放。深度學習的模型具有黑盒模型的特點,特點就是端到端(end to end)一步到位,從輸入到輸出而不管中間的過程,雖然也能實現較好的結果,卻往往令人對整個學習過程,知其然而不知其所以然。並且,將醫學影像簡單當成一個分類問題,也算不上解決醫療問題,雖然其可視為一定程度的計算機輔助診斷(CAD: Computer Aided Diagnose),但歸因以及可解釋性得缺陷,並不足以讓醫生全盤參考

 目標檢測:這個任務類型也很普遍,並且現在越發普及,意義越來越重大。我們從 CAD 的歷史和發展進程中,可以看到目標檢測與醫學圖像分析之間的聯繫。CAD 分為兩類:

計算機輔助診斷 (CADx: Computer Aided Diagnose) :對病症進行分類、識別、預測

計算機輔助檢測 (CADe:Computer Aided DETection):主要做對圖像內病灶/病變 (lesion) 的檢測。從歸因到果的角度來說,CADe 可能在做醫學圖像分析時更切合實際。CADe 更接近目標檢測。

而 ImageNet 2013 年推出目標檢測挑戰,在四萬張網際網路圖片中檢測 200 類物體,mAP 從 0. 2258 提升到 2017 年 0.7322,這個水平也幾乎達到了人類的水平。

分割:這也是常規的醫學圖像分析中的一類任務。分割主要包括:語義分割 (semantic segmentation)、實例分割 (instance segmentation)。醫學圖像分析則涉及到器官分割勾畫 (organ and substructure segmentation),還有病變/病灶分割 (lesion segmentation) 等。而醫學影像分割跟常規圖像的語義分割、實例分割不太一樣。我們得看法是,把分割問題當作目標檢測來處理,也方便借力於目標檢測領域方法的蓬勃發展。

【關於醫學影像分割的不同點和難點的更多講解,請回看視頻 00:13:10 處,http://www.mooc.ai/open/course/559?=aitechtalkwubo

我們也探索一下醫學圖像分析的研究對象。

我們在研究醫學圖像分析時,也針對醫學影像學這個名詞參考了很多論文,並進行了諮詢、學習和了解。其中,醫學影像學的一個權威定義為:醫學影像學(Medical Imaging)研究藉助於介質(如 X 射線、電磁場、超聲波、內窺鏡等)把人體內部組織器官以影像方式表現出來,從而方便對人體健康狀況進行評價。

【關於醫學影像學定義的更多講解,請回看視頻 00:19:45 處,http://www.mooc.ai/open/course/559?=aitechtalkwubo

廣義而言,醫學影像學包括成像技術/設備、圖像處理技術,以及日益重要的醫學圖像分析。所以文獻中,MIA 與醫學影像學(Medical imaging)常交替使用。

而醫學圖像分析涵蓋的圖像類別,也不僅限於「內部組織器官」,還包括體表皮膚、五官、外部關節特徵等的拍攝圖像,顯微查看及掃描的組織與細胞病理圖像等。放射影像因為數位化程度高,格式標準,其分析處理最為流行;但其他圖像領域,成像設備、處理分析都在日新月異發展,數位化程度升高,使得 AI 介入成為可能,且愈發體現出價值與意義。

在下圖中,我們可以看到醫學圖像分析的類型以及對應的特點

【關於醫學圖像分析的類型及特點的講解,請回看視頻 00:23:35 處,http://www.mooc.ai/open/course/559?=aitechtalkwubo

目標檢測已有框架用於醫學圖像分析的流程 

進入到今天分享的第二個部分——目標檢測。我們主要講一下相關流程和經驗。

在進行目標檢測之前,需要做好目標檢測訓練數據準備 。從醫院、醫療機構、醫生以及數據源中,我們會積累、整理以及清洗很多數據。其中,清洗是一個非常複雜和龐大的一個環節。而數據準備的重點,主要是標註。

【關於目標檢測訓練數據準備(標註)和標註系統的更多講解,請回看視頻 00:29:40 處,http://www.mooc.ai/open/course/559?=aitechtalkwubo

下圖展示了用第三方工具 LabelImg 來標註足球場的視頻:

醫學圖像領域還涉及到複雜的審核、內部影像管理,單純的開源工具無法滿足這些任務的需求,需要自研和自建一些工具

在圖像 AI 領域,標註極耗成本和時間,所以 AI 反過來輔助標註也是有價值的做法。

【關於 AI 的輔助標註的更多講解,請回看視頻 00:35:15 處,http://www.mooc.ai/open/course/559?=aitechtalkwubo

接下來講今天的主要部分——目標檢測框架及流程。

我們比較推薦 Detectron 這個框架:

【關於 Detectron 框架的更多講解,請回看視頻 00:37:15 處,http://www.mooc.ai/open/course/559?=aitechtalkwubo

實驗過程中,我們也對照 Detectron 嘗試了其他一些非集成的算法,也發現了 Detectron 本身存在的一些問題,比如醫學圖像領域有時需要將分割和目標檢測穿插使用,而 Detectron 框架無法實現二者的穿插使用。針對醫學圖像領域以及 Detectron 自身存在的一些問題,我們內部優化出一個框架——eWingDET 框架。它的特點和優勢包括:

第一,支持 bbox 和 mask 兩種識別目標的任意切換,支持 backbone 網絡的自由更換,支持多種類的圖像增強方式,支持 2D、3D 圖像的目標檢測。

第二,以 tensorflow 為內核,以 Faster-RCNN/Mask-RCNN 為核心,可進行 python 端多 GPU 訓練,兼容 Horvod 分布式框架。

第三,訓練好的模型可以直接在前端使用 C++在 CPU 上進行 inference,產出結果。

第四,自定製對模型性能的評價函數,加入了 FPN,提升了對小目標檢測的性能,如 CT 中鈣化病灶目標的檢測。

【關於 Detectron 框架的一些問題以及 eWingDET 框架的特點、流程、訓練、推斷的更多講解,請回看視頻 00:39:50 處,http://www.mooc.ai/open/course/559?=aitechtalkwubo

醫學圖像的算法也好,模型也罷,怎樣將其變成一個比較完備的系統,落地到醫院的系統部署方式,往往更具有現實意義

【關於系統部署方式的更多講解,請回看視頻 00:50:30 處,http://www.mooc.ai/open/course/559?=aitechtalkwubo

我們的醫學圖像 AI 也會落地到醫院,進行合作,對外賦能。比如通過醫學圖像 AI as a Service(AIaaS) 平臺集成多類醫學圖像分析功能,經審核合資格的機構用戶與專業用戶,可以進入到該平臺,使用模型體驗、API 調用等服務。平臺根據模型體驗和 API 調用的次數,進行額度扣除。而用戶也可因為幫助改善模型和提供算力,獲得額度獎賞。

案例分享

案例 1:牙齒根管識別

案例 2:目標檢測用於皮膚圖像分析

關於皮膚圖像分析的案例,我會講到銀屑病 AI、面部皮膚病 AI 以及面部皮膚 AI 副產品,即皺紋斑點等目標檢測處理這三個案例。

【關於牙齒根管識別、目標檢測用於皮膚圖像分析的案例具體講解,請回看視頻 00:59:58 、00:63:22 處,http://www.mooc.ai/open/course/559?=aitechtalkwubo

我們做得比較好的還有用於肺結節 CT 分析的 3D 目標檢測,下面我也跟大家簡單分享一下。

3D 目標檢測在肺結節 CT 分析中的應用,表明目標檢測的集成框架和方法除了可以用於比較淺層次的皮膚識別領域,還能在醫學圖像識別中比較大型的、難度比較大的場景中使用。肺結節識別採用的是 3D Faster RCNN 的 RPN 網絡,它能減少需要調節的網絡參數,既沒有後續的全連接做分類,也不需要在後面接一套 3D CNN 來做降假陽。

【關於 3D 目標檢測用於肺結節 CT 分析的講解,請回看視頻 00:72:20,http://www.mooc.ai/open/course/559?=aitechtalkwubo

 如何與醫生合作做好 AI 

最後分享一下如何跟醫生做好 AI 合作,我們看重的 AI 工程師的能力主要有以下幾個:

第一個,和醫生協作的能力(這一能力與 EQ 有關)。傳統的機器器學習中,往往只需要跟設備和代碼打交道,而醫學影像研發需要經常和醫生溝通,把醫生的思路不斷地模擬成代碼。其中的很多思路和方法都無法從論文裡面得來,和醫生的協作往往是 AI 研究人員需要具備的能力。

第二個,從數據中找尋優化模型思路的能力,即問題解決能力(這一能力與 IQ 有關)。醫學影像數據,每個醫院都不一樣,主要體現在醫院的場景、拍攝手法等。很多時候,甚至每個病種的數據都沒有前人的工作可參考。這就需要我們花大量的時間泡在數據裡面,尋找數據裡面的規律,來優化模型。控制好數據敏感性,防止 garbage in garbage out,從而能控制好數據,就能控制效果。

AI 工程師這一能力的天分體現在:每次接觸的數據都不同,判斷思路路都不同的情況下,能迅速的找到解決問題的關鍵。而進一步的天分還體現在能抽象推出標準、實用新框架的能力。

而且需要注意的是,機器學習是【法】,深度學習是【術】,AI 工程師不能太痴迷於工具,而忽略問題的本質。

第三個,把 paper 新思路和新框架引入 實際工作的能力(這一能力跟勤奮有關)。因為新的框架替換舊的框架,帶來的往往是門檻的提升,不 follow 就落後,所以我們一定要緊跟最新的前沿進展。不過這種能力,往往只能解決公開數據集的問題。對於我們碰到的實際複雜多變的醫學圖像,肯定是不夠的,很容易會陷入到坑裡面去。

目前我們也在招聘 AI 工程師、機器學習工程師、算法工程師以及數據工程師,感興趣的同學歡迎聯繫我們。

對本次分享做一下總結:

第一,我們講了一下醫學圖像分析的方法和流派之分,在我們實際工作中,目標檢測這種方法的作用凌駕於其他方法之上。我們通常不會選擇優先去解決圖像分類、重構以及分割問題,而更多地將其當做目標檢測問題。雖然這一方法論比較固定,但實際用於醫學影像分析時,應用面也非常寬泛。

第二,分享了目標檢測的全流程,包括框架的學習、模型打造後怎樣跟醫療機構對接的問題等。

最後,分享了怎樣跟醫生做好 AI 合作,進而分享了 AI 工程師應該具備的幾個能力以及需要進行哪些方向的修煉。

以上就是本期嘉賓的全部分享內容。更多公開課視頻請到雷鋒網(公眾號:雷鋒網(公眾號:雷鋒網)) AI 研習社社區(https://club.leiphone.com/)觀看。關注微信公眾號:AI 研習社(okweiwu),可獲取最新公開課直播時間預告。

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 鄒炎炎:語義分析介紹及跨語言信息在語義分析中的應用 | AI 研習社...
    分享主題:語義分析介紹及跨語言信息在語義分析中的應用分享提綱:1.semantic parsing 背景介紹2.semantic parsing 模型介紹3.實驗分析雷鋒網 AI 研習社將其分享內容整理如下:今天跟大家分享的內容包括兩個部分:一是語義分析介紹,考慮參與分享的大多數朋友並不是從事 semantic parsing 的相關工作,所以我會從通俗易懂的角度為大家做一個普及;二是講一下我們在 ACL 2018 會議中的一篇短文——《跨語言信息在語義分析中的應用
  • 宜遠智能CEO吳博:醫學影像的數據標註、算法方法與算力優化
    、Caffe、TensorFlow、MXnet4.目標檢測用於面部皮膚疾病分析數據脫敏及預處理、皮膚疾病檢測5.目標檢測用於宮頸基液細胞分析基於深度學習+GBDT的Two Stage模型multi CPU+multi GPU宮頸病理三分類系統6.3D目標檢測用於肺結節CT分析:
  • 如何將深度學習應用於無人機圖像的目標檢測
    隨著基於深度學習的計算機視覺為這些無人機「提供動力」,行業專家們預測無人機將在以前難以想像的應用場景中被前所未有地廣泛使用。我們將探索一些應用以及伴隨著它們的挑戰,這些應用基於深度學習完成了基於無人機的自動化監測。在最後,我們將展示一個使用Nanonets機器學習框架對非洲住房項目進行遠程監測的案例。
  • 前沿研究丨深度學習在醫學超聲圖像分析中的應用
    中國工程院院刊《Engineering》刊發《深度學習在醫學超聲圖像分析中的應用綜述》一文,旨在全面而系統地總結深度學習在醫學超聲圖像分析中的應用,主要是在典型的任務及其在不同解剖結構中的應用。文章指出,在醫學超聲圖像分析中,深度學習展示了巨大的應用潛力,簡要介紹了一些流行的深度學習結構,討論了深度學習方法在超聲圖像分析的各種特定任務(如圖像分類、物體檢測與目標分割)中的應用。文章指出了深度學習在醫學超聲圖像分析應用中所面臨的挑戰以及潛在的發展趨勢。
  • 夏日專刊AI產品上新升級集錦,50餘項軟硬能力加速場景落地
    安全生產監控方案 視頻分析邊緣計算盒 EM-BOX 全新升級,上新5項分析功能除安全帽佩戴合規檢測、煙火檢測、電子圍欄外,支持技能增加:陌生人檢測、攀高檢測、睡崗檢測、離崗檢測、人流過密預警。充分利舊現有攝像頭,即插即用,提供可視化管理平臺,支持二次開發。
  • 當AI遇到生物-深度學習在生物研究中的應用案例列表
    本篇文章列出了部分現有的應用深度學習技術處理醫學和生物學問題的工具,從這個列表中,可以看出當前深度學習在該領域的挑戰和局限,也可以全面的了解深度學習在計算生物學,醫學影像及生物信息等學科所具有的廣泛應用場景。深度學習+生物的論文發表數量
  • 北京大學王立威教授: AI 醫學影像的現狀、機遇與挑戰
    所以綜合上述的幾個因素,我最後選擇了從醫學影像入手。」在這個應用研究的三岔路口上,王立威教授最終選擇了醫學影像領域。「醫學影像是未來幾年之內人工智慧影響最深遠的領域。」肺結節問題的諸多難點肺結節的早期篩查是AI+醫學影像的熱門領域,但是,肺結節的種類繁多、形態各異、容易與肺內其他組織(例如血管等)混淆。這些問題也會考驗從這個領域切入的創業者,例如肺門區域結節和磨玻璃結節的檢測。因此,王教授團隊採用了三階段模型框架來解決這樣的問題。
  • 香港中文大學胡梟瑋:用於陰影檢測的 DSC 特徵 | AI研習社64期大...
    AI研習社按:陰影檢測向來是計算機視覺中基礎且富有挑戰性的問題——對於一張輸入圖像,我們通過生成二進位圖像來標記陰影區域,陰影區域的檢測為進一步獲取圖像中的光照情況、物體的形狀與位置,以及攝像機的參數提供了可能。
  • 人工智慧在醫學成像中的應用簡介
    如果圖像不夠清晰,就無法得出任何結論,我們可以使用CT掃描來更好地查看肺部。每年,醫院都會生成大量的圖像數據。這些圖像可用於實現深度卷積神經網絡,從而有助於在圖像中找到不同的模式。人工智慧將有助於分析這些圖像,並將進一步幫助診斷,為醫生做出挽救生命的決策提供工具。基於AI的醫學成像如何有助於您制定決策?
  • 一周AI大事盤點:AI幫助農民精準除草,AI可分析動物行為
    AI應用範圍又新增了哪些領域?行業大咖分享了哪些精彩觀點?今天就帶你盤點過去一周(11月4日至11月10日)AI領域發生的熱門事件: 人工智慧幫助農民精準除草11月4日消息,法國國立應用科學學院的研究人員開發了一個AI模型,該模型能夠從無人機拍攝的作物圖像中檢測出雜草。
  • 2018 公開課盤點企業篇:十家企業帶你看 AI 的實際應用成果及人才...
    黃李超畢業於帝國理工碩士,曾於 2014 年加入百度深度學習研究院;並於 2015 年作為初創人員加入地平線,現研究方向包括深度學習系統研發,以及計算機視覺中物體檢測,語義分割等方向。公開課上,黃李超不僅介紹了 AI 晶片的背景以及怎麼從算法角度去設計適合嵌入式平臺高效的神經網絡模型,還講解了高性價比的神經網絡在計算機視覺領域的應用。
  • 全球三十大最佳 AI 創業公司公布
    Clarifai 成立於 2013 年,專注計算機視覺領域,公司在同年 ImageNet 2013 大賽中獲得圖像分類組前五名,至今一直處於行業領先地位。 12、匯醫慧影 匯醫慧影成立於 2015 年,是國家級醫學影像人工智慧高新技術企業,公司擁有圖像深度學習核心技術和多項專利技術,基於雲計算、大數據、人工智慧技術,構建了智慧影像雲平臺、數字智能膠片、腫瘤放療雲平臺、大數據智能分析雲平臺和人工智慧診斷雲平臺等五大平臺,打造了醫學影像的數位化、移動化、智能化,完成了從篩查、
  • 香港中文大學胡梟瑋:用於陰影檢測的 DSC 特徵 | AI研習社64期大講堂
    雷鋒網AI研習社按:陰影檢測向來是計算機視覺中基礎且富有挑戰性的問題——對於一張輸入圖像,我們通過生成二進位圖像來標記陰影區域,陰影區域的檢測為進一步獲取圖像中的光照情況、物體的形狀與位置,以及攝像機的參數提供了可能。與此同時,陰影的存在也為計算機視覺中進一步理解圖像的算法,例如物體的檢測與跟蹤,帶來了障礙。
  • 如何在集群中高效地部署和使用 AI 晶片? | 分享總結
    近期,在雷鋒網(公眾號:雷鋒網) AI 研習社線上公開課上,Thinker (AI 晶片) 團隊深度學習平臺負責人周鵬程分享了目前主流的分布式異構計算特性,區別和應用,並且介紹了如何讓當前流行的大數據分析引擎(如:Spark)從 AI 晶片的強大計算能力中獲益。
  • Facebook AI 年度總結來啦
    我們提出了新的研究,除了圖像識別上的進展,在NLP領域,我們現在可以用較少的監督數據翻譯更多的語言。我們發布了許多平臺和工具來幫助其他人將他們的人工智慧研究轉化為生產應用程式,包括我們將目前流行的開源深度學習框架 PyTorch 升級成新的、更通用的 1.0 版本。
  • 機器之心「AI00」十一月最新榜單:兩家國內公司新上榜
    市值/估值/融資額Clarifai美國計算機視覺圖像及視頻識別 APIA 輪: 1000 萬美元Affectiva美國計算機視覺和深度學習實時面部表情分析和情緒識別解決方案>英國計算機視覺、視覺搜索、圖像識別數字媒體、廣告營銷、社交圖片識別分析四輪共獲得 968 萬美元Orbital Insight美國計算機視覺、深度學習和數據科學分析海量衛星圖像,用於經濟趨勢分析和公益研究
  • 周麗芳:深度拓展圖像識別技術應用,助力數字醫學發展
    近幾年圖像識別技術在許多領域內大方異彩,當下最熱門的研究方向之一就是醫學圖像分析(醫學計算機視覺),其中醫學圖像分析領域內的醫學圖像分割領域具有很高的應用價值,可用於影像引導介入治療,定向放療等過程中。
  • 雷軍:AI會取代50%的人 | 人工智慧+醫學影像應用案例分析
    另一方面,目前醫學影像數據大部分仍然需要人工分析,最明顯的缺陷就是不精準,依靠經驗所做的判斷容易造成誤診。人工智慧提高診療效率和準確率人工智慧依靠強大的圖像識別和深度學習技術,在對圖像的檢測效率和精度兩個方面,都可以做得比專業醫生更快,還可以減少人為操作的誤判率。
  • 復旦大學陳俊坤:自然語言處理中的多任務學習 | AI 研習社職播間第...
    近日,在雷鋒網 AI 研習社公開課上,復旦大學計算機系在讀碩士陳俊坤分享了其所在研究組關於多任務學習在自然語言處理領域的最新工作。公開課回放視頻網址:http://www.mooc.ai/open/course/574?
  • AR近眼顯示中的光波導| AI 研習社 158期大講堂總結
    在本次公開課中,講者將深度解讀光波導的工作原理及不同光波導方案的優缺點分析,同時分享 Rokid R-Lab 團隊在 AR 眼鏡領域的技術探索與應用。 回放地址:http://www.mooc.ai/open/course/675?