吳恩達團隊公布最大醫學影像數據集 MURA,基於深度學習檢測骨骼疾病

2020-11-28 雷鋒網

雷鋒網消息,大量、高質量的數據集推動了深度學習領域的發展。近日,斯坦福吳恩達團隊開源了 MURA 資料庫,包含 14982 個病例的上肢肌肉骨骼X光片。每個病例包含一個或多個圖像,均由放射科醫師手動標記。團隊表示,為鼓勵醫學影像診斷模型的進步,MURA 資料庫可以免費使用。數據集地址為https://stanfordmlgroup.github. io/projects/mura(數據集要2月才會公布)

異常檢測任務,也就是通過組織器官的 X 光片來確定機體的健康狀況,對患病情況進行直接診斷。全球超過 17 億人都有肌肉骨骼性的疾病,這也是導致長期疼痛和殘疾最常見的病因。據雷鋒網(公眾號:雷鋒網)了解,每年有 3000 萬左右的急診病例,這個數字還在不斷上漲。

數據採集和訓練

MURA 是目前最大的 X 光片資料庫之一,包含源自 14982 項病例的 40895 張肌肉骨骼X光片。1萬多項病例裡有 9067 例正常的上級肌肉骨骼和 5915 例上肢異常肌肉骨骼的 X 光片,部位包括肩部、肱骨、手肘、前臂、手腕、手掌和手指。

表一:MURA 資料庫包含 9067 例正常和 5915 例異常肌肉骨骼影像學研究,包括肩部,肱骨,手肘,前臂,手腕,手掌和手指等上肢。MURA 是最大的公共影像數據集之一。

基於 MURA,我們開發了一個有效的異常檢測模型。將一個或多個 X 光片輸入該模型來研究上肢部分。通過 169 層的卷積神經網絡預測每個 X 光片的異常概率,然後得出同一病例所有 X 光片異常概率的平均值,作為 X 光片的異常概率輸出。

圖2.該模型輸入一個或多個 X 光片,通過 169 層的卷積神經網絡預測異常的概率,然後輸出異常概率的平均值。

為了有效地評估模型並獲得放射科醫生對於模型的評價,我們從 209 項持續跟蹤的病例中挑選了 6 個病例,收集專業放射科醫生給出的診斷結果。將模型和醫生給出的診斷結果進行比較,發現模型的診斷能力達到了放射科醫生相當的水平。在診斷手指和手腕異常時,模型檢測異常的能力強於最好的醫生。然而,在診斷膝、前臂、肱骨和肩部異常時,模型的表現不如醫生的表現。

機構審查委員會的批准之後,我們通過斯坦福醫院的PACS系統收集了被識別的、符合HIPPA的圖像。我們收集了來自12251名患者、14982項研究的肌肉骨骼放射學數據集,共有40895個多視圖的影像。每一個都屬於七個標準的上肢放射學研究類型之一:肘部、手指、前臂、手、肱骨、肩膀和手腕。表1總結了正常和異常研究的分布情況。

預測模型VS放射科醫生

斯坦福醫院的放射科醫生將2001年到2012年的每項研究手工標記為正常或異常。在對DICOM圖像進行解釋時,對至少300萬像素的PACS醫用級顯示器進行了解釋,其中最大亮度為400 cd/m2,最小亮度 1 cd/m2,像素尺寸為0.2,本機解析度為1500 x 2000像素。臨床圖像在解析度和縱橫比上有所不同。我們將數據集拆分為訓練(11255名患者,13565個研究,37111個圖像)、驗證(788例,1208項研究,3225張圖片)、測試(208個病人,209個研究,559個圖像)。數據集在任何一組患者之間沒有重疊。

為了評估模型並得到放射科醫生的可靠驗證,我們從史丹福大學那裡收集了一些額外的標籤,這些標籤包括209個肌肉骨骼研究。放射科醫生在使用PACS系統的臨床閱覽室環境中,對每項研究進行了回顧和標記,並將其標記為DICOM文件。放射科醫生平均有8.83年的經驗,從2年到25年不等。放射科醫生沒有獲得任何臨床資料。標籤被輸入到一個標準化的數據錄入系統中。

我們評估了放射科醫生和模型在測試集上的表現。研究中,我們從6名認證的放射科醫生那裡收集了額外的正常/異常的標籤,選擇了其中三位來創建一個金標準,利用其他三位來評估人類在這項任務上的表現。

表二總結了放射科醫生和模型在不同研究類型和總體上的表現。放射科醫生在腕部研究(醫生2)或肱骨研究(醫生1和3)上取得了最高的成績,他們在手指研究上的表現最差。該模型在腕部研究中也達到了最高的表現。在腕部研究中,模型表現與最好的放射科醫生表現相當。在所有其他研究類型中,模型的表現明顯低於人類的表現。

表二:每個研究類型和總體上突出表現最佳(綠色)和最差(紅色)表現

有哪些可用的公開數據集?

大型數據集使得深度學習算法在圖像識別、語音識別和問答等任務中實現或接近人類水平的性能。醫學方面的數據集也幫助科學家在糖尿病視網膜病變、皮膚癌、心律失常、腦出血、肺炎和髖部骨折方面成為小半個「專家」。

表三:公開可用醫學放射影像數據集(第二大的數據集是Pediatric Bone(預測骨齡);0.E.1是關於膝關節的數據集)

表3提供了公共可用數據集的摘要。之前的數據集比MURA要小,但最近發布的ChestX-ray14除外,它是112120個正面的胸片、包含14個胸科病理標籤。然而,標籤並不是直接由放射科醫生提供的,而是由他們的文本報告自動生成。

很少有公開可用的肌肉骨骼X光數據集。史丹福大學的醫學和成像人工智慧項目提供了一個數據集,包含了帶有骨骼年齡(AIMI)的兒童手部X光片。據雷鋒網了解,數據集是由不同年齡的兒童的左手影像組成,上面標有放射科醫生的骨齡讀數。骨關節炎方面就得看0. E.1數據集了,其中包含標有K&L等級的骨關節炎(OAI)的膝部放射照片。上述的幾個數據集都包含不到15000個圖像。

骨骼肌異常檢測的意義是什麼?

骨骼肌x光片的異常檢測具有重要的臨床應用價值。首先,將異常檢測模型用於工作列表的優先級排序。在這種情況下,檢測到的異常可以在圖像解釋工作流程中前置,讓最嚴重的患者得到更快的診斷和治療:

正常的檢查可以被適當地劃分為工作列表的較低優先級;

可以將更快速的結果傳達給醫患雙方,從而優化醫療系統其他領域的配置;

放射學報告模板用於正常研究,可用於檢驗放射科醫生,以便進行更快速的審查和批准。

此外,自動異常定位可以幫助緩解放射科醫生的疲勞。醫療資源的分布不均加劇了這個問題,尤其是在醫療資源集中的城市地區。雖然疲勞是所有醫護專業人員經常面對的一個問題,但放射科醫生非常容易受到影響,進而可能會影響診斷的準確性。有一項研究表明,放射科醫生在當天工作結束時,骨折檢測的效率與工作開始時相比有顯著的下降。

一個可以進行自動異常定位的模型可以突出顯示模型中被識別為異常的部分,引起臨床醫生的注意。如果有效的話,這將有助於更有效地幫助醫生進行閱片,減少錯誤,並幫助提高標準化質量。當然了,該模型還需要更多的研究來進行評估,並且思考如何與其他深度學習模型在臨床環境中進行最優化的整合。

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 「AI影像見分水嶺,行業面臨洗牌」中美醫學影像人工智慧前沿峰會...
    馮教授指出,人工智慧可以減少影像科醫生的程序性、機械性和重複性工作,提高效率,減少數據誤差。智能影像診斷應該建立在大數據的基礎上,將影像數據和全部人類能夠獲取的信息進行整合學習,提高對疾病發展趨勢和規律的預測能力。馮教授還提到,影像醫學屬於體內診斷。區別於體外診斷,體內診斷過程中影像科醫生往往是第一個看到病灶的人,但影像科醫生並不參與治療。
  • 重磅| 吳恩達深度學習課程中文字幕版上線網易雲課堂,,可無限次觀看
    值得注意的是這套免費中文版課程沒有設置課下練習和檢測,所以課程結束後也不會頒發學習證書。有需要證書的同學還是要到Coursera上學習,完成練習,通過檢測即可獲得。據AI科技評論了解,8月初在Coursera上發布的英文版課程,註冊後前7天可免費觀看全部課程內容,7天後課程服務需要付費,價格是49美元/月。配有相關配套練習,體驗過的小夥伴對測設題目的設計和質量都評價很不錯。
  • 重磅| 「生物醫學影像發展戰略」專輯出版
    ,基於活體影像的腦科學研究呈爆發式增長,並受到來自多種不同學科領域研究人員的廣泛關注,其中包括神經科學、臨床醫學、心理學以及工程技術等學科領域。對於活體人腦結構和功能信號的檢測技術而言,許多技術在基礎科研和臨床上已經得到比較廣泛的應用,包括多模態磁共振技術、腦電及腦磁技術等。與此同時,腦科學研究在時間和空間解析度上對腦信號檢測技術提出了更高的要求,由此產生的數據為後期的數據挖據、建模分析等技術帶來了更多的挑戰。為了更好地描述從多時空尺度研究大腦的模式,本團隊在國際上提出了「腦網絡組學」的概念。
  • GPT-3今年的首次升級,讓吳恩達、Keras之父等大佬紛紛叫好!
    楊淨 簫蕭 發自 凹非寺量子位 報導 | 公眾號 QbitAI2021年一開始,OpenAI在GPT-3方向上的又一重要突破,讓吳恩達等大佬激動了。之前給GPT-3一段話,就能寫出一段小說。現在它成功跨界——可以按照文字描述、生成對應圖片!
  • 基於OpenVINO的海信醫療 CAS 計算機輔助手術胸肺系統
    要點綜述  人工智慧等數位化技術正在深度重構醫療行業,從醫學影像輔助診斷、疾病預測/健康管理到藥物研發等諸多環節,數位化技術都發揮著日趨重要的作用,帶來更加智慧、高效、精確的診療方式。  為了支持醫療影像的自動分割,研究人員使用了 NiftyNet 等基礎架構來開發深度學習方案,NiftyNet 使研究人員能夠快速開發和分發用於分段、回歸、圖像生成和表示學習應用程式的 深度學習解決方案,或將平臺擴展到新的應用程式6 。
  • 赫然團隊發現跨物種機器學習可提升精神疾病磁共振影像診斷準確性
    該研究由中國科學院腦科學與智能技術卓越創新中心(神經科學研究所)、上海腦科學與類腦研究中心、神經科學國家重點實驗室研究員王徵研究組與中科院自動化研究所研究員赫然課題組合作完成,整合靈長類動物模型和臨床精神疾病患者的功能磁共振影像數據,國際上首次設計猴-人跨物種的機器學習分析流程,利用從轉基因獼猴模型上學習的特徵構建臨床精神疾病患者的分類器模型,進而深入解析人類自閉症和強迫症的神經環路機制
  • 浙大團隊研製基於深度學習的「隱身衣」
    課題組在國際上率先實現基於深度學習的新一代智能隱身器件,在不依賴任何人為操控的情況下,快速地動態適應變化的背景環境,從而與背景電磁環境特徵融為一體,實現自適應隱身。浙江大學信息與電子工程學院2017級博士生錢超是論文的第一作者,陳紅勝教授是論文的通訊作者,浙江大學為第一完成單位。合作者包括浙江大學鄭斌副教授、沈煉博士、李爾平教授以及麻省理工學院沈亦晨博士和靖禮博士。
  • 基於多特徵地圖和深度學習的實時交通場景分割
    基於AlexNet對FCNN進行了簡化和修改,以滿足智能車輛對環境感知的實時要求。該算法在Cityscapes數據集上進行了測試和比較,使用一個Titan X GPU為400×200解析度圖像提供了73.4%和22ms的全局精度。
  • 今日Paper|蚊子叫聲數據集;提高語音識別準確率;對偶注意力推薦...
    以下是今日的精選內容——目錄提高有噪聲情況下的語音識別準確率——而且用常見工具就可以基於對偶圖注意力網絡多方面社交影響的推薦系統想研究蚊子、阻止瘧疾,你需要一個蚊子叫聲數據集用於類遞增目標檢測的交叉數據集訓練卷積均值:一種簡單的用於照度估計的卷積神經網絡提高有噪聲情況下的語音識別準確率——而且用常見工具就可以論文名稱:Improved Robust
  • 實踐入門NLP:基於深度學習的自然語言處理
    【NLP工程師入門實踐班】——基於深度學習的自然語言處理開車啦!!還不趕緊上車!?在算法和神經網絡方面,側重卷積神經網絡,遞歸神經網絡,增強學習,對抗學習,無監督學習等。發表多篇人工智慧及計算機視覺頂級會議和期刊,包括ICCV、AAAI oral、PR等,並為多個會議和期刊審稿人。曾在中科院參與負責基於龍芯的安全晶片項目,後成功轉行深度學習領域,講課風格深入淺出通俗易懂,有獨家學習和轉行經驗。
  • 業界| 深度學習與XGBoost在小數據集上的測評,你怎麼看?(附源碼)
    作者:Max Brggen機器之心編譯參與:蔣思源近來,部分機器學習從業者對深度學習不能訓練小數據集這一觀點表示懷疑,他們普遍認為如果深度學習經過優良的調參,那麼就不會出現過擬合和過訓練情況,也就能較好地從小數據集學習不錯的模型。
  • 日本團隊用深度學習識別炸雞,救急便當工廠
    根據韓國外賣訂購軟體公布的的統計數據顯示,炸雞今年再次當選韓國「最受歡迎的外賣食品」,從2014年起就一直霸佔著冠軍寶座,簡直是小食界難以逾越的高峰。  光想不做可不行,緊接著,研究團隊對CNN的相關論文進行了閱讀和學習,並進行了進一步的物體檢測。  那時正好是初代Foodly發布初期,在對系統前期表現相當滿意的情況下,研究者們拿出究極武器——炸雞,可以看到,初代系統能夠將圖像的一部分切成矩形,然後以矩形為單位對炸雞塊進行識別。
  • 上海交大發布 MedMNIST 醫學圖像分析數據集 & 新基準
    By 超神經內容概要:醫學圖像分析是一個非常複雜的跨學科領域,近日上海交通大學發布了 MedMNIST 數據集,有望促進醫學圖像分析的發展。關鍵詞:醫學圖像分析   公開數據集醫學圖像分析是一個公認的「老大難」課題。
  • 醫學影像AI企業匯醫慧影完成數億元C2輪融資,旗下產品已落地上千家...
    據介紹,本輪融資將用於公司的產品創新、業務發展、銷售渠道搭建和團隊擴張。2018年,匯醫慧影還曾獲得英特爾投資和芯動能投資的戰略投資,是這兩家基金在中國投資的首家AI醫療企業。至此,匯醫慧影是唯一同時獲得三家全球五百強巨頭投資的醫療人工智慧企業。
  • 那家「給疫情踩了一腳剎車」的醫院,如何應對影像大數據挑戰?
    隨著臨床診斷數據的快速積累,新冠肺炎的影像學大數據特徵逐漸清晰,CT影像對新冠肺炎診斷結果的判斷變得愈發重要。而CT正是基於X射線的醫學影像檢查手段。醫學影像技術憑藉非侵入方式取得人體內部組織影像,成為醫生診斷治療各種疾病的得力助手。
  • 深度學習方法可通過乳房攝影術實現可靠的乳腺癌檢測
    深度學習方法可通過乳房攝影術實現可靠的乳腺癌檢測 作者:小柯機器人 發布時間:2021/1/14 14:40:20 近日,美國DeepHealth 公司A.
  • 吳恩達盛讚的Deep Voice詳解教程,教你快速理解百度的語音合成原理...
    >最近,吳恩達所在的百度人工智慧團隊發布了一篇令人嘆為觀止的文章,文章介紹了一種基於深度學習把文本轉換成語音的新系統。除此之外,Deep Voice還可以訪問頻率和持續時間數據。除了能輸出高質量的語音,論文創新的幾個關鍵點是:1. Deep Voice 將深度學習應用於語音合成的全過程。以前的 TTS 系統會在某些環節上採用深度學習,但在Deep Voice之前,沒有團隊採用全深度學習的框架。2.需要提取的特徵非常少,因此容易應用於不同的數據集。
  • 核醫學:精準醫學時代的最大籌碼
    專家團隊由核醫學與影像醫學專業人員組成,由多年從事專業診斷且經驗豐富的專家領銜。1 PET/CT—核醫學的「航空母艦」PET/CT是將正電子發射斷層顯像(PET)和X線計算機斷層成像(CT)這兩種技術有機地整合到同一臺設備上,並把不同性質的圖像進行同機融合顯示的多模態成像系統,是目前國際上尖端的醫學影像設備之一,也是目前在細胞分子水平上進行人體功能代謝顯像先進的醫學影像技術。