學界| 斯坦福Nature論文宣布新突破:深度學習皮膚癌診斷達專家水平

2020-12-11 機器之心Pro

選自斯坦福機器之心編譯

為了讓人們能獲得更好的醫療,史丹福大學的研究者已經成功訓練了一個可以診斷皮膚癌的算法。該研究的相關論文《Dermatologist-level classification of skin cancer with deep neural networks》已經發表在 Nature 上。本文編譯自史丹福大學的官方介紹新聞,讀者可在文末查看論文摘要和點擊「閱讀原文」查閱原論文。

預約一個醫生幫你檢查一顆痣是否會癌變已經非常可怕了,但想像一下,如果你住的地方又離最近的醫生非常遠,沒有時間做檢查或者沒有錢跑那麼遠去做檢查該怎麼辦?在這種情況下,通過手機診斷疾病會是一種救急的選擇。

通常,皮膚科醫生使用皮膚鏡(dermatoscope)來觀察皮膚,這是一種手持顯微鏡。斯坦福的計算機科學家創造了一個可以進行皮膚癌診斷的人工智慧診斷算法,表現可媲美通過職業認證的皮膚科醫生。

在計劃創造皮膚癌人工智慧診斷算法的時候,斯坦福的計算機科學家想的是能讓治療普遍可及。他們做了一個包含近 13 萬張皮膚疾病圖像的數據集,然後訓練算法能在視覺上診斷潛在的癌症。在首次測試中,它就展現出了驚人的準確率。

「我們意識到這是可行的,而且可以做得很好,」斯坦福人工智慧實驗室副教授 Sebastian Thrun 說。「那時我們的思想改變了。那時我們會說,『看,這不僅僅是一個學生的課堂項目,而是為人類做偉大事情的一個機會』。」

該項目最終的成果論文發表在 1 月 25 日的 Nature 雜誌上,該結果已經過了 21 位認證皮膚科醫生的對比測試。在該論文中的最常見的和最致命的皮膚癌的診斷上,該算法的表現已能媲美皮膚科醫生。

為什麼選擇皮膚癌?

美國每年都有 540 萬人患皮膚癌,在早期檢測到的黑色素瘤的 5 年生存率在 97% 左右,如果晚期查出 5 年生存率將會下降 14%,皮膚癌的早期發現可能會對其結果產生巨大的影響。

皮膚癌的診斷始於視覺檢查。醫生通常用肉眼觀看皮膚鏡來檢查可疑的病變。皮膚鏡是一種手持式顯微鏡,可低倍率放大皮膚表面。如果這些方法都是不確定的,或者無法讓皮膚科醫生確定病變是癌變,那麼下一步就要用到活檢。將該算法納入檢測過程迎合了當下將視覺處理與深度學習相結合的計算趨勢——深度學習是一種對大腦神經網絡建模的人工智慧。深度學習在計算機科學中已有幾十年的歷史,但最近才被應用到視覺處理任務上,並取得了巨大的成功。包括深度學習在內的機器學習的本質就是訓練計算機來解決問題,而不是把答案編進程序。

「我們做了一個非常強大的機器學習算法,它能從數據中學習,」該研究相關論文的合作者、Thrun 實驗室的研究生 Andre Esteva 說,「你讓算法找出答案,而不是把要找的東西寫入計算機代碼。」

該研究相關論文的合作者、Thrun 實驗室的研究生 Andre Esteva

該算法處理的是帶有一個相關疾病標籤的圖像的原始像素。與其他訓練算法的方法相比,該方法需要的處理非常少,也不需要在分類之前對圖像進行分組,這允許算法處理種類更廣泛的數據。

從貓狗識別到黑素瘤和癌症的診斷

研究人員並沒有從頭開始構建算法,而是從谷歌已經訓練識別了 128 萬張 1 千種類目標的算法基礎上進行開發的。雖然谷歌這套系統是為識別貓和狗設計的,不過研究員需要它能學會區分良性脂溢性角化病(benign seborrheic keratosis)和惡性腫瘤。

這篇論文的主要聯合作者,Thrun 實驗室的研究生 Brett Kuprel 說:「現在情況是沒有巨大的皮膚癌數據集來訓練我們的算法,所以我們只能自己做了,我們從網際網路收集數據,並與醫學院合作對混亂數據(標籤就含有多種語言,如德語、阿拉伯語、拉丁語等)進行良好的分類。」

Thrun 實驗室的研究生 Brett Kuprel

經過必要翻譯後,研究人員與斯坦福醫學院皮膚科醫生以及本論文的聯合作者、斯坦福微生物學和免疫學教授 Helen M. Blau 合作處理影像資料。這個跨學科的團隊一起對網際網路上混亂的影像進行分類。其中很多影像資料並不像醫療專業人員拍攝的那樣專業,而是從各個角度、焦距和照明下拍的。最後,他們累積了約 130,000 張皮膚病變的圖像,這些圖像展示了超過 2000 種不同的皮膚疾病。

在測試期間,研究者只使用了由愛丁堡大學和國際皮膚影像合作項目(International Skin Imaging Collaboration Project)提供的高質量和活組織檢測證實(biopsy-confirmed)的影像,其代表著最常見最致命的皮膚癌:惡性腫瘤和惡性黑素瘤。這需要詢問 21 個皮膚科醫生他們通過每一張影像決定是進行活組織檢測(biopsy)或治療還是判斷不是惡性疾病。因此研究人員評估了皮膚科醫生在超過 370 張影像中能夠正確診斷癌性和非癌性病變的準確程度。

算法的性能是通過構建敏感性(特異性曲線)進行衡量的,其中敏感性(sensitivity)代表著正確識別惡性病變的能力,特異性(specificity)代表著正確識別良性病變的能力。其是通過三個關鍵性診斷任務進行評估的:角化細胞癌的分類、黑素瘤的分類和通過皮膚鏡檢查的黑素瘤分類。在所有的三個任務中,該算法的表現媲美皮膚科醫生,靈敏度曲線之下的區域達到整個曲線圖區域的 91%。

該算法另外的優點是它的敏感性能進行調整,研究者可以根據他們想要評估的東西從而調整其響應度。這種改變敏感性的能力暗示著該算法的深度與複雜性。看似無關照片中潛藏的架構——包括貓和狗的圖像,都有助於算法更好地評價皮膚病變影像。

通過智慧型手機實現的醫療

儘管該算法目前用於計算機,但團隊希望未來它能夠兼容於智慧型手機,讓可靠的皮膚癌診斷觸手可及。

「我意識到用在智慧型手機是多麼的獨特,那是我靈光乍現的一刻」Esteva 說,「每個人口袋中都有一個超級計算機,上面有大量的傳感器,包括攝像頭。如果我們把它用來篩查皮膚癌會怎麼樣?或其他疾病呢?」

雖然該團隊相信把算法過渡到行動裝置會相對簡單,但仍需要在現實世界的臨床試驗上進行進一步的測試。

計算機輔助分類良性和惡性皮膚疾病的發展能夠極大地幫助皮膚科醫生改進對高難度疾病的診斷,並向病人提供更好的管理選擇。」該論文的合作者、斯坦福癌症研究所 Pigmented Lesion & Melanoma 項目的負責人 Susan Swetter 教授說,「然而,在算法用於臨床實踐之前,還需要從業者與病人等進行嚴格的驗證。」

即使面臨著如此多的挑戰,研究人員依然感覺很有希望:深度學習某天能夠在多種醫療領域為視覺化診斷做出貢獻。

該研究的其他合作者包括:皮膚病學、病理學臨床助理教授 Robert Novoa,皮膚病學臨床副教授 Justin Ko。

論文:用深度神經網絡實現皮膚科醫生水平的皮膚癌分類(Dermatologist-level classification of skin cancer with deep neural networks)

摘要:皮膚癌是人類最常見的惡性腫瘤,目前主要是通過視覺診斷的。一般首先是臨床篩查,之後可能需要皮膚鏡分析、活檢和組織病理學檢查。使用圖像的皮膚病變自動分類是一個具有挑戰性的任務,因為皮膚病變的外觀是一種細粒度的變化。深度卷積神經網絡(CNN)在多種細粒度對象分類的通用的及高度可變的任務中都顯示出了潛力。在這裡,我們展示了使用一個單一的深度卷積神經網絡進行皮膚病變分類的過程,該網絡僅使用像素和疾病標籤作為輸入,直接從圖像中端到端地訓練出來。我們使用 129450 個臨床圖像的數據集——大於以前的數據集兩個數量級,包含了 2032 種不同的疾病——訓練了一個深度卷積網絡。我們使用兩個關鍵的二進位分類用例:角質形成細胞癌(keratinocyte carcinomas)vs 良性脂溢性角化病(benign seborrheic keratoses);惡性黑色素瘤 vs 普通的痣,在 21 位經過認證的皮膚科醫生的監督下,測試了它在活檢證實的臨床圖像上的性能。第一例代表最常見的癌症的識別,第二例代表了最致命的皮膚癌的識別。深度卷積神經網絡在這兩個任務上的表現都達到了所有測試的專家的水平,證明了該人工智慧的皮膚癌鑑定水平達到了媲美皮膚科醫生的水平。配備該深度神經網絡的行動裝置可以讓皮膚科醫生的診斷拓展到臨床之外。據預測,到 2021 年,將有 63 億智慧型手機訂閱該功能,實現低成本的重要診斷。

相關焦點

  • Nature Medicine連發9篇論文,Jeff Dean、吳恩達等最新研究入列
    人工智慧(AI),特別是深度學習,將會改變診斷的醫療服務,是近年來開始用於醫學圖像和電子健康記錄解釋的主要技術工具之一。醫生將被診斷數據淹沒:核磁共振、CT、X 光、活檢等等。卷積神經網絡(CNN)將非常有效地處理由這些圖像和立體(3D)數據構成的財富。CNN 將自動分析和分割圖像,找到可疑的疾病並在適當的置信度上提供客觀的結果。
  • 我國人工智慧新突破!安翰科技研發的深度卷積神經網絡模型取得突破...
    原標題:我國人工智慧新突破!Gastroenterology(譯名《胃腸病學》,影響因子19.233,RANK=1)上發表,標誌著消化內科又添新助手,有望極大程度地改變小腸疾病的診斷模式,為臨床醫生與患者帶來福音。
  • 學界 | 斯坦福論文提出MoleculeNet:分子機器學習新基準
    斯坦福的研究者提出一種適合分子機器學習的大型基準 MoleculeNet,並在 arXiv 上發布論文。機器之心對該論文進行了編譯。論文地址:https://arxiv.org/abs/1703.00564過去幾年中,分子機器學習快速發展成熟。方法的改進和大型數據集的出現使得機器學習算法對分子特性的預測精度變高。
  • 斯坦福新成果:X光診斷報告自動生成
    近日,由斯坦福Curtis Langlotz和Chris Manning教授指導的團隊發表了他們將自然語言處理技術應用於醫療診斷的最新成果。在這項研究中,他們運用自然語言處理模型閱讀醫生對X光照片的描述,結合患者病史,自動生成精準、流暢的診斷結果。
  • 2018人工智慧醫療盤點:科研突破 巨頭髮力 產業聯合 資本依舊
    作者丨天一10月31日,在中共中央政治局第九次人工智慧發展現狀和趨勢集體學習會上,新一代人工智慧再次引起國家領導層關注。近年來,醫療健康逐漸成為中國人工智慧落地商業化的前沿陣地之一。智能醫學影、AI藥物研、虛擬助手、健康大數據等不斷變革、突破、創新,AI技術與應用日漸融合。
  • 【乾貨薈萃】機器學習&深度學習知識資料大全集(二)(論文/教程/代碼/書籍/數據/課程等)
    【導讀】轉載來自ty4z2008(GItHub)整理的機器學習&深度學習知識資料大全薈萃,包含各種論文、代碼、視頻、書籍、文章、數據等等。是學習機器學習和深度學習的必備品!/nature/journal/v521/n7553/full/nature14539.html介紹:Nature:LeCun/Bengio/Hinton的最新文章《深度學習》,Jürgen Schmidhuber的最新評論文章《Critique of Paper by "Deep Learning Conspiracy" (
  • Nature子刊:反事實推斷幫模型識別罕見病,躋身專家水平
    在醫療診斷方面,機器學習輔助診斷有望通過大量病人數據提供精確、個性化的診斷,從而革新臨床決策和診斷。然而,人類醫生的診斷流程與現有的機器學習診斷方法從原理上來說大相逕庭。在醫療診斷中,醫生需要確定病因,進而向病人解釋症狀。然而,現有的機器學習診斷方法是完全基於相關性的,它可以識別出與病人症狀強相關的疾病。
  • 學界 | MIT深度學習課程全部視頻及課件開放
    項目建議部分的持續時間為1分鐘,大家可以從深度學習算法,應用程式,開源貢獻,創建有趣的數據集或其他相關方面選擇一個主題。贊助商將評選出最佳項目作為獲獎者。項目建議也可以選擇提交一篇有趣的深度學習綜述論文。
  • 機器翻譯新突破,微軟中英新聞翻譯達人類水平
    雷鋒網AI科技評論消息:14日晚,微軟亞洲研究院與雷德蒙研究院的研究人員宣布,其研發的機器翻譯系統在通用新聞報導測試集newstest2017的中-英測試集上,達到了可與人工翻譯媲美的水平;這是首個在新聞報導的翻譯質量和準確率上可以比肩人工翻譯的翻譯系統。
  • Deepmind "預測地圖"論文背後:神經科學或將助力深度學習迎來新突破
    這方面研究的先驅包括Geoffrey Hinton、Yann LeCun、Yoshua Bengio等人,1998年,Yann LeCun提出了卷積神經網絡(CNN),2006年,Hinton提出了深度學習的概念並在其經典論文《A fast learning alforithm for deep belief nets》中提出了深度信念網絡,帶來了深度學習直到今天的黃金時代;2009年,Yoshua
  • Nature新子刊今日上線!《機器智能》重點關注中國AI
    因此,深度學習在2012年左右取得了顯著的突破。當有足夠的數據來訓練系統時,深度學習就能識別複雜數據集中的模式。深度學習被認為是人工智慧的一種形式,因為它與人類的學習有相似之處。事實上,在過去的幾年裡,深度學習在執行通常是人類擅長的任務方面取得了顯著表現:學會了玩戰略遊戲並獲勝、在醫學診斷方面達到人類專家水平、語音識別和語言翻譯。
  • 中國團隊 Nature 新冠論文被指圖片造假,又是科研「P圖」?
    ,研究使用新冠病毒(SARS-CoV-2)感染 hACE2 轉基因小鼠,研究了新冠病毒的致病性,相關結果曾於 2020 年 2 月 28 日提前發布在預印本 bioRxiv 上。然而 5 月 12 日,著名國際「學術打假人」——前史丹福大學助理研究員 Elisabeth Bik 博士在 PubPeer 和其 Twitter 上質疑該 Nature 論文不端,存在圖片內容重疊問題。
  • 學界 | 使用深度學習和樹搜索進行從零開始的既快又慢的學習
    也就是說,學徒沒有僅僅是從有限的,固定的專家棋譜資料庫中創建一個行動查詢表,而是能將所學泛化到其他棋局狀態中。所以神經網絡既起著泛化的作用,也起到了模仿專家玩家的作用。假設學徒通過模仿目前所見到的所有專家行動學到了一個快速決策,那麼它就可以被專家所用。
  • Nature論文作者撰文質疑AI醫療影像研究...
    近期史丹福大學吳恩達等人提出的 CheXNet 便是其中之一。研究人員在其論文中表示:新技術已經在識別胸透照片中肺炎等疾病上的準確率上超越了人類專業醫師。然而,另一群學者對目前的一些研究產生了懷疑。它們足以說明,找到那些優秀的數據集或正確的標籤以學習高效的醫療任務是十分困難的。同樣,我們還是需要專家查看這些影像來進行醫療診斷。第三部分:這些圖像對圖像分析有什麼好處?這是本評論最重要的部分。放射學的深度學習應用有一個大問題,如果不查看圖像,後果將非常嚴重。
  • Nature趨勢觀察:綜述論文泛濫引發業內人士擔憂
    一位領先的薈萃分析研究者報告稱,科學分析的黃金標準正被快速侵蝕。系統綜述和薈萃分析對主題相似的論文進行提煉,旨在形成有關特定主題的權威性觀點—一般是某特定療法在醫學中的效果如何—它們是循證醫學的重要工具。
  • 乂學教育-松鼠AI獲KDD國際圖深度學習研討會最佳論文 & 最佳學生論文
    KDD「圖深度學習國際研討會:方法與應用(DLG 2019)」於2019年8月5日在美國阿拉斯加安克雷奇市舉辦。值得一提的是,國內人工智慧獨角獸乂學教育-松鼠AI深度參與的研究項目包攬了研討會的最佳論文和最佳學生論文獎項。深度學習是當今人工智慧研究的核心。
  • 李飛飛又有新動向,斯坦福 AI 實驗室由 Christopher Manning 接棒
    繼今年 10 月 20 日正式離開谷歌雲、回歸斯坦福,她的職業終於塵埃落定——擔任斯坦福新成立的「以人為中心的 AI 計劃」的聯合負責人。1999 年,出於對深度學習自然語言處理的滿腔熱情,先後在卡內基梅隆大學、雪梨大學等任教的 Manning 教授以斯坦福自然語言處理組(Stanford NLP Group)的創始成員的身份回歸母校。
  • 斯坦福駱利群院士2年5篇CNS:3篇Cell,1篇Nature和1篇Science
    【主要參考:inature 報導文章】第一篇 2020 《Cell》: "原位"進行蛋白質組學在細胞界面上的分子相互作用介導了單細胞到組織的組裝,並因此控制著多細胞生物的發育和生理。2020年1月16日,史丹福大學駱利群及Alice Y.
  • 深度學習論文閱讀路線圖
    ,可能會遇到的第一個問題是「應該從哪篇論文開始讀起呢?」這裡給出了深度學習論文閱讀路線圖!路線圖按照下面四個準則構建而成:從提綱到細節從經典到前沿從通用領域到特定領域專注於最先進的技術你將會發現很多近期發表但是確實值得一讀的論文。我們將持續不斷的給這條路線圖添加論文。