全文共2638字,預計學習時長5分鐘
圖片來源:https://www.pexels.com/@linkedin
計算機學習檢測 (儘管位置錯誤)
一個毫無放射學經驗的人怎麼才能教機器看x光片呢?事實上,我們可以創造出一臺善於發現缺陷的機器,其能力堪比放射科醫生。
哪張x光片顯示異常體徵?
目前,有團隊正在研製一種機器,它可以對x線掃描是否患有氣胸(即肺部塌陷)的x光片進行分類,然後識別圖像中塌陷區域。除了分辨出不同,還必須想辦法來顯示圖像中的不同區域。雖然圖像上可能顯示標籤,但機器沒有標記哪個區域是氣胸。
這無異於讓盲人教機器如何「觀察」圖像並通過看圖確定氣胸是否呈現陽性體徵。最重要的是,能藉助的工具是在兩個截然不同的編碼框架中運行,這讓人感覺像是在用兩種不同的方言交談。能奇蹟般地克服這種情況並將所構建的系統與可能用於拯救人類生命的系統結合起來。簡直不可思議。
嚴峻考驗
該問題分為兩部分:分類和分割。分類器的任務是根據標籤分類圖像(如x光片是否顯示患有氣胸症狀,即氣胸呈陽性或陰性),而分割的任務是通過將圖像分割為「幾部分」來識別圖像有問題的部分(例如,如果呈陽性,那麼機器會將陽性區域將圖像標出邊界以此來區別於其它部分)。本文將主要介紹分類工作。
因為是在不同的框架中編碼,所以必須創建個人分類器。在這個三人的研究團隊中,要比較各自的分類器,並選擇其中最準確的一個。其中一位參與者的工作是對x光片進行預處理。
作為替代,該團隊僅使用了基於Pytorch的fastai。fastai是一個適合初學者的庫,其簡化了加載圖像數據集的整個過程,人們可在深度學習模型上對其進行訓練,然後使用它來預測新圖像的標籤。關於該庫還有一個完整的在線課程,研究團隊根據其中第一節課製作了其第一個圖像分類器。
因此,由於沒有其他人詢問如何在Pytorch中實現此功能,所以只是重複了第一個項目的步驟。他們獲得了醫學影像信息學學會(SIIM)提供的圖像數據集,並與新加坡國家超級計算中心(NSCC)的GPU進行遠程連接。利用Python Excel操作知識來清理標籤文件。
使用這個數據集在Resnet-50上訓練模型。Resnet-50是一個模型/神經網絡,程式設計師之前輸入了數百萬張圖像,生成一系列「權重」。把權重想像成一組數字,這些數字則代表了模型中神經元之間的強度,幫助模型「觀察」圖像。直觀的感覺是,使用Resnet-50的權重比使用隨機選擇的權重要好,因為模型在「觀察」圖像方面已經做得更好了。這個過程叫做遷移學習。另一個比方是,這就像老師(預訓練模型)將知識傳遞給學生(針對特定問題的新模型)。
同一幅圖像有4種不同的尺寸。由於高質量的圖像更為清晰,有助於計算機「觀察」圖像,所以可從解析度最高的1024 x 1024像素圖像開始。這個過程花了一個半小時。
Fit one cycle policy 是一種加速學習的技術,但是要處理1024×1024的圖像仍然需要2個小時。
真實地把大約44,000張高清圖像輸入了電腦。但令人驚訝的是,在默認設置下,準確率為86%。由於GPU經常耗盡內存,最終不得不放棄這種方法。
只要6MB就能遠程摧毀一個外國政府的硬體
機器自學
令人驚訝的是,在一開始就達到了86%的準確率。這超出了預期,比很多程式設計師看x光片的能力好多了。但它是如何做到的呢?這裡並沒有給出任何解釋,只是說了哪些圖片顯示陽性,哪些不是,但它能夠在沒有標籤的驗證集上預測。機器是怎麼學習如何學習的呢?
根據經驗和觀察不斷概括總結是學習的基本特徵,機器在這方面做得越來越好。
看看這個模型是怎麼來的。機器「學習」的基本原理是不斷輸入示例供其進行總結學習。從示例中,它能夠找到一種模式,就像人類回憶過去一樣。這不是死記硬背,因為它能夠進行概括並應用於不可見的新數據。他們沒有編寫代碼明確地告訴它如何實現。它自己制定了一個規則。根據經驗和觀察不斷概括總結是學習的基本特徵,機器在這方面做得越來越好。那麼,怎麼在沒有放射學經驗的情況下,教一臺機器如何觀察呢?
接下來使用較小的圖像,512 X 512的圖像。與前一次相比,其速度之快令人驚訝:
模型幾乎達到了同樣的精度,且速度比之前快了十倍。真了不起。
但事實並非如此。與前一個版本相比,它可以在同一個樣本訓練周期更好地進行分類,且解析度幾乎只有前一個版本的一半。直覺錯了。也許模型不需要考慮那些使解析度更高的不必要的細節。若再做一次,或許可以得到更高的初始準確度。團隊花了最後幾個小時調整模型加以改進。
模型的最終版本。得到了89%的準確率但是卻不能保存這個版本。
最後,這一分類器準確率最高(緊隨其後的準確率為約71%),並結合分割模型完成了氣胸檢測器。這個模型既不是建立在複雜的預處理技術之上,也不是建立在優雅的算法之上。僅僅遵循一些簡單的技術,就能夠建立一個表現出色且準確度高的模型,著實令人驚訝。該模型仍有很多方面亟待改進。
加權梯度類激活映射( Grad-CAM ):模型「觀察」的位置。(中)區域越熱,模型對該區域的聚焦越高。注意:機器能忽略旁邊的標籤和箭頭。放射科醫生已證實氣胸在發熱區。(右)灰度圖像。
目前隨著人工智慧不斷改變著人們的工作方式,正規訓練和氣胸問題的存在反映出人工智慧應用的總體狀況。在此階段,人工智慧系統還有許多尚未開發的領域,人們正在挖掘其提高生活質量的潛力。單看氣胸問題,就會有人嘗試著開發出一種不需要放射科醫生參與的解決方案,就像自動駕駛汽車不需要司機一樣。這在缺乏放射科醫生的地方應用廣泛。同樣可將此技術應用到人力不足的特定工作領域。
然而,這又一次牽扯出許多問題,如勞動力減少、失業工人缺乏再培訓、使用人工智慧做出不道德的判斷,以及使用人工智慧系統針對那些長期存在社會和資本不平等的被剝奪權利的群體。有一天,普通人也許被迫以類似於處理貧困和政治問題的方式來應付人工智慧帶來的種種問題。網際網路重塑了大多數人與現實世界互動的方式,人工智慧主宰人類的生活,可能也只是時間問題。
這種情況說明課堂遠不足以讓人了解這個世界。僅僅有理論是遠遠不夠的,只要現實世界的變化伴隨著獨特的、隱藏的問題,其發生的速度快於課堂教學的變化,課堂教學必是望塵莫及。
你可以像這個團隊中的人一樣擁有足夠優秀的背景,但也只能在某些領域具有優勢。從收集信息到訓練模型,再到可視化,僅憑一個人之力很難完成這些步驟,往往需要領域內的專業人士的協助。
留言 點讚 關注
我們一起分享AI學習與發展的乾貨
編譯組:廖琴、翁夢徽
相關連結:
https://towardsdatascience.com/creating-a-radiologist-from-scratch-d776eb944399
如需轉載,請後臺留言,遵守轉載規範