用 AI 做眼底疾病篩查的企業不在少數,廣州河谷互動醫療科技有限公司(以下簡稱河谷互動)並非最耀眼的那一家。但它已經在這條路上走了很遠。
河谷互動的 AI 眼科診斷系統 Healgoo AI 已經應用到了基層的眼底疾病篩查當中,給患者帶來了實實在在的幫助。
今年7月21日,河谷互動就攜 Healgoo AI 產品在廣州市海珠區松鶴養老院開展了一次免費的眼病篩查活動。只要通過一臺眼底相機,對左右眼球分別拍照之後,數據就會自動傳入河谷 AI 眼科診斷系統,進行分析,並迅速生成一份書面的眼疾診斷報告,供眼科醫生參考使用,整個過程僅需幾分鐘。
從遠程閱片到 AI 閱片
河谷互動 CTO 孟巍介紹,河谷互動成立於 2013 年 9 月份。當時他們就已經洞察到了眼底疾病篩查的巨大市場,於是開發了一個叫做 Eye Grader 的遠程醫療雲平臺。
篩查點和基層醫院的醫生拍攝好眼底照片後,可以通過 Eye Grader 平臺把照片上傳到雲端,交由三甲醫院的醫生人工閱片。篩查出的患者還可以通過平臺轉診到專業的眼科醫院進行治療。
據孟巍介紹,目前全國已經有400多家醫院在使用這一平臺,輻射範圍涵蓋了西藏以外的全國所有省份。甚至香港、印度和澳大利亞等地區也有部分醫院在使用 Eye Grader 平臺。中華健康快車基金會、中國防盲基金會、遠程視界集團、中山眼科中心、澳大利亞眼科研究中心的糖網篩查項目也都是在 Eye Grader 平臺上展開的。
得益於此,河谷互動早期積累下了大量的眼底照片數據,為之後轉向 AI 閱片奠定了基礎。
孟巍認為,數據集、算法、人才和硬體是研究 AI 的四大要素,其中數據集最為重要。他說道:「我們作為 AI 應用型企業,主要目標並非發明新的網絡和算法。大家採用的都是比較常規的算法,本質上大同小異,因此主要比拼的是數據集。我們的優勢就在於擁有大量的數據。」
孟巍表示,Eye Grader 是一個人工閱片平臺,平臺上的眼底照片都是經過兩名通過 NHS 考試認證的專業閱片人員共同審閱後給出報告的。因此河谷互動的數據標註質量非常高,準確度甚至超過了 Kaggle 比賽的數據集。
據了解,河谷互動按疾病的嚴重程度把眼底照片劃分成了五個等級,數量平均分布,隨機選擇了 20 萬張用於模型訓練。另外還準備了 7 萬張用於模型測試。
從特徵識別到卷積神經網絡
2014 年 Eye Grader 平臺逐漸壯大,有限的閱片師已經無法從容應對如此龐大的閱片量,河谷互動開始嘗試用人工智慧技術提升閱片效率。
當時深度學習的大火還沒有燃起,河谷互動選擇了從基於特徵識別的機器學習算法開始著手研究。特徵識別算法需要先識別視盤、視杯、出血、滲出等病灶,測量並計算相關參數與標準進行比對,然後根據病灶的面積和個數等定義疾病的嚴重層級。
經過一段時間的探索和研究,河谷互動發現這種算法的魯棒性不強。對於某些眼底照片它的識別效果非常好,但對於另一些眼底照片,它的識別準確率卻難以達到應用水準。
孟巍向雷鋒網介紹道,特徵識別算法主要有以下幾點缺陷:
一、對病灶的識別不夠準確。比如容易漏掉出血點,或者把血管的一部分誤認為出血點,從而導致對疾病嚴重程度的判斷出現偏差。二、系統存在「木桶效應」。以糖網篩查為例,糖網篩查不僅要看出血點還要觀察滲出,需要用到兩個不同的模型,最後綜合兩個模型的輸出得出結論。結論的準確性往往取決於效果最差的模型。三、系統存在「依賴性」。比如計算出血點的面積前,要先將血管提取出來並摳除。如果前一步計算出現偏差,勢必會影響到接下來的結果。四、有些疾病無法按嚴格數學標準來定義。就拿白內障來說,白內障在眼底照片上的呈現是照片的模糊程度,這很難用數學模型來定義。
「綜合考量之後,我們認為特徵識別算法有很大的局限性。剛好當時 Kaggle 的比賽出來了,我們和史丹福大學研發實驗室的團隊商量一起參賽,最後用深度學習算法取得了 Leaderboard 前十五名的成績。比賽結束後,我們又基於Eye Grader 平臺的數據集,結合比賽中的調參經驗對算法進行了優化。現在我們的算法已經有了極大的提升,糖網識別準確率達到了 96.7%。」孟巍對雷鋒網說道。
據孟巍介紹,目前大多數做眼底篩查產品的 AI 企業採用的仍是特徵識別算法,只不過其中有些採用的是傳統的機器學習算法,有些則是基於特徵識別的深度學習算法。特徵識別算法本質上是把眼底照片分割成了很多部分,然後尋找相應的特徵值與標準進行對照。卷積神經網絡則把眼底照片作為一個整體。
他說道:「我們無需告訴它照片中有哪些特徵點,只要讓它知道每一張照片對應的結果是陰性還是陽性,它就能通過學習大量數據摸索出具體的規律。」
但算法在「黑箱」狀態下搗鼓出來的規律到底靠不靠譜呢?河谷互動也很好奇。因此他們讓算法在對照片進行分析後,把它認為對診斷結果有影響的地方標註出來,形成一個熱力圖。熱力圖顯示,算法的判斷依據和眼科醫生是一致的。
此外,河谷互動還邀請了各種年資的住院醫師、主治醫師和主任醫師,在相同數據集下和人工智慧進行比試。結果顯示,河谷互動的眼底篩查 AI 在糖網識別方面已經超過了主治醫師,接近主任醫師水平;在青光眼和老年黃斑性變方面甚至超過了主任醫師。據孟巍向雷鋒網介紹,基於該測試結果河谷互動已經向國際期刊 Ophthalmology 提交了論文,目前正在等待 Review。
從雲端到離線
河谷互動的產品目前已經能夠勝任糖網、青光眼、老年黃斑變性和白內障四種眼底疾病的篩查,針對每種疾病都有一個獨立的模型。此外,河谷互動還專門訓練了一個圖像質量判斷模型,確保眼底照片的質量。
儘管如此,在孟巍看來,「AI 取代專業醫生」的說法還是不太靠譜。他指出,河谷互動首先要解決的是三類場景下的眼底疾病初步診斷問題:
一、基層社區和邊遠鄉村的眼底篩查。二、很多基層醫院只有五官科,沒有專業的眼科,五官科醫生對眼科疾病的了解有限,人工智慧可以幫助他們進行初步的診斷,判斷是否需要將病人轉診到專業的眼科。三、糖尿病患者平時在內分泌科進行控糖管理,人工智慧可以幫助不具備閱片能力的內分泌科醫生初步判斷病人的眼底病變情況。
產品實際應用過程中,河谷互動遇到了一些挑戰。首先,很多社區和鄉村的網絡條件很差,基於雲端的人工智慧篩查產品沒有用武之地。其次,醫院保護病人數據安全的意識很強,對把眼底照片上傳到雲端心存顧慮。
因此河谷互動在雲端版本 Healgoo AI 之外,還花費大量精力優化算法,專門開發了能在筆記本電腦上運行的離線版眼底疾病篩查系統。
孟巍表示:「雲端版本更容易實現,而且成本低,不用添置新的設備,開通帳號即可使用,計算速度也更快。但由於網絡環境欠佳,雲端版本在基層篩查場景中並不靠譜。我們的離線版系統在市價 5000 左右的筆記本電腦上就能運行。未來我們還將進一步優化算法,降低其對硬體的要求,提高系統的經濟性和便攜性。」
據了解,河谷互動的離線版眼底疾病篩查系統在拍攝完照片 1-2 秒內即可給出結果,結果中除了對疾病進行分級,還會給出相應的信心指數。如果自信度比較高,那麼基本就能確診;如果自信度只有50%左右,則說明結果仍有待商榷。
從產品到商品
對於企業來說,做好產品只是第一步;如何找到一套成熟可行的商業模式,將產品轉化成商品並實現盈利,才是企業生存的根本。這是當前很多 AI 醫療企業所面臨的困境。
河谷互動市場經理宋鐮坦言,AI 醫療產品的市場推廣確非易事,不過相對其他企業河谷互動有其獨到的優勢——已經覆蓋了400多家醫院的 Eye Grader 遠程醫療雲平臺。
他表示,河谷互動計劃將 Eye Grader 平臺和眼底篩查 AI 打通。這樣一來,就能和眼底相機廠商合作(河谷互動的 AI 為眼底相機廠商的產品提供附加值,相機廠商則為河谷互動提供銷售渠道)將眼底篩查 AI 推廣到醫院和基層的篩查點。通過 AI 篩查出病人之後,再將其眼底照片上傳到 Eye Grader 平臺由大醫院的醫生進行確診,並根據患者的病情嚴重程度在醫聯體內部實現分級轉診。」
在醫聯體建設中,除了行為上的協同,數據層面的對接也很重要。由於各個醫院採用的系統不同,設備廠商五花八面,數據的標準化和互聯互通一直是醫聯體建設的一大難題。宋鐮表示,未來河谷互動還可以為各級醫院提供一個數據採集系統。該系統可以和各個醫院的眼科檢查設備對接,從而實現真正的數據標準化和互聯互通。
宋鐮認為,用人工智慧產品直接幫助醫療機構做慢病管理,對醫療行業的貢獻有限。藉助人工智慧推動醫聯體建設或許更有價值,這也是河谷互動正在努力奮鬥的目標。