自1990年人類基因組計劃(Human GenomeProject)的提出,迄今已過去30多年。作為生命的天書,基因從最底層蘊含了許多病症的秘密。從最輕微的傳染病到嚴重的癌症,都能從擁有超過30億個鹼基對的基因中找到答案。
隨著測序技術的發展,如今完成一個人全基因組測序已是普通家庭都可以負擔起費用的「平常」事,但是關於基因學組的研究卻仍處於起步階段。目前全世界科學家可以解讀的遺傳密碼不超過3%,還有97%的遺傳密碼猶如一座科學尚未突破的巨塔,而AI或許就是攀登這座巨塔的「寶藏技術」。
慧眼解讀「生命天書」
此前,由於基因組數據的複雜性,主流的基於圖像和文本的AI模型不能很好地對基因組數據進行建模。如果基因組能夠實現全自動AI建模,或許可以幫助科研人員解決數據處理難、解讀累的難題。但是由於基因組數據量之大,AI模型搭建是一項非常複雜的任務,開發門檻非常高。想要提高深度學習在基因組中應用的效果,開發者必須經驗豐富。
3月27日,華為開發者大會2020(Cloud)期間,華為雲發布了全新自動機器學習AutoML(Automated Machine Learning)工具AutoGenome,實現對基因組數據的全自動AI建模。
AutoML是2014來以來機器學習和深度學習領域最炙手可熱的方向之一。具體來說,AutoGenome採用了超參數自動搜索、神經網絡結構自動搜索和模型自動解釋器等最新的AutoML技術。同時,AutoGenome還提出了全新的更加適用於基因組數據建模的殘差全連接網絡結構(RFCN),在多項不同的基因組數據建模任務中,AutoGenome的準確性都超出傳統模型5個百分點以上。
在開發過程上,AutoGenome對於AI的初學者非常友好,用戶在華為雲ModelArts一站式AI開發管理平臺可以一鍵啟動Notebook開發環境,只需要五行代碼即可快速完成端到端的基因組數據建模、準確性評估和模型解釋。
AutoGenome Examples已經列入華為雲ModelArts Notebook任務中
此外,華為雲還聯合華為2012實驗室媒體院研發了Autosearch自動化搜索框架並預置在華為雲一站式AI開發管理平臺ModelArts中,可以集成更多的AutoML搜索算法,便於支持更多的基因建模能力。
大會期間,中科院基因組所韓大力教授也在現場分享了通過利用AutoGenome對羥甲基化組學數據進行建模,從而實現對肝癌的早期診斷。數據顯示,藉助AutoGenome的自動建模比文獻報導的同類工作準確率高出八個百分點。
在這個AI技術全面滲透的時代,華為雲推出的AutoGenome便成了一雙「慧眼」, 能夠有效地從數據中挖掘到有價值的信息,大大改變了基因組學的研究方式。 目前,AutoGenome已經正式上線,用戶可在華為雲ModelArts一站式AI開發管理平臺上免費使用。
「AI抗疫」之戰
當前正值新冠疫情在全球擴散態勢,國內疫情防控漸見曙光。在這場艱難的攻堅戰中,憑藉AI這把利劍,華為雲打出了「戰疫」組合拳。其中,AI輔助診斷、抗病毒藥物篩選AI模型表現搶眼。
CT作為新冠肺炎重要的診療決策依據手段之一,扮演著重要的角色。但是,由於患者肺內病灶多、變化快,短時間內需要多次複查、圖像多等情況,造成影像醫生工作負荷顯著增加,加上可精準診斷、量化分析新冠肺炎影像的醫生緊缺,診斷效率難以大幅提升。
新型冠狀病毒肺炎AI輔助醫學影像量化分析服務是由華為雲聯合華中科技大學、藍網科技等研發並推出。該服務基於華為雲領先的計算機視覺與醫學影像分析等AI技術,可全自動、快速、準確地為影像及臨床醫生提供CT量化結果,緩解精準診斷新冠肺炎影像醫生緊缺的局面及隔離防控壓力,減輕醫生診斷工作負荷。
通過大量新冠肺炎案例以及正常案例進行分析,結果顯示,華為雲AI量化輔助診斷服務實現病灶區域分割DICE(預測病灶和真實病灶的重合度)及AVD(預測病灶體積與真實病灶體積誤差)指標業界領先,與醫生用手工精準勾勒的結果高度一致。同時,基於華為昇騰AI系列晶片,該服務可以實現CT量化結果秒級輸出,相較於醫生手工勾畫ROI進行量化評估的傳統方式,極大地提升了診斷效率。
除了輔助診療方面發揮了積極作用,AI利用大數據和機器學習方法,在藥物篩選應用方面也大有作為。疫情初期,華中科技大學同濟醫學院基礎醫學院、西安交通大學第一附屬醫院、中科院北京基因組研究所、華中科技大學同濟醫學院附屬武漢兒童醫院、華為雲等組成的聯合科研團隊,針對新冠病毒的多個靶標蛋白,對8506種上市或者正在進行臨床試驗的藥物中進行超大規模計算機輔助藥物篩選工作,並篩選出五種可能對2019新型冠狀病毒(2019-nCoV)有效的抗病毒藥物。
此次大規模計算機輔助藥物篩選,完全基於華為雲EI醫療智能體平臺(EIHealth)進行。該平臺基於華為雲AI昇騰集群服務、ModelArts一站式AI開發與管理平臺的強大AI能力,集成了醫藥領域眾多算法、工具、AI模型和自動化流水線。得益於AI的助力,科研團隊能夠在短時間內完成上千億次的模擬計算,讓以往耗時數月的計算機輔助藥物篩選在數小時內完成。
結語
AI需要數據作為土壤,而醫療行業的數據豐富,且依賴於數據做決策,從這個意義上來說,AI 有望改變醫療行業的未來,而華為雲一直在積極踐行普惠AI的承諾。雲是現在,AI是未來,伴隨著5G時代的到來, 雲、AI、5G將會應用于越來越多的醫療行業場景。智慧時代,未來已來。