全新AutoML工具實現基因組全自動建模「寶藏技術」解讀生命天書

2020-12-05 同花順財經

自1990年人類基因組計劃(Human GenomeProject)的提出,迄今已過去30多年。作為生命的天書,基因從最底層蘊含了許多病症的秘密。從最輕微的傳染病到嚴重的癌症,都能從擁有超過30億個鹼基對的基因中找到答案。

隨著測序技術的發展,如今完成一個人全基因組測序已是普通家庭都可以負擔起費用的「平常」事,但是關於基因學組的研究卻仍處於起步階段。目前全世界科學家可以解讀的遺傳密碼不超過3%,還有97%的遺傳密碼猶如一座科學尚未突破的巨塔,而AI或許就是攀登這座巨塔的「寶藏技術」。

慧眼解讀「生命天書」

此前,由於基因組數據的複雜性,主流的基於圖像和文本的AI模型不能很好地對基因組數據進行建模。如果基因組能夠實現全自動AI建模,或許可以幫助科研人員解決數據處理難、解讀累的難題。但是由於基因組數據量之大,AI模型搭建是一項非常複雜的任務,開發門檻非常高。想要提高深度學習在基因組中應用的效果,開發者必須經驗豐富。

3月27日,華為開發者大會2020(Cloud)期間,華為雲發布了全新自動機器學習AutoML(Automated Machine Learning)工具AutoGenome,實現對基因組數據的全自動AI建模。

AutoML是2014來以來機器學習和深度學習領域最炙手可熱的方向之一。具體來說,AutoGenome採用了超參數自動搜索、神經網絡結構自動搜索和模型自動解釋器等最新的AutoML技術。同時,AutoGenome還提出了全新的更加適用於基因組數據建模的殘差全連接網絡結構(RFCN),在多項不同的基因組數據建模任務中,AutoGenome的準確性都超出傳統模型5個百分點以上。

在開發過程上,AutoGenome對於AI的初學者非常友好,用戶在華為雲ModelArts一站式AI開發管理平臺可以一鍵啟動Notebook開發環境,只需要五行代碼即可快速完成端到端的基因組數據建模、準確性評估和模型解釋。

AutoGenome Examples已經列入華為雲ModelArts Notebook任務中

此外,華為雲還聯合華為2012實驗室媒體院研發了Autosearch自動化搜索框架並預置在華為雲一站式AI開發管理平臺ModelArts中,可以集成更多的AutoML搜索算法,便於支持更多的基因建模能力。

大會期間,中科院基因組所韓大力教授也在現場分享了通過利用AutoGenome對羥甲基化組學數據進行建模,從而實現對肝癌的早期診斷。數據顯示,藉助AutoGenome的自動建模比文獻報導的同類工作準確率高出八個百分點。

在這個AI技術全面滲透的時代,華為雲推出的AutoGenome便成了一雙「慧眼」, 能夠有效地從數據中挖掘到有價值的信息,大大改變了基因組學的研究方式。 目前,AutoGenome已經正式上線,用戶可在華為雲ModelArts一站式AI開發管理平臺上免費使用。

「AI抗疫」之戰

當前正值新冠疫情在全球擴散態勢,國內疫情防控漸見曙光。在這場艱難的攻堅戰中,憑藉AI這把利劍,華為雲打出了「戰疫」組合拳。其中,AI輔助診斷、抗病毒藥物篩選AI模型表現搶眼。

CT作為新冠肺炎重要的診療決策依據手段之一,扮演著重要的角色。但是,由於患者肺內病灶多、變化快,短時間內需要多次複查、圖像多等情況,造成影像醫生工作負荷顯著增加,加上可精準診斷、量化分析新冠肺炎影像的醫生緊缺,診斷效率難以大幅提升。

新型冠狀病毒肺炎AI輔助醫學影像量化分析服務是由華為雲聯合華中科技大學、藍網科技等研發並推出。該服務基於華為雲領先的計算機視覺與醫學影像分析等AI技術,可全自動、快速、準確地為影像及臨床醫生提供CT量化結果,緩解精準診斷新冠肺炎影像醫生緊缺的局面及隔離防控壓力,減輕醫生診斷工作負荷。

通過大量新冠肺炎案例以及正常案例進行分析,結果顯示,華為雲AI量化輔助診斷服務實現病灶區域分割DICE(預測病灶和真實病灶的重合度)及AVD(預測病灶體積與真實病灶體積誤差)指標業界領先,與醫生用手工精準勾勒的結果高度一致。同時,基於華為昇騰AI系列晶片,該服務可以實現CT量化結果秒級輸出,相較於醫生手工勾畫ROI進行量化評估的傳統方式,極大地提升了診斷效率。

除了輔助診療方面發揮了積極作用,AI利用大數據和機器學習方法,在藥物篩選應用方面也大有作為。疫情初期,華中科技大學同濟醫學院基礎醫學院、西安交通大學第一附屬醫院、中科院北京基因組研究所、華中科技大學同濟醫學院附屬武漢兒童醫院、華為雲等組成的聯合科研團隊,針對新冠病毒的多個靶標蛋白,對8506種上市或者正在進行臨床試驗的藥物中進行超大規模計算機輔助藥物篩選工作,並篩選出五種可能對2019新型冠狀病毒(2019-nCoV)有效的抗病毒藥物。

此次大規模計算機輔助藥物篩選,完全基於華為雲EI醫療智能體平臺(EIHealth)進行。該平臺基於華為雲AI昇騰集群服務、ModelArts一站式AI開發與管理平臺的強大AI能力,集成了醫藥領域眾多算法、工具、AI模型和自動化流水線。得益於AI的助力,科研團隊能夠在短時間內完成上千億次的模擬計算,讓以往耗時數月的計算機輔助藥物篩選在數小時內完成。

結語

AI需要數據作為土壤,而醫療行業的數據豐富,且依賴於數據做決策,從這個意義上來說,AI 有望改變醫療行業的未來,而華為雲一直在積極踐行普惠AI的承諾。雲是現在,AI是未來,伴隨著5G時代的到來, 雲、AI、5G將會應用于越來越多的醫療行業場景。智慧時代,未來已來。

相關焦點

  • 基因組實現自動AI建模,華為雲助力科研人員探索生命奧秘
    在華為開發者大會2020(Cloud)期間,華為雲發布全新AutoML工具AutoGenome,支持對基因組數據進行全自動AI建模,助力科研人員探索生命奧秘。目前,AI技術已經廣泛應用在圖像、語音等領域,然而在生物醫學領域,尤其是基因組學數據領域,AI的應用仍處於初期階段。
  • 閱讀生命「天書」的技術
    閱讀生命「天書」的技術——聽華大基因創始人汪建講述基因科技光明日報記者 嚴聖禾  記者:在剛剛結束的2017深圳國際生物技術峰會上,學界和業界大咖們討論的生物技術和我們老百姓的生活有什麼關係
  • 蛋白質組研究:生命天書的新解碼?
    深科·淺說蛋白質組研究:生命天書的新解碼?前不久,《自然》雜誌在線發表了中國科學家在早期肝細胞癌蛋白質組研究領域取得的重大科研成果。這一研究測定了早期肝細胞癌的蛋白質組表達譜和磷酸化蛋白質組圖譜,發現了肝細胞癌精準治療的潛在新靶點——膽固醇酯化酶SOAT1。
  • 農科院基因組所開發出全新檢測基因編輯工具脫靶技術
    3月1日,中國農業科學院深圳農業基因組研究所動物基因組中心左二偉課題組與中科院神經科學研究所、中國科學院馬普計算生物學研究所、史丹福大學遺傳學系合作開發出一種全新的檢測基因編輯工具脫靶的技術。該技術是一種在精度、廣度和準確性上遠超越之前的基因編輯脫靶檢測技術,有望由此開發精度更高、安全性更大的新一代基因編輯工具,建立行業的新標準。相關研究成果在線發表在《科學(Science)》上。基因組編輯技術可對特定基因進行精準定點誘變,從而改變其調控的特定性狀,在保證全球糧食安全、人類健康方面有著巨大的應用潛力。
  • 基因組序列太深奧?用這套工具能讀懂
    原標題:基因組序列太深奧?用這套工具能讀懂 基因組測序工作完成後,哪些基因能翻譯蛋白、能翻譯哪些蛋白,一直是生命科學研究的熱點和難點。近日,中國科學院水生生物研究所葛峰學科組在這一問題上取得突破性進展,相關研究成果於近日在線發表於國際期刊《分子植物》上。
  • 重寫生命密碼的工具——解讀2020年諾貝爾化學獎成果
    重寫生命密碼的工具——解讀2020年諾貝爾化學獎成果張曉茹2020年諾貝爾化學獎7日授予兩名女科學家,以表彰她們在基因組編輯方法研究領域作出的貢獻。基因編輯技術可以斷開DNA鏈條,對其改動,然後重新連接,就像人們寫作時編輯文字那樣。由於對DNA鏈條有剪斷操作,因此這種技術被形象地稱為「基因剪刀」。基因編輯技術早在20世紀90年代就已出現,曾經非常耗時,甚至難以完成。利用CRISPR/Cas9基因編輯技術,可在幾周時間內改變生命的密碼——DNA。
  • 基因領域:最重要的是讀懂「天書」
    左手技術,右手資本,毫無疑問,基因科技已經成為生命科學領域最熱門的寵兒。從最近十幾年的發展來看,人類基因測序技術的發展已經超越了「摩爾定律」:上世紀啟動的「人類基因組計劃」項目計劃花費30億美元,用十三年時間完成一個人類全基因組的測序,繪製出人類基因組圖譜。
  • 量測序儀的問世,極大加速了人類對「生命天書」的破譯和解讀
    導讀「基因測序產業的上遊--測序設備及配套生物試劑的技術壁壘較高,目前基本被國外企業壟斷,國內市場依賴進口,核心技術受制於人。」國家衛計委臨床檢驗中心副主任李金明說。
  • 探究生命起源演化 解讀「密碼」改造自然
    而生命另一類基本分子,具有生理活性的蛋白質牛胰島素一級結構的解析,直接導致了我國科學家於60年代完成其全人工合成,即世界上首次人工合成蛋白質。在同一時代,DNA測序技術的建立,實現了人類「讀基因」的夢想;DNA重組技術的建立,實現了人類「寫基因」的夢想;再加上在基因定向突變與敲除基礎上的「編基因」夢想的實現,分子生物學及基因工程技術在上世紀80年代,將生命科學推向了歷史上第一次革命的頂峰。
  • 基因測序,破譯人體天書
    1953年,人類發現了DNA雙螺旋結構,翻開了記載著生命奧秘的人體天書的第一頁;50年後,中、美、日、德、法、英等6國科學家經過13年努力,共同繪製完成了人類基因組序列圖,實現了人類基因組計劃的所有目標,將這本人體天書完整地呈現在人類面前。
  • 科普 | 重寫生命密碼的工具——解讀2020年諾貝爾化學獎成果
    新華社北京10月7日電(記者張曉茹)2020年諾貝爾化學獎7日授予兩名女科學家,以表彰她們在基因組編輯方法研究領域作出的貢獻。這裡的基因組編輯方法,指的正是當下熱門的CRISPR/Cas9基因編輯技術。
  • 全新檢測基因編輯工具脫靶技術問世
    全新檢測基因編輯工具脫靶技術問世 2019-03-08 09:13> 2019年03月08日 09:13 來源:工人日報 參與互動    精度更高 安全性更好  全新檢測基因編輯工具脫靶技術問世
  • 《神秘海域4》失落寶藏DLC曝光 全新內容加入
    神秘海域4失落寶藏的DLC內容為玩家帶來了新地圖、新武器以及新的助力器,這次的更新光容量就有1.08G,再加上檔案就足足超過1.3G啦!失落寶藏「失落寶藏」是神秘海域4發售後的第1個追加內容,在這個DLC中收錄了1張地圖、以及全新遊玩道具和全新的角色外觀哦!
  • UML建模工具中的五大視圖
    本節和大家一起學習一下UML建模工具方面的知識,本節主要包括面向對象建模概念和UML中的五大視圖等內容,相信通過本節的介紹你對UML建模工具有一定的認識。下面讓我們一起來學習UML建模工具吧。
  • cuteSV——基因組結構變異檢測工具
    近年來,Oxford Nanopore Technologies等平臺開發的長讀長測序技術為準確檢測基因組SV提供了可能。隨著識別解析度的不斷提升,相比於短讀長測序,長讀長測序可檢測出多達兩倍的SV[2,3]。然而受限於SV檢測的準確度、靈敏度及測序成本等因素(目前,大多數SV檢測工具仍然高度依賴高深度的測序數據),在相關領域大範圍推廣SV檢測技術仍然面臨著巨大的挑戰。
  • 從「生命解碼」到「基因編輯」,「完美人類」會誕生嗎?
    在生命之初的胚胎階段,基因編輯技術的運用,能夠完善基因的表達和功能,減少先天性疾病、顯現優質性狀,甚至「完美人類」的誕生都有可能。一些先鋒科學家希望通過研究,在未來十年內合成一個完整的人類基因組。當然,涉及人類基因的研究必須經歷嚴格的倫理審視。基因編輯技術目前不能逾越紅線,用來製造「完美人類」。
  • 張鋒團隊今日再登《科學》,全新RNA編輯技術升級CRISPR工具包
    今日凌晨,《科學》雜誌發表麻省理工學院和哈佛大學 Broad 研究所張鋒團隊最新文章,他們開發的一種名為 RESCUE 的全新 CRISPR 基因編輯技術,可以進行以前不可能進行的 RNA 單鹼基編輯。
  • 提高建模效率,改變手工作坊式生產,AutoML的技術研究與應用進展...
    100+ 頂尖技術專家、1000+ 大數據從業者齊聚於此,以「大數據驅動智能+」為主題,聚焦智能時代大數據技術的發展曲線,圍繞大數據與社會各行業相結合的最新實踐,進行了深度解讀和討論。核心觀點:改變人工智慧建模依賴專家的手工作坊式生產,打造人工智慧建模的「數控工具機」,利用機器替代人工實現AI模型的構建,大幅提升AI建模效率,降低AI技術門檻,加速AI應用落地。眾所周知,機器學習與人工智慧技術目前已經成為國家重要發展戰略之一,各行各業都在積極向人工智慧轉型升級。
  • 基因測序「黑科技」:給生命來個完整的「數位化解讀」
    基因測序「黑科技」:給生命來個完整的「數位化解讀」 原標題:   「測序技術抓住了生命科學技術的龍頭,基因組測序成本從最初的3000萬美元下降到1000美元甚至更低,使得每個人都可能為自己進行基因組測序
  • 基因測序「黑科技」 給生命來完整「數位化解讀」
    視覺中國「測序技術抓住了生命科學技術的龍頭,基因組測序成本從最初的3000萬美元下降到1000美元甚至更低,使得每個人都可能為自己進行基因組測序,這將加速生命數位化的進程。」無疑,要實現生命數位化,需要的是把高山全部拍下來的完整的基因組測序。但目前的測序,即便是基因組測序,仍舊不能滿足生命數位化的需要。「目前無論是資料庫構建,還是群體研究、疾病研究,都是採用重測序的方式,是通過與參考基因組的比對獲得的,而不是從頭組裝。」