聯邦學習最新醫療場景發布:楊強團隊與劉琦團隊合作打破藥物數據...

2020-12-27 AI 科技評論

近日,國內AI場景應用再次取得重要成果。來自同濟大學生物信息系的劉琦教授課題組與微眾銀行楊強教授AI團隊合作,通過聯邦學習來進行本地藥物隱私數據的保障,以及模擬多個製藥機構(用戶)之間的藥物協同開發,助力製藥機構在保障自身藥物數據隱私安全的前提下進行協同藥物發現。

該成果已發表在生物信息學領域著名期刊《Bioinformatics》上,題為《FL-QSAR: a federated learning based QSAR prototype for collaborative drug discovery》,首次探索了應用聯邦學習進行協同藥物開發的可行性,並提出了一種基於聯邦學習的協同藥物定量構效原型系統FL-QSAR。

圖:聯邦學習流程圖

定量構效模型是藥物設計領域的經典模型,可用於對於藥物分子結構和分子活性之間關係的建模和預測。生命科學領域嘗試通過經典的加密計算手段來進行生物和藥物數據的共享和建模,然而隨著世界各國提出了一系列法律法規(如歐盟的GDPR,美國的CCPA)來保護數據的私密性和安全性,要求數據不能出本地或跨域,傳統數據共享方法將面臨新的法律法規的挑戰。

聯邦學習是近年提出的一種新的合法連結數據孤島進行數據共享計算的協作範式,由谷歌和楊強教授團隊分別在to C和to B場景率先提出。相比於傳統數據加密共享方法,聯邦學習基於數據可用不可見的理念,通過聚合所有用戶的加密模型參數,在數據不出本地的情況下進行模型協同訓練,能夠更好的面對數據共享領域出現的新的問題和法律法規約束。

聯邦學習在金融等領域已獲得廣泛關注,但是在藥物研發及生物計算領域尚未有所應用。製藥領域普遍對於數據不出本地進行共享有著強烈需求,迫切需要探索聯邦學習在該領域的應用。本次微眾銀行AI團隊和同濟大學的合作項目,是聯邦學習在藥物研發領域首次應用探索。

項目首次在藥物小分子領域探索使用聯邦學習範式進行藥物協同開發的可行性,結合微眾銀行的聯邦學習開源平臺FATE,開發了基於聯邦學習的協作藥物發現平臺FL-QSAR。研究團隊通過對於包含了15個藥靶的QSAR 基準數據來構建深度學習模型,進行QSAR建模以及多製藥機構(多用戶)環境下的協同藥物開發模擬,模擬結果證明:(1)多用戶通過FL-QSAR進行協同QSAR建模,將顯著優於單用戶僅使用其私有數據進行QSAR建模,(2)通過特定的模型優化,FL-QSAR可以在保護藥物小分子結構隱私的前提條件下,獲得與直接整合多用戶小分子數據進行QSAR建模相同或者類似的模型預測效果。

同濟大學與微眾銀行AI團隊在這項產學研協同中,嘗試去解決傳統藥物領域的上述「頑疾」——即不同的製藥機構之間可以通過數據共享來提高QSAR建模預測的準確率,然而該領域的智慧財產權和相關的經濟利益不利於製藥機構之間進行數據的直接共享和合作。通過在藥物小分子領域探索使用聯邦學習範式進行藥物協同開發的可行性,結合微眾銀行的聯邦學習開源平臺FATE, FL-QSAR可以在保護藥物小分子結構隱私的前提條件下,獲得與直接整合多用戶小分子數據進行QSAR建模相同或者類似的模型預測效果。

這是一種有效的藥物協同發現的解決方案,打破了傳統QSAR建模時不同製藥機構之間的數據無法直接共享的壁壘,有助於在隱私保護的前提條件下進行協同藥物發現,並適合於推廣和應用到生物醫學隱私計算的其他相關領域。該研究成果得到國家重大研究與發展計劃、國家自然科學基金項目、上海市自然科學基金項目、上海市人工智慧標準專項項目等基金的資助。

從全球來看,AI產業化進入深水區,近日谷歌AI團隊DeepMind所研究的AlphaFold 算法在生物學領域也取得了重要突破,在此算法下,可通過蛋白質的胺基酸序列高精度地確定其3D結構。AI與生物醫學的密切結合將推進人類健康事業的發展與探索進入新的階段,多位業界專家紛紛表態,稱「AI將改變生物學」,而聯邦學習等新技術的加入將從隱私保護等倫理道德層面為探索之路保駕護航。

論文詳情:https://academic.oup.com/bioinformatics/advance-article/doi/10.1093/bioinformatics/btaa1006/6026958

相關焦點

  • 微眾銀行發布世界第一本《聯邦學習》專著:大數據時代,效率和隱私...
    微眾銀行發布全球第一本《聯邦學習》專著聯邦學習是一種新興的人工智慧基礎技術,近兩年發展極為迅速,漸漸成為各行各業大數據合作與AI協作的「標配」,尤其是金融、醫療、智慧城市等對數據安全要求極高的強監管行業,對這一技術系統化的認知需求也愈發強烈。
  • 中國聯邦學習「五大流派」
    聯邦學習作為新一代人工智慧基礎技術,正在滲透到AI商用瓶頸的根源,通過解決數據隱私與數據孤島問題,重塑金融、醫療、城市安防等領域。近兩年,在楊強教授等世界級專家的聯合推動下,國內外諸多科技巨頭,均已開始搭建聯邦學習的研究與應用團隊。
  • 微眾銀行倡建大數據合作生態 聯邦學習為AI開通「綠色發展通道」
    聯邦學習:讓AI發展避開「暗礁」  眾所周知,大數據資源是現代人工智慧發展的重要基礎,在WAIC數據智能論壇上,楊強指出雖然AI的力量來自大數據,但法律、金融、醫療等大部分應用場景實際中經常面對的是散落的小數據,需要一種能夠有效地將數據孤島聚合起來的解決方案。
  • ...AI金融》系列課程之楊強:聯邦學習概述與四大應用場景
    5月22日,HKSAIR創會理事長、微眾銀行首席AI官、香港科技大學講席教授楊強老師,領銜HKSAIR《AI金融》系列線上講座第一課,主講聯邦學習及其四大應用場景。HKSAIR小編整理了課程演講稿,讀者可以配合直播回放觀看。
  • 大數據合作新方向 多機構聯合發布聯邦學習新版白皮書
    白皮書對聯邦學習技術及應用進行了系統化闡述,其1.0版本於2019年發布,此次發布的新版白皮書在場景應用等多方面進行了全面升級。在數據安全與隱私保護日益重要的當下,白皮書將對各行業企業和機構通過聯邦學習構建數據安全應用起到極大的指導意義。獲取白皮書可前往FedAI官網。過去幾年,AI、大數據等發展進入紅利期。
  • 楊強:應對對抗攻擊、結合AutoML,是聯邦學習接下來的研究重點 |...
    演講中,楊強教授介紹了聯邦學習的關鍵技術以及應用案例,並進一步介紹了最新開展的聯邦學習和遷移學習的結合研究以及接下來的重點研究方向。以下是楊強教授在大會的演講實錄,AI 科技評論進行了不修改原意的整理和編輯:今天非常高興跟大家在聯邦學習專場相見,也非常感謝CCF-GAIR、雷鋒網組織了這場會議。就像剛才主持人所說,聯邦學習現在在國內外已經變成「星星之火可以燎原」之勢,在學術界、工業界、政府層面都有很大的推動力和場景,這和我們在座同事們的努力也是分不開的。
  • 科研成果纍纍 平安科技聯邦學習技術團隊論文被EMNLP2020收錄
    近年來,平安科技聯邦學習技術團隊已取得多項頗具顯示度和開創性的科研成果,此次發布的這篇論文也是業界發表的在聯邦學習框架下實現NLP模型訓練的創新性研究成果,是繼聯邦學習團隊在咳嗽檢測COVID-19智能系統、Occam自動化機器學習平臺研發後獲得的又一個創新性的突破,再一次受到全球專家的認可。
  • NeurIPS 2019 | 微眾銀行首席人工智慧官楊強:聯邦學習針對推薦...
    在微眾銀行聯合谷歌、卡內基梅隆大學舉辦的聯邦學習國際研討會上,楊強教授以《Federated Recommendation》為主題,分享了微眾銀行首創的聯邦推薦技術的最新研究成果和應用落地。FATE:首個支持聯邦學習架構體系的工業級聯邦學習開源框架微眾銀行在「數據孤島」和「隱私保護」問題上,是業界的引領者,它提出的聯邦學習解決方案能夠讓多個機構同時協作,通過交換加密的模型參數進行綜合訓練持續優化模型,以合理合法的方式跨越數據鴻溝,解決「數據孤島」的問題。
  • 「羊吃草」論數據隱私保護難題?世界第一本聯邦學習專著問世
    這就是世界上第一本「聯邦學習」專著——《Federated Learning》(英文版)/《聯邦學習》(中文版),由微眾銀行首席人工智慧官楊強教授及人工智慧部劉洋、程勇、康焱、陳天健、於涵等多位人工智慧領域頂級專家歷時兩年,共同編撰而成。
  • 微眾銀行首席AI官楊強:萬字圖文詳談聯邦學習最前沿
    如果有一個新用戶過來,就可以通過Party A和Party B各自的參與,通過一個類似的流程來完成——這就是在縱向聯邦的前提下,特徵不重疊、樣本重疊,互相不知道對方樣本的前提下,也能夠建模。 總結:所謂橫向聯邦學習,按橫向來切割數據,更多的使用場景在於很多個終端和一個伺服器的聯邦學習。縱向聯邦學習,按特徵來切割數據。
  • 聯邦學習+推薦場景,微眾銀行首創業界聯邦推薦技術
    在微眾銀行聯合谷歌、卡內基梅隆大學舉辦的聯邦學習國際研討會上,楊強教授以《Federated Recommendation》為主題,分享了微眾銀行首創的聯邦推薦技術的最新研究成果和應用落地。圖:微眾銀行首席人工智慧官楊強教授發表演講推薦系統應用廣泛,已經滲透到人們生活各個方面,例如新聞推薦、視頻推薦、商品推薦等。
  • 香港人工智慧與機器人學會理事長楊強:「聯邦學習」將成AI主要方向之一
    今天走進浙報集團烏鎮峰會演播室的是香港人工智慧與機器人學會理事長楊強,他與記者暢聊了近期AI(人工智慧)在金融方面的新技術及應用。      楊強告訴記者,當下有一種新興AI技術——「聯邦學習」,通過該技術算法加密建造的模型,能夠在較高程度保持數據完整性的同時,保障數據隱私。楊強認為,該技術是人工智慧未來充滿希望的方向之一。
  • 聯邦學習誕生1000天的真實現狀丨萬字長文
    聯邦學習,無疑是當前最受工業界和學術界關注的人工智慧研究方向之一。近兩年,在楊強教授等世界級專家的聯合推動下,國內外多數科技巨頭,均已開始搭建聯邦學習的研究與應用團隊。(課程全文與視頻回顧,將在公眾號《AI金融評論》發布)今天,我們先來完整回顧下聯邦學習誕生三年來,從「自給自足」的To C模式,到企業之間互聯互通的To B模式,再到金融、醫療、安防等全場景應用的過程。聯邦學習的誕生:一個有趣的To C設想聯邦學習的概念,首次提出是在2017年的一篇Google AI Blog博文。
  • 《AI金融》系列課程回顧| 楊強:聯邦學習概述與四大應用場景
    我們這次的課程系列,與當前大家在工業界和學術界非常重視的一個議題相關,就是如何利用數據做人工智慧的模型,同時又能夠保護用戶的隱私,保護數據的安全。很多同學聽說過深度學習,聽說過監督學習,可能沒有聽說過聯邦學習。這個也是要給大家交代一下聯邦學習的由來。為什麼我在微眾銀行建立AI團隊?我在觀察金融的各個方面能不能用AI的模型給包裝起來。
  • 楊強領銜 6 位專家「拆解」聯邦學習,完整議程公布!
    演講主題:快速安全的聯邦學習框架演講摘要:聯邦學習是在滿足用戶隱私保護、數據安全和政府法規的要求下,能有效幫助多個機構進行數據使用和建模的機器學習框架。目前,聯邦學習在應用方面面臨著很大的挑戰—為了增加安全性,需要對梯度信息加密,但是也極大降低了算法的效率。如何設計既能保證安全性又具有高效率的聯邦學習框架是業界面臨的突出難題。
  • 課程報名 | 微眾銀行首席AI官楊強:為什麼需要聯邦學習?
    ,大數據紅利在左,數據隱私安全在右。誰能兼顧數據挖掘和隱私保護?聯邦學習。聯邦學習作為新興技術範式,得到了產學兩界的極大青睞。2020年4月8日,《聯邦學習白皮書V2.0》正式面世,由微眾銀行人工智慧部、電子商務與電子支付國家工程實驗室(中國銀聯)、鵬城實驗室、平安科技、騰訊研究院、中國信通院雲大所、招商金融科技等多家企業和機構聯手發布。
  • 平安科技聯邦學習技術成果入選EMNLP2020,業內聯邦學習NLP模型重磅發布
    平安聯邦學習技術團隊近來已發布多項頗具顯示度和開創性的科研成果,而這篇論文也是業界發表的在聯邦學習框架下實現NLP模型訓練的創新性研究成果,是繼聯邦學習團隊在咳嗽檢測COVID-19智能系統、Occam自動化機器學習平臺研發後獲得的又一個創新性的突破,再一次得到了全球專家的認可,同時也成功部署到蜂巢聯邦智能平臺計算引擎中,該項成果代表著團隊在聯邦學習和自然語言處理結合領域的技術領先地位
  • AI訓練遇隱私難題 聯邦學習這樣打通數據孤島
    數據可以說是人工智慧的燃料。但隨著AI落地各個應用場景,數據隱私洩露問題日益嚴重。數據的交流使用和數據的隱私保護似乎成為了不可調和的矛盾。  如何在不洩露各自數據隱私的情況下實現數據的共享和模型的共建,同時連通數據割裂的孤島是當前所面臨的問題。目前各機構正試圖利用聯邦學習打通人工智慧應用的最後一公裡,促進人工智慧落地。
  • 華為雲最新力作入選AAAI 2021:揭秘個性化聯邦學習框架
    人工智慧頂級會議 AAAI 2021 將於 2021 年 2 月 2 日 - 9 日線上召開,華為雲 AI 最新聯邦學習成果《Personalized Cross-Silo Federated Learning on Non-IID Data》成功入選。這篇論文首創自分組個性化聯邦學習框架。
  • 破解數據孤島壁壘,三篇論文詳細解讀聯邦學習
    楊強教授帶領微眾銀行 AI 團隊針對這類問題研究了「聯邦學習」(Federated Learning)的解決方案。在 2018 年 12 月的「新一代人工智慧院士高峰論壇」演講中,楊強教授也簡單介紹過聯邦學習的兩種模式:縱向聯邦學習,不同的資料庫中有部分數據特徵是相同的,A 方和 B 方都持有模型的一部分,通過同態加密技術傳遞重要的參數;第二種模式,橫向聯邦學習,在 A 方、B 方各自更新模型並上傳,雲端伺服器根據一定的策略統一更新他們的模型。