微眾銀行開發的全球首個工業級聯邦學習開源框架 FATE 升級 v1.1...

2021-01-08 雷鋒網

雷鋒網(公眾號:雷鋒網) AI 開發者按:作為聯邦學習全球首個工業級開源框架,FATE 在近日發布的 v1.1 版本中,不僅上線了橫向聯邦學習通用算法框架,增加了DNN、回歸等多個聯邦算法,並開始支持多方縱向聯邦建模,支持spark引擎,支持FATEServing服務治理,支持secureboost在線預測等。

此外,FATE 還聯合 VMware 中國研發開放創新中心雲原生實驗室的團隊一起搞了個「大事」——支持在公有雲和私有雲中部署及使用,全容器化雲原生部署方案。

FATE 作為聯邦學習全球首個工業級開源框架,支持聯邦學習架構體系,為機器學習、深度學習、遷移學習提供了高性能聯邦學習機制,FATE 本身還支持多種多方安全計算協議,如同態加密、秘密共享、哈希散列等,具有友好的跨域交互信息管理方案。

在 10 月 31 日正式發布的 FATE v1.1 版本中,FATE 聯合 VMware 中國研發開放創新中心雲原生實驗室的團隊一起搞了個「大事」——發布了 KubeFATE 項目,通過把 FATE 的所有組件用容器的形式封裝,實現了使用 Docker Compose 或 Kubernetes(Helm Charts)來部署。

現代應用以 DevOps 方式開發,基於容器部署應用的優勢相當明顯,應用不僅可以無差別地運行在支持容器的平臺上,還可以按需靈活地實現多實例水平擴展。目前主流的雲平臺,如國外的 AWS,Azure,國內的阿里雲、騰訊雲等,都有基於容器和 Kubernetes 的雲原生服務,使得容器應用的部署和運行已經標準化和商品化。

換句話說,通過 KubeFATE 項目,開發者可以輕鬆地在公有雲或私有雲中部署和使用 FATE 項目。

該項目現已發布在GitHub:https://github.com/FederatedAI/KubeFATE 

另外,本次FATE v1.1版本在算法和功能基礎了進行重大升級和提升:

不僅上線了橫向聯邦學習通用算法框架,增加了DNN、回歸等多個聯邦算法,並開始支持多方縱向聯邦建模,支持spark引擎,支持FATEServing服務治理,支持secureboost在線預測等。

具體更新詳情如下文所示。

FederatedML:提供易擴展的橫向算法框架支持橫向算法開發

在新版本中,FATE使開發更加輕鬆,開發者可以更關注於算法具體本身,而將更多通用的通信傳輸內容交給框架。FATE v1.1提供易擴展的橫向聯邦學習通用算法框架,支持Secure Aggregation,通過封裝橫向聯邦學習的主要流程,開發者能夠簡單地實現橫向聯邦學習算法。

在算法方面,FATE新增了對橫向DNN、縱向線性回歸、縱向泊松回歸等聯邦算法的支持,以及更多算法支持多方聯邦建模,豐富了更多的建模場景,提升了FATE的實用性。

值得一提的是,線性回歸在預測連續標籤等應用場景上非常有力,而泊松回歸則能更好的協助開發者預測次數與頻率,如在購買保險和評估意外發生風險等場景裡,泊松回歸都能對頻率進行預測。

 此外,從這一版本開始,FATE也正式開始支持多方縱向聯邦建模,可以實現縱向場景下的多個數據提供方共同訓練聯邦模型。

最後,FATE也對連接Spark進行了嘗試,FATE v1.1支持已有Spark集群的開發者直接復用現有資源,可以選擇Spark作為計算引擎,根據實際情況靈活配置。

更多可前往GitHub了解:https://github.com/FederatedAI/FATE/tree/master/federatedml

FATEFlow:高性能聯邦學習Pipeline生產服務

FATEFlow是聯邦學習建模Pipeline 調度和生命周期管理工具,為用戶構建端到端的聯邦學習Pipeline生產服務。v1.1版本中,FATEFlow主要在穩定性及易用性上進行了提升,例如:

FATEBoard:簡單高效,聯邦學習建模過程可視化

FATEBoard是聯邦學習建模的可視化工具,為終端用戶可視化和度量模型訓練的全過程,幫助用戶更簡單而高效地進行模型探索和模型理解。新版本中,job工作流展示進一步優化,並支持組件數據與模型的輸入輸出埠分離,提供更直觀的數據傳輸與模型傳輸展示;

另外,現已支持模型訓練過程中的評估結果可視化,便於實時關注與跟蹤中間訓練過程和結果;更提供secureboost樹模型的可視化展示,不僅可以清晰地觀測模型中每顆決策樹,還能查看不同標籤下的樹模型。

FATEServing:服務治理,重啟自動恢復模型

在新版本中,模型加載成功後會在本地文件中保存,在重啟之後會從本地文件中恢復之前加載的模型。

此外,v1.1版本引入zookeeper作為註冊中心,提供了有限的服務治理功能,能夠動態的註冊grpc接口,在某些機器宕機的情況下,能夠自動的切換流量 。

KubeFATE:FATE部署能力升級

FATE v1.1版本提供打包好的Docker容器鏡像,大大降低FATE的使用門檻,避免開發者「倒在起跑線上」。如果是企業開發者,還可以發現離線部署FATE的能力也得到了提升,藉助 Harbor 開源容器鏡像倉庫,可以自動同步網上的鏡像,為運維減壓。

KubeFATE主要提供了Docker compose和Kubernetes(Helm Chart)兩種部署方式。

Docker-Compose可以將FATE的所有組件部署在單個節點中,並且支持多個合作方的部署。開發者無需編譯代碼,可使用Docker compose迅速搭建測試環境。當前Docker compose可將FATE部署在一個或多個節點中,有利於開發者對FATE功能的熟悉和了解。

Docker-Compose的單節點部署方式定位於測試。在生產環境中,往往需要多節點部署,此時採用Kubernetes的方式更佳。KubeFATE提供了Helm Charts來把FATE部署到Kubernetes方法,可在支持Kubernetes的雲上直接部署FATE,並且可以按照需求定製部署的細節,例如把計算模塊部署在有GPU的節點上等等。

Harbor是開源鏡像倉庫,提供鏡像的訪問控制、遠程同步、安全漏洞掃描等強大能力,國內的用戶絕大部分使用Harbor管理鏡像。KubeFATE項目將Harbor集成到其中,可提供本地鏡像管理能力,無需依賴Docker Hub等雲服務,大大提高了效率和安全性。此外,Harbor還能複製遠程的鏡像,可把鏡像在公有雲或數據中心之間雙向複製,遇到故障可自動恢復,從而簡化運維複雜度。 

總的來說,FATE v1.1版本增加了多個聯邦算法的支持,為聯邦學習建模帶來更豐富更強大的功能,同時聯合VMware推出KubeFATE,簡化FATE使用門檻,對初接觸開發者更為友好。團隊也歡迎對聯邦學習有興趣的同仁一起貢獻代碼,提交 Issues 或者 Pull Requests。

詳情可查閱 FATE官網項目貢獻者指南:https://fate.fedai.org/contribute/

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 微眾銀行首席AI官楊強:萬字圖文詳談聯邦學習最前沿
    >近期,微眾銀行首席人工智慧官、香港科技大學講席教授楊強做客雷鋒網AI金融評論公開課,以「聯邦學習前沿的研究與應用」為題,全面詳盡地講解了聯邦學習如何直面數據孤島和隱私保護的雙重挑戰。特別要說的是,在18年初的時候,我們在微眾銀行發現,用戶隱私的保護是讓眾多數據擁有方合作時的一個挑戰,如何在不同的銀行和機構之間聯合建模,同時保護數據隱私?我們就發展出了toB的聯邦學習。谷歌的相關研究團隊在一直是在安卓系統團隊下面,所以他們比較關心橫向聯邦學習。現在美國和歐洲是橫向比較多,在我們國內是縱向比較多。聯邦學習現在是雙頭發展。
  • 微眾銀行「夢見」區塊鏈
    你也許猜不到,這群技術狂人來自一家炒雞神秘的組織——微眾銀行。二、一個艱難的決定2015年5月1日,馬智濤從深圳回到香港陪家人。雖然是勞動節,但他心裡卻沒有半點假期的愜意。因為,他所在的微眾銀行,就要在幾天以後發布首款產品「微粒貸」。而他的崗位,正是微眾銀行的副行長兼首席信息官(CIO),要為整個銀行的技術保駕護航。
  • Quella_v1.3 版本發布,Java 開源後臺管理框架
    CMS系統的一些思想,將一些功能組件做成標籤引入,可以使開發者在進行二次開發的時候更快完成功能。簡介:Quella是基於SSM+shiro+redis開發的後臺腳手架,集成了一些後臺通用功能,併集成了一些常用的第三方服務。
  • 鬥魚微服務框架Jupiter開源後1個半月獲超1800個關注度
    36氪獲悉,鬥魚基於Go語言的微服務框架Jupiter開源後用1個半月時間收穫了超過1800個關注度,並且連續多日居於Github網站的golang熱門開源項目排行榜榜首。微服務框架Jupiter於6月1日正式開源,以此來解決行業存在的微服務生態不完善、維護成本高等問題,這也是鬥魚首個開源項目。
  • Go 語言極速 web 框架 IRIS V4.1.1 發布 - OSCHINA - 中文開源...
    Go 語言極速 web 框架 IRIS V4.1.1 發布了,更新如下:4.0.0 -> 4.1.1NEW FEATURE: Basic remote control through
  • sa-token v1.8.0 已經發布,輕量級權限認證框架
    sa-token v1.8.0 已經發布,這是一個輕量級權限認證框架。
  • 微眾銀行獲AI國際頂賽WIDER Face Challenge 2019賽道冠軍
    微眾銀行是該賽道唯一上榜且奪冠的金融機構,以0.2792的分數獲第一名,並且遠超第二名的0.1759和第三名的0.1619。微眾銀行在確保人臉引擎的高性能和高精度的前提下,通過引入「活體抗攻擊」技術,能夠抵禦包括「照片攻擊」、「視頻攻擊」、「面具攻擊」、「合成攻擊」等在內的一系列攻擊手段,大大提升人臉識別系統的安全性;同時,微眾銀行還引入「生成對抗學習」技術,大大提升模型的魯棒性,有效提升人臉識別系統抗攻擊能力。
  • 踐行普惠初心服務小微企業,微眾銀行微業貸邁向2021
    而在2018年以前,這些小微企業中超半數以上都沒有過任何銀行的企業貸款申請記錄。小微企業因自身缺少抵質押物、抗風險能力弱等原因,一直面臨著「融資難、融資貴」的問題。如何提升小微企業「首貸率」,成為了業界一直探討的話題。
  • MONAI成像框架快速投入生產,加速醫療健康領域的AI應用
    > 德國癌症研究中心、倫敦國王學院、麻省總醫院、NVIDIA、史丹福大學和範德堡大學採用MONAI開源AI成像框架。即將發布的NVIDIA Clara 應用框架現已投入生產,用於醫療健康和生命科學領域的AI應用。 MONAI於4月推出,現已被領先的醫療健康研究機構採用。它是一個基於PyTorch的框架,可通過行業特定的數據處理、高性能訓練工作流程、先進的可復現參考實現,使AI能夠用於醫療成像的開發。
  • HDwiki與PHPCMS聯合推出開源中文Wiki系統
    HDwiki與PHPCMS聯合推出開源中文Wiki系統 為了能夠更好的滿足用戶管理內容與分享知識的需求,有效的提升網站流量,增加用戶體驗,全球首款開源中文Wiki系統——HDwiki與國內領先的網站內容管理系統
  • 黑貓投訴四季度金融支付企業紅黑榜:微眾銀行首入黑榜
    金融虎訊 1月8日消息,今日,黑貓投訴發布四季度企業紅黑榜,包括「紅黑榜季度榜單」及「回復效率榜單」。榜單顯示,四季度,蛋殼公寓暴雷,微眾銀行作為其合作方,有效投訴激增至2000餘件。在金融、支付領域,黑榜企業包括:微眾銀行、急周轉、米樂錢包、今日必下、考拉超收、西瓜錢包、用錢俠、期待科技、借款大王、花不完。三季度,長租公寓暴雷跑路的新聞頻頻曝出,而曾經長租公寓龍頭企業——蛋殼公寓在四季度暴雷。微眾銀行作為蛋殼公寓的合作方,有效投訴激增。
  • Leaf 遊戲伺服器框架 1.1 發布
    Leaf 是一個由 Go 語言(golang)編寫的開發效率和執行效率並重的開源遊戲伺服器框架。其適用於各類遊戲伺服器的開發,包括 H5(HTML5)遊戲伺服器。
  • 【開源專訪】鄭曄談Moco框架的前世今生以及Java編程之道
    在今年7月份在上海舉辦的JavaOne 2013大會上,ThoughtWorks首席諮詢師鄭曄憑藉Moco框架獲得了首屆中國「Duke選擇獎」。該獎項已在全球範圍連續開展了十屆,旨在表彰Java領域內傑出技術項目及個人。Moco是為解決Java企業級開發中存在的集成問題而設計的一個搭建模擬伺服器程序庫/工具。
  • Calfbbs V2.0 正式發布,經典開源社區系統!
    經過8個月的努力,也經過了三個月的小範圍測試,今天calfbbs非常榮幸的宣布,Calfbbs V2.0發布。
  • t-io 3.5.9 發布,面向企業的百萬級開源網絡中臺
    前置說明1、t-io以前經常被拿來和netty作比較,一直以來t-io的側重點都和netty不一樣,t-io更偏向於服務應用,netty更像個網絡框架中的
  • 「OpenI/O 2020啟智開發者大會」共話開源 百度飛槳引領行業發展
    主論壇上,百度飛槳總架構師於佃海發表《飛槳:以技術創新和開源開放夯實產業智能化基座》主題演講,從技術創新與開源開放兩方面分享了飛槳在功能研發與生態建設領域的進展。當前,開源開放的深度學習技術引領了人工智慧熱潮,而深度學習開源框架正在成為 AI 技術研發和應用的核心基礎設施。百度飛槳是我國首個自主研發、開源開放、功能完備的產業級深度學習平臺,實現了最全面的開源開放。
  • 不變的初心,百度飛槳開源生態的堅持與堅守
    百度首席技術官王海峰在12月20日召開的「WAVE SUMMIT+2020」深度學習開發者峰會上演講時表示,「開源開放的精神內涵,已不僅是技術開發領域的協作機制,更是驅動技術創新和加速產業發展的核心動能」。被稱為AI時代作業系統和百度AI底座的開源深度學習平臺飛槳也帶來了八大全新發布與升級。
  • 開發者達265萬,超越Facebook,百度飛槳居中國學習市場份額第二
    近年來,深度學習開源平臺成為中國各行業快速部署AI的重要選擇。從2018年開始,IDC開始進行深度學習和機器學習平臺評價研究,以掌握行業趨勢,並為開源技術用戶提供參考和參考。在今年11月進行的IDC中國智能開發者調查中,70%以上的受訪者使用開源的深度學習框架直接培訓算法模型。
  • 2018 年度新增開源軟體排行榜之國產 TOP 50
    榜單根據 2018 年開源中國社區新收錄的開源項目的關注度、活躍度,以及所屬分類整理而來,相信在一定程度上反映了國內大部分開發者在 2018 年所使用的技術棧和希望學習的技術。可以看到,Java 相關框架一如既往地佔據了榜單的很大一部分,而隨著 AI 技術在近兩年的興起,也誕生了更多的人工智慧開源項目。