FATE1.0重磅發布:首個可視化聯邦學習產品與聯邦pipeline生產服務...

2020-11-27 IT168

作為全球首個聯邦學習工業級技術框架,FATE支持聯邦學習架構體系與各種機器學習算法的安全計算,實現了基於同態加密和多方計算(MPC)的安全計算協議,能夠幫助多個組織機構在符合數據安全和政府法規前提下,有效和協作地進行數據使用和聯合建模。

8月18日,FATE 1.0版本正式發布,重點推出了聯邦建模可視化工具FATABoard,以及聯邦學習建模pipeline調度和生命周期管理工具FATEFlow,並對FederatedML進行了重大升級。該項目已發布在github:https://github.com/webankfintech/fate。

FATEBoard:簡單高效,聯邦學習建模過程可視化

FATEBoard是聯邦學習建模的可視化工具,為終端用戶可視化和度量模型訓練的全過程,幫助用戶更簡單而高效地進行模型探索和模型理解。

FATEBoard由任務儀錶盤、任務可視化、任務管理與日誌管理等模塊組成,支持模型訓練過程全流程的跟蹤、統計和監控等,並為模型運行狀態、模型輸出、日誌追蹤等提供了豐富的可視化呈現。FATEBoard可大大增強聯邦建模的操作體驗,讓聯邦建模更易於理解與實施,有利於建模人員持續對模型探索與優化。

圖1 FATEBoard功能架構總覽

圖2 FATEBoard界面示意圖

FATEFlow:高性能聯邦學習pipeline生產服務

FATEFlow是聯邦學習建模Pipeline 調度和生命周期管理工具,為用戶構建端到端的聯邦學習pipeline生產服務。FATEFlow實現了pipeline的狀態管理及運行的協同調度,同時自動追蹤任務中產生的數據、模型、指標、日誌等便於建模人員分析。另外,FATEFlow還提供了聯邦機制下的模型一致性管理以及生產發布功能。

在FATE 0.3版本以前,啟動任務的模塊是由Workflow完成。在Workflow中,各算法組件的順序被完全固定,用戶只能選擇是否開啟某個模塊,無法按照需求調整組件順序,甚至多次調用同一個組件。每多開發一個組件,都要修改整體的Workflow,以適應新組件的添加。這種設計,使開發者在添加新組件時,修改部分過多,限制了整體系統的可擴展性。

而FATE 1.0新推出的FATEFlow良好解決了workflow中由於需要提前規定算法組建順序而造成的流程排版複雜問題,在調用模塊時不再存在大一統組件,每一次建模任務都能自定義算法流程。在FATE v1.0版本中,開發者自定義流程只要一個普通的json文件就可以實現,這使得開發者在添加新組件時,不用修改過多部分,極大程度地提升了整體系統的可擴展性。

FATEFlow提供了極為豐富的功能,主要包括:

DAG定義聯邦學習Pipeline

多方非對稱Pipeline DAG、通用json格式DAG DSL、DSL-Parser

聯邦任務協同調度

多方任務隊列管理、協同分發任務、任務一致性保證、多方狀態同步等

聯邦任務生命周期管理

多方啟停、狀態檢測等

聯邦模型管理

聯邦模型存取、聯邦模型一致性、版本管理、發布管理等

聯邦任務輸入輸出實時追蹤

數據、模型、自定義指標、日誌等實時記錄存儲

此外,FateFlow還提供了多種接口,方便用戶完整把握整個建模任務。包括:

上傳和下載數據功能,使得用戶可以方便地切換數據源;

狀態查詢功能,獲得每個組件的實時狀態;

下載功能,獲取每個組件的配置文件和中間結果,最大程度方便用戶調試。

在FATE 1.0版本中,用戶自定義流程得以進一步簡化,過程非常簡單,只需通過一個普通的json文件即可將算法全流程實現。

而配置運行DSL,也只需要三步:

module: 模型組件,FATE當前支持11個模型組件

Input:

•data: 數據輸入

•model: 模型輸入

•isometric_model: 異構模型,當前只用於Feature Selection

Output

•data: 數據輸出

•model: 模型輸出

通過以上配置,dsl-parser能自動對用戶設定的json文件,解析出完成的算法DAG圖,並將其通過FATEBoard展示出來,使得用戶可以清晰地看到整個算法流程的架構。

DAG圖示意

FederatedML:重大升級所有算法模塊運行機制

FederatedML支持FATEFlow以組件模塊化的方式構建任意模型,支持FATEBoard回調中間統計結果以可視化展示。另外,還增加和升級了多項重要功能:

優化算法模塊增加對Nesterov Momentum SGD 優化算法的支持,極大提升了聯邦學習算法的收斂速度;

多方安全協議增加對Affine Transform的加法同態加密算法的支持;

聯邦特徵分箱增加對稀疏輸入格式的支持;

升級評估指標以覆蓋大部分分類評估與回歸評估;

重構和升級算法參數類,實現算法參數定義和校驗一體化。

FATEServing:聯邦推理功能升級

在線聯邦推理中,FATE 1.0新增了在線聯邦建模pipeline的DSL解析器,允許用戶生成聯邦推理pipeline並進行聯邦推理。

總之,FATE 1.0版本為聯邦學習建模帶來更豐富更強大的功能,極大提升了聯邦建模體驗。微眾銀行AI團隊歡迎對聯邦學習有興趣的同仁一起貢獻代碼,提交 Issues 或者 Pull Requests。詳情可查閱 FATE項目貢獻指南:https://github.com/WeBankFinTech/FATE/blob/master/CONTRIBUTING.md

轉載請註明出處。

相關焦點

  • 聯邦學習 OR 遷移學習?No,我們需要聯邦遷移學習
    二、FTL 不同方法介紹2.1、 A Secure Federated Transfer Learning Framework本文提出了聯邦轉移學習(FTL)來解決現有聯邦學習方法的局限性,利用遷移學習為聯邦學習框架下的樣本和特徵空間提供解決方案。
  • 當傳統聯邦學習面臨異構性挑戰,不妨嘗試這些個性化聯邦學習算法
    1.1 方法介紹給定 n 個客戶機,經典聯邦學習表示為:其中,z^i 為第 i 個客戶機設備中的數據採樣。由於不同的客戶機設備之間存在異構性,所存儲的資料庫也不同,從不同設備中提取的樣本具有不同的期望值:聯邦學習的一次完整的更新過程由 T 個全局 epochs 組成。
  • 星雲Clustar主持聯邦學習工作組投票,正式標準預年中出臺
    近日,IEEE P3652.1(聯邦學習基礎架構與應用)標準工作組第五次(線上)會議順利召開。此次會議結束後,標準工作組宣布:聯邦學習IEEE標準草案已完成並通過標準工作組表決。星雲Clustar 作為標準工作組重要成員之一,參與了草案撰寫及投票環節。
  • 聯邦學習算法綜述
    聯邦學習算法綜述王健宗1,孔令煒1,黃章成1,陳霖捷1,劉懿1,何安珣1,肖京21. 平安科技(深圳)有限公司,廣東深圳 5180632. 中國平安保險(集團)股份有限公司,廣東深圳 518031摘要:近年來,聯邦學習作為解決數據孤島問題的技術被廣泛關注,已經開始被應用於金融、醫療健康以及智慧城市等領域。
  • 聯邦學習+風控,會是信貸業務的N95嗎?
    總的來說,這一做法是試圖通過聯邦數據網絡進行信貸風控增強,在貸前環節利用更豐富的數據信息綜合判斷客戶風險,幫助信貸公司過濾信貸黑名單或明顯沒有轉化的貸款客戶,進一步降低貸款審批流程後期的信審成本。在貸中,採用聯邦學習的解決方案主要提供根據用戶放款後的行為變化進行的風險評估產品,幫助放貸機構進行調額調價的輔助決策。
  • 從概念到技術,再到國際標準和開源社區,聯邦學習只用兩年時間
    在 IJCAI 大會期間同時還舉辦了「IEEE P3652.1(聯邦學習基礎架構與應用) 標準工作組第三次會議」,另外「AI 安全專題研討會」、「AI 與用戶隱私」圓桌會上微眾銀行也分享了聯邦學習的相關內容。
  • 富數科技安全計算首席專家卞陽:隱私計算江湖與聯邦學習的「上帝...
    比如說提供方1有個數,以加法為例,提供方把數切片,有幾個計算方就切成幾片。切完之後有一片留在自己手上,不發給別人,其他片分發。實際怎麼切片,也有很多方法,不是只有一個算法。現在先理解切成多片,每一方也會拿到其他方的切片,拿到以後就在本地做計算,比如說x1+y1+z1,這就是一個加法,加起來形成新的等式。
  • 7篇ICLR論文,遍覽聯邦學習最新研究進展
    具體算法如下:實驗分析本文基於經典聯邦學習的合成資料庫和非合成資料庫進行實驗,實驗中同時使用凸模型和非凸模型,在 TensorFlow 中實現所有代碼,以一個伺服器和 m 個設備模擬一個聯邦學習網絡。圖 1 給出了在每個數據集的 5 個隨機抽取的數據中平均的兩個目標(q = 0 和 q> 0 的調整值)的最終測試準確度分布。雖然平均測試準確度保持一致,但 q> 0 的目標能夠產生更集中(即更公平)的測試準確度分布,且方差較小。特別的,在保持大致相同的平均準確度的同時,q-FFL 將所有設備上的準確度方差平均降低了 45%。
  • NeurIPS 2019聯邦學習國際研討會引關注,聯邦學習技術應用再拓邊界
    2019年12月8日-14日,第33屆國際人工智慧頂級會議NeurIPS 2019(Thirty-third Conference on Neural Information Processing Systems)於加拿大溫哥華舉行,投稿論文數量(6743篇)、參會人數(1.3萬人)均創下歷史新高。
  • 聯邦學習:Tensorflow中的逐步實現
    在本教程中,我將實現聯邦學習(FL)的構建塊,並從頭開始對MNIST機器學習數據集進行訓練。介紹FL架構的基本形式包括一個位於中心的管理員或伺服器,負責協調訓練活動。客戶端主要是邊緣設備,可以達到數百萬的數量。這些設備在每次訓練迭代中至少與伺服器通信兩次。
  • 美國聯邦儲備委員會:維持0%至0.25%聯邦基金利率不變
    當地時間16日下午,北京時間今天(17日)凌晨,美國聯邦儲備委員會在結束為期兩天的例行貨幣政策會議後宣布,維持現有0%至0.25%聯邦基金利率不變,這一決定符合市場預期。美聯儲還發布最新一期經濟前景預期,預計今年美國經濟將萎縮3.7%,這比6月份時的預測有所調高,不過美聯儲下調了明年和後年美國經濟的增長預期。
  • 模型攻擊:魯棒性聯邦學習研究的最新進展
    圖 1 中給出了一種模型攻擊的過程,攻擊者控制聯邦學習框架中的一個或多個參與者 / 客戶端在後門數據上訓練一個模型,將訓練得到的結果模型提交給中央伺服器,平均後的聯合模型作為聯邦學習的最終全局模型。1.1 聯邦學習介紹聯邦學習通過將局部模型迭代聚合成一個聯合全局模型,將深度神經網絡的訓練分布在 n 個參與者之間。在每一輪 t 迭代過程中,中央伺服器隨機選擇 m 個參與者的子集 Sm,並向他們發送當前的聯合模型 G^t。
  • 聯邦學習:你可以有
    目前,推薦系統是消費領域最常見的機器學習算法之一[1]。以網絡新聞為例,由於每天都有大量的新聞文章發布在網上,在線新聞服務的用戶面臨著嚴重的信息過載。不同的用戶通常喜歡不同的新聞信息。因此,個性化新聞推薦技術被廣泛應用於用戶的個性化新聞展示和服務中。關於新聞的推薦算法 / 模型研究已經引起了學術界和產業界的廣泛關注。
  • 星雲Clustar和微眾銀行達成戰略合作,推動聯邦學習新發展
    據悉,此次星雲Clustar和微眾銀行雙方的合作主要圍繞人工智慧新技術「聯邦學習」展開,重點解決聯邦學習需要大量算力以進行加密數據計算的挑戰。技術研發上,星雲Clustar和微眾銀行雙方將在高性能異構計算、加速計算軟硬體開發、分布式高性能通信技術、分布式遠距離通信優化技術等進行深度研究和開發。
  • 留學海參崴——遠東聯邦大學
    在校生24000名大學生,500名研究生,大學生、研究生、博士生及其他形式學習的學生總數超過了41000人,擁有教師1598人,其中博士和副博士1058人,教職員工總數達到5000人。學校有24個學院、28個分校,380間教室,368間實驗室。
  • 想了解風頭正勁的聯邦學習?這篇400多個參考文獻綜述論文滿足你
    研究者將這兩種聯邦學習設置分別稱作「跨設備」(cross-device)和「cross-silo」。基於這些變體,本論文對聯邦學習給出了一個更寬泛的定義:聯邦學習是多個實體(客戶端)協作解決機器學習問題的機器學習設置,它在一個中央伺服器或服務提供商的協調下進行。
  • 關於禁止從緬甸聯邦進口偶蹄動物及其產品的規定
    中華人民共和國農業部令第7號ORDER OF THE MINISTRY OF AGRICULTURE OF THE PEOPLE'S REPUBLIC OF CHINA, No.7現發布《關於禁止從緬甸聯邦進口偶蹄動物及其產品的規定
  • 聯邦快遞在中國推「海關通關一體化清關服務」
    民航資源網2017年2月13日消息:上海,2017年2月13日——全球最具規模的速遞運輸公司之一聯邦快遞宣布正式在中國推出「海關通關一體化清關服務」,惠及全國24個城市,讓客戶享受到更便捷、快速且高效的通關體驗。
  • 留學海參崴——俄羅斯遠東聯邦大學
    在校生24000名大學生,500名研究生,大學生、研究生、博士生及其他形式學習的學生總數超過了41000人,擁有教師1598人,其中博士和副博士1058人,教職員工總數達到5000人。俄羅斯遠東聯邦大學設有9所專門學校,11所分校及4所國外機構,大型圖書館,保健站,學術委員會。
  • 騰訊天衍實驗室聯合微眾銀行研發醫療聯邦學習,讓腦卒中預測準確率...
    數據問題讓醫療AI成了「空中樓閣」,在這一難題下,騰訊天衍實驗室聯合微眾銀行聯合研發了醫療聯邦學習框架,成功地實現了在保護不同醫院數據隱私下的疾病預測模型,破解醫療行業數據安全與隱私保護難題。這是聯邦學習在醫療健康大數據領域應用的首個成功案例,為醫療大健康的各種潛在應用如分診診療、慢病防控、疾病早篩、醫保控費的落地等探索出了新的方向。