從概念到技術,再到國際標準和開源社區,聯邦學習只用兩年時間

2020-12-07 雷鋒網

雷鋒網AI科技評論按:8 月 16 日,第二十八屆國際聯合人工智慧大會(IJCAI 2019)在澳門成功閉幕。

本屆 IJCAI 正值 IJCAI50 周年,主辦方組織了一系列的主題活動。除了論文、Tutorial、Workshop、demo、展覽等常規環節之外,還舉辦了包括 IJCAI 50 周年紀念、AI in China、用戶數據隱私等極具特色的 panel 環節。而在這諸多內容中,「聯邦學習」無疑是最值得關注的內容之一。

在 8 月 12 日的 Workshop Day 中,由微眾銀行與 IBM 等機構舉辦的「首屆聯邦學習國際研討會」成為了當天最受歡迎的 Workshop,研討會尚未開始就已爆滿,還有不少參會者擠在門外旁聽,聽眾的熱情超出了主辦方的預期。

雷鋒網(公眾號:雷鋒網)了解,本次「首屆聯邦學習國際研討會」由微眾銀行、IBM Research 主辦,並得到了愛思唯爾、創新工場、松鼠 AI 的贊助和中國人工智慧開源軟體發展聯盟(AIOSS)及 IEEE 等機構的支持。

在 IJCAI 大會期間同時還舉辦了「IEEE P3652.1(聯邦學習基礎架構與應用) 標準工作組第三次會議」,另外「AI 安全專題研討會」、「AI 與用戶隱私」圓桌會上微眾銀行也分享了聯邦學習的相關內容。這恐怕也是自 2017 年聯邦學習概念提出以來,聯邦學習研究人員首次在人工智慧國際頂會上如此密集的發聲,以微眾銀行為代表的諸多企業的參與也標誌著聯邦學習已經逐步從基礎研究走向落地應用,而「首屆聯邦學習國際研討會」的召開則標誌了聯邦學習國際社區的正式成立,聯邦學習進入了一個新的階段。


聯邦學習為何成為備受產業界關注的熱點?

2006 年以來,隨著深度學習神經網絡的提出、算法改善和算力的提升、以及大數據的廣泛應用,人工智慧迎來了一波新的高峰。2016 年的「人機大戰」AlphaGo 戰勝圍棋世界冠軍李世石,不僅展示了以大數據驅動的人工智慧的巨大潛力,也讓人們更加期待一個人工智慧在各行各業中得以實現的新時代的到來。

然而理想很豐滿,現實很骨感——在實際應用中,大多數應用領域均存在數據有限且質量較差的問題,在某些專業性很強的細分領域(如醫療診斷)更是難以獲得足以支撐人工智慧技術實現的標註數據。同時在不同數據源之間存在難以打破的壁壘,「大數據」往往只是越來越多的「數據孤島」的總稱。

同時隨著大數據的發展,重視數據隱私和安全已經成為一種世界性的趨勢,而歐盟「數據隱私保護條例」(General Data Protection Regulation,GDPR)等一系列條例的出臺更是加劇了數據獲取的難度,這也給人工智慧的落地應用帶來了前所未有的挑戰。

「聯邦學習」(Federated Learning)就是為解決傳統機器學習方法所面臨的數據困境的一種新的嘗試。這是一種在保護數據隱私、滿足合法合規要求的前提下,多參與方或多計算結點之間開展高效率的機器學習的新型人工智慧基礎技術。聯邦學習具有以下特點:

  • 在聯邦學習的框架下,各參與者地位對等,能夠實現公平合作;

  • 數據保留在本地,避免數據洩露,滿足用戶隱私保護和數據安全的需求;

  • 能夠保證參與各方在保持獨立性的情況下,進行信息與模型參數的加密交換,並同時獲得成長;

  • 建模效果與傳統深度學習算法建模效果相差不大。尤其在聯邦遷移學習過程中可做到「無損失」,避免了遷移學習的負遷移;

  • 聯邦學習是一個「閉環」的學習機制。模型效果取決於數據提供方對自己和他人的貢獻,有助於激勵更多機構加入數據聯邦。

聯邦學習的上述特點對於打破數據孤島、推動人工智慧在更多的行業落地上有著重要的意義。為了給用戶提供更好的服務,在人工智慧應用中需要多方整合數據迫切性達到了一個前所未有的程度。

但如果在公司間無法交換數據,除了少數幾家擁有海量用戶、具備產品和服務優勢的「巨無霸」公司外,大多數企業難以以一種合理合法的方式跨越人工智慧落地的數據鴻溝,或者對於他們來說需要付出巨大的成本來解決這一問題。

聯邦學習正是在現有的機制和流程無法改變的情況下,希望通過技術手段建立一個虛擬的共有模型,從而達到好像大家把數據聚合在一起建立的最優模型一樣的效果。

值得一提的是,這種數據聚合併不是簡單地將各方數據進行合併,而是在各參與方自有數據不出本地、通過加密機制下的交換方式,從而在各參與方一端均建立起高質量的模型(例如說,企業 A 建立一個分類任務模型,企業 B 建立一個預測任務模型)。相比起各數據主體擁有私有數據「各自為政」的傳統方式,「聯邦」包含著將多方以平等的地位團結起來,有「君子和而不同」的意義。

關於「聯邦學習」的名字還有一個故事:在早期國內將「FederatedLearning」大多翻譯為「聯合學習」,現多稱為「聯邦學習」。其中的區別是,如果用戶是個人,確實是把他們的模型「聯合」起來學習;而如果用戶是企業、銀行、醫院等大數據擁有者,這種技術則更像是將諸多「城邦」結合起來,「聯邦」一詞則更為準確。這一名字的變化,也反映著聯邦學習的研究主體從理論轉向實際應用的變化趨勢。


聯邦學習的進化之路

2017 年,為解決安卓手機用戶個人終端設備上的模型(如輸入法預選詞的推薦模型)訓練引發的數據安全和大量數據傳輸問題,谷歌提出了一種新的數據聯合建模方案,使得用戶在使用安卓手機時在本地更新模型參數,並將參數上傳到雲上,從而使得具有相同特徵維度的數據方聯合建立模型。它能夠解決兩個數據集的樣本特徵重疊部分較大、樣本重疊部分較小的數據集分布情況。這種聯合建模方案被稱為橫向聯邦學習,也是最早的聯邦學習的方式。

聯邦學習的分類

針對不同的數據樣本類型,除了橫向聯邦學習,還有縱向聯邦學習和聯邦遷移學習兩種不同的方式。

前者用於解決樣本重疊部分較大,而樣本特徵重疊部分較小的數據集、需要縱向切分的情況,而針對數據集的樣本和樣本特徵重疊部分都比較小、或沒有重疊部分的情況。

香港科技大學講席教授、微眾銀行首席人工智慧官楊強教授帶領微眾銀行 AI 團隊將遷移學習和聯邦學習結合起來提出了聯邦遷移學習,不是通過對數據進行切分進行訓練,而是通過遷移學習進行訓練。

從業務場景上具體舉例來說,相同業務類型、不同區域的場景(如兩家不同地區的區域性銀行)適用橫向聯邦學習,同一區域、不同業務類型的場景(如深圳的一家銀行和超市)適合縱向聯邦學習,而區域和業務不同的機構(如一家美國超市和一家中國的銀行)則通過引入聯邦遷移學習來解決單邊數據規模和標籤樣本不足的問題。

由此也可見,微眾銀行 AI 團隊提出的聯邦遷移學習針對的情景更加具有普適性,也更符合未來大數據、多企業、跨行業的應用需求。

楊強教授領導下的微眾銀行AI團隊則是成為了中國乃至國際聯邦學習的主要推動者。

從 2018 年起,微眾銀行 AI 團隊不僅在 CCAI、AAAI、CCF 青年精英大會、IJCAI 等各類學術交流會議上多次交流聯邦學習成果,還與 CCF、IEEE 等專業組織多次舉辦研討會,與業界共探聯邦學習的創新突破;在近期發表的多篇論文中,微眾 AI 團隊介紹的聯邦學習思路下針對有安全需求的有監督學習、強化學習、決策樹的具體方法,包括安全的聯邦遷移學習、聯邦強化學習以及 SecureBoost 安全樹模型受到了研究者和業界的關注。

在技術落地上,微眾銀行還將聯邦學習應用於自身的信貸風控、客戶權益定價等多項金融業務流程;與此同時,微眾銀行還與鵬城實驗室、瑞士再保險、極視角等多家企業及機構籤署合作,將聯邦學習技術推廣應用於更多領域。

微眾銀行 AI 團隊還致力於推動聯邦學習的標準化。這也是一項技術走向成熟並逐步落地時的必要過程,聯邦學習要想真正實現落地應用,就必須建立一種企業之間的對話語言,並且是得到國際法律法規體系支持的對話語言。

去年 10 月份微眾銀行 AI 團隊向 IEEE 標準協會提交了關於建立聯邦學習標準的提案——「Guide forArchitectural Framework and Application of Federated Machine Learning」(聯邦學習基礎架構與應用標準),並於 2018 年 12 月獲批。

隨後在楊強教授的主導下成立了 IEEE P3652.1(聯邦學習基礎架構與應用) 標準工作組,工作組在今年 2 月和 6 月分別召開了第一次、第二次會議,分別梳理了各自領域內的聯邦學習典型案例,對聯邦學習標準的具體形式及內容進行了討論,對標準草案的制定提出了建設性意見。

在本次的 IJCAI 會議上,微眾銀行再次聯合 20 餘家國內外企業、單位共同舉辦了 IEEE P3652.1(聯邦學習基礎架構與應用) 標準工作組第三次會議,這次會議的主要內容是聚焦聯邦學習各項指標的評估如何量化、標準如何體現聯邦學習技術的合規性、聯邦學習應用案例的分類歸納等議題。

聯邦學習進入國際標準流程,其意義在於讓加入聯邦學習聯盟的企業能夠在同一個框架上對話,同時如果新的企業或機構想要加入聯邦學習,也必須按照這一標準的規定應用同樣的框架,這樣反過來又能夠推動聯邦學習生態的擴大,可以說是給整個聯邦學習的生態建設打下了一個基石,意義巨大。


走出金融場景,用開源平臺打造AI大數據生態

一直以來,金融行業是大數據與人工智慧落地最具潛力的行業之一。金融行業是數據密集型行業,金融數據具有更高的實時性、安全性和穩定性的要求,結構化數據佔比高,應用場景廣泛。但與此同時,金融行業還有賴於利用第三方數據來為客戶提供更好的服務,自身業務特點也對金融數據的數據安全和個人隱私保護帶來了極大的困難,數據孤島現象嚴重,這也是為何聯邦學習首先在微眾銀行這樣的創新金融企業落地和開花結果的原因。

但聯邦學習所適用的場景不僅僅是金融行業。在其他行業,數據孤島的問題也同樣普遍存在。如何利用聯邦學習的能力做到「學習如何學習」,在積累了很多領域的學習經驗後將遷移的例子做成訓練集,讓人工智慧來規劃如何在不同領域中實現遷移,對人工智慧的落地具有指導性的意義。而在此過程中,積累的領域越多,可獲得的訓練集(即不同領域間相互遷移的例子)將會呈指數型的增長,因此建立一個聯邦學習的生態系統至關重要。

基於此種思考,微眾銀行 AI 團隊發起了一個旨在開發和推廣安全和用戶隱私保護下的 AI 技術及其應用的項目「聯邦學習生態」(FedAI Ecosystem)。項目在確保數據安全及用戶隱私的前提下,建立基於聯邦學習的 AI 技術生態,使得各行業更充分發揮數據價值,推動垂直領域案例落地。

對技術推進的另一種方式是開源。

今年 6 月份微眾銀行開源了工業級聯邦學習技術框架 Federated AI Technology Enabler(簡稱 FATE)。之所以稱之為「工業級」,在於它能夠解決包括計算架構可並行、信息交互可審計、接口清晰可擴展在內的三個工業應用常見問題。

FATE 項目並不僅僅提供了一系列開箱即用的聯邦學習算法、比如 LR、GBDT、CNN 等等,更重要的是給開發者提供了實現聯邦學習算法和系統的範本,大部分傳統算法都可以經過一定改造適配到聯邦學習框架中來,通過項目開源,對相關機構進行 AI 賦能,提升機構自身的建模技術和能力,為工業界人員快速開發應用提供一種簡潔有效的解決方案,支持在多場景下的開拓和應用採用聯合共建、平臺服務等方式進行解決方案落地。

儘管聯邦學習為諸多之前人工智慧難以落地的應用場景提供了一個可行的思路,在具體的落地上,不同行業也還存在一系列不同的問題。如在「首屆聯邦學習國際研討會」現場,一位來自華為的技術人員對雷鋒網表示,他來參加這個研討會的目的是希望解決他在實際應用中相關技術的兩個困惑,一是在智慧城市的場景中,如何利用有標註的數據,通過聯邦學習幫助利用本地攝像頭無標註數據進行學習,二是在醫療場景中,在拉通兩個醫院的交換模型之前,是否可能初步預測交換得到的性能得到提升。在聯邦學習進一步推廣的路上,還需要更多的人加入生態的建設。

令人欣喜的是,本次研討會收到了很多來自各高校機構、企業的優秀論文,聯邦學習的社區在進一步壯大。同時在研討會第二天,微眾銀行再次升級了 FATE,推出首個可視化聯邦學習工具 FATEBoard,以及聯邦學習建模 pipeline 調度和生命周期管理工具 FATEFlow,並對 FederatedML 進行了重大升級,在算法上也有了更新。新版的 FATE 還加入可部分支持多方的功能,在後續版本中,微眾銀行 AI 團隊將會對支持多方功能做進一步的加強

IJCAI 上舉辦的首屆聯邦學習國際研討會是聯邦學習的一個重要時間節點。

在此之前,儘管關於聯邦學習有過許多論文、演講和新聞報導,但外界幾乎沒有一個能夠一窺全貌的機會,聯邦學習的研究者也極少能有機會匯聚一堂了解聯邦學習當前發展的全貌。IJCAI 上開展的首屆國際聯邦學習研討會,是聯邦學習社區的第一次集中發聲,也同時吸引了大量各界人士的關注。而在今年 12 月在溫哥華舉行的機器學習頂會 NeurIPS 上,微眾銀行也將再度舉辦聯邦學習研討會,向大眾分享更多聯邦學習方面的研究進展及實踐經驗。

展望

自從 2012 年的第三波人工智慧浪潮洶湧而來,在最初的新鮮勁褪去後,我們與人工智慧已遭遇「七年之癢」式的審美疲勞。

儘管人工智慧領域依然有持續性的進展,但在大眾的眼裡,人工智慧的承諾仍然大部分沒有實現。研究者已經意識到,在人工智慧領域的突破極度依賴標註數據,像 ImageNet 這樣的開放式高質量數據集已經成為創新的動力之源。

未來人工智慧的挑戰依然在數據方面:隨著網際網路、5G 技術的進步和廉價傳感器的更多應用,未來的數據將會呈現海量碎片化的趨勢,在訓練數據集上要求更低的技術,包括生成對抗網絡、強化學習、遷移學習與聯邦學習,將會成為研究者們寄予厚望的方向。

那麼,聯邦學習未來是否可期?

本次研討會爆滿的場面也是一個極強的信號,面向實際問題的人工智慧解決方案要能有效解決數據不足、割裂、小數據的數據困境,更一定要解決安全、合規、隱私保護的問題,並且還要能夠提高模型的效率。目前這樣一個 AI 技術時代,用戶隱私保護將成為社會的一個強約束,越來越多的人和企業開始意識到「數據孤島」的嚴重性以及數據共享的迫切性。聯邦學習能夠同時兼顧解決這兩個問題(隱私保護與共享),為我們建立一個跨企業、跨數據、跨領域的大數據 AI 生態提供了良好的技術支持,而連接更多行業和應用場景的聯邦學習生態系統,也將是聯邦學習得以脫穎而出的利器。

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • NeurIPS 2019聯邦學習國際研討會引關注,聯邦學習技術應用再拓邊界
    在近兩年數據監管越發嚴格的大環境下受到了國內外眾多機構的關注。此次研討會吸引了眾多學者參與聯邦學習生態的建設,共收到68篇論文投稿,33篇被接收,哈佛大學、耶魯大學、普林斯頓大學、康奈爾大學、麻省理工學院、卡耐基梅隆大學、清華大學、北京大學和香港科技大學等國際名校與研究機構以及谷歌、微軟、Facebook、華為、騰訊和微眾銀行等知名企業均榜上有名。
  • 兩位專家詳解TEE聯邦學習與開源向量...
    隨著人工智慧技術的興起,數據的質量和數量,已經成為了影響機器學習模型效果最重要的因素之一。然而數據在使用的過程中,也面臨著諸多問題,如數據的隱私問題和數據的不規則、不完整等問題。其中富數科技首席科學家陳立峰的講解主題為《基於TEE增強的聯邦學習與多方安全計算平臺解析》,Zilliz 數據工程師李晴的講解主題為《開源向量相似搜尋引擎Milvus的框架與應用》。數據的隱私問題一直是人們所關心的焦點問題。尤其是工業界來說,隨著對數據安全的重視和隱私保護法案的出臺,以前粗放式的數據共享受到挑戰,各個數據擁有者重新回到數據孤島的狀態。
  • 星雲Clustar主持聯邦學習工作組投票,正式標準預年中出臺
    2018年12月,由微眾銀行發起的關於聯邦學習架構和應用規範的標準P3652.1(Guide for Architectural Framework and Application of Federated Machine Learning)立項獲批,這是國際上首個針對人工智慧協同技術框架訂立標準的項目,其目的是為聯邦學習落地應用提供技術規範,為社會各界共建聯邦生態奠定合作依據。
  • 中國工程院高文院士:為什麼中國要打造自己的 AI 開源開放生態?
    本次大會以「平臺築基、標準張脈、開源賦能」為主題,邀請了來自百度、騰訊、華為、鵬城實驗室、小米、微眾銀行等公司的產業界專家,與高文院士、黃鐵軍教授等多位學術界領袖,圍繞「AI 開源基礎設施及環境」、「深度學習與強化學習」、「聯邦學習與開源數據湖」、「5G+AI+AVS 及全國 AI 大賽」、「AI 開源教育與治理」、「Open Source Community Leadship」六大主題坐而論道,共同探討人工智慧的邊界和方向
  • 雲+社區技術沙龍丨解析騰訊最新開源項目背後的技術棧
    12 月 21 日,由騰訊云云+社區和騰訊對外開源管理辦公室聯合主辦的技術沙龍在深圳騰訊大廈成功舉辦。Open JDK 是 Java SE 標準的免費和開源參考實現。2006 年,Sun 公司承諾逐步開源核心 Java 平臺。2007 年,Redhat 公司加入,並發布了 IcedTea。2010年,Oracle 收購 Sun 並接過了項目領導工作,IBM2、SAP 等廠商陸續加入。2014 年,JDK 8 發布,成為採納速度最快以及接受程度最高的版本。
  • 盤點微軟最應該開源的 15 款產品 - OSCHINA - 中文開源技術交流社區
    Media Player擁有不少Groove音樂播放器或電影和電視視頻播放器所缺乏的功能,比如皮膚和插件支持。如果微軟不想在為Media Player帶來更多的新功能,它可以將其交給開源社區打理。但考慮到MSN的即時信息要比Skype聊天穩定得多,微軟可以將前者的客戶端開源,而開源社區或許可以將其變成一個總是顯示你最新信息的工具。
  • 開源中國張海龍:國內開源力量分散,有代碼託管網站的需求
    這個對於技術人員來說非常重要的網站被牆,還引起青年導師李開復的極力呼籲讓其開放。可能名人效應,或者大眾力量,GitHub被牆幾天之後被重新開放。在GitHub被牆事件之後,雷鋒網(公眾號:雷鋒網)了解到國內有人在做類GitHub的代碼託管網站,他就是開源中國社區的張海龍。雷鋒網就此對他進行訪談,希望從一個開源社區創辦者的角度,解讀這個事情。
  • 聯邦學習+風控,會是信貸業務的N95嗎?
    怎樣在特殊時期為信貸業務保駕護航,這一問題也排在了各大風控技術團隊的任務清單榜首。牽一髮動全身,信貸風控雪上加霜一份關注小微企業的調研報告指出,有85%的企業,現金維持時間不超過三個月。「它的優勢在於數據安全及隱私保護。」微眾聯邦學習團隊給出了這樣的答案。「在建模過程中,雙方交換梯度值,類似於方向向量的概念,交換的是中間變量,不是原始數據。同時對這個中間變量還進行了同態加密,所以數據並不會出庫,保證數據源和應用方的數據安全。」
  • 星雲Clustar和微眾銀行達成戰略合作,推動聯邦學習新發展
    據悉,此次星雲Clustar和微眾銀行雙方的合作主要圍繞人工智慧新技術「聯邦學習」展開,重點解決聯邦學習需要大量算力以進行加密數據計算的挑戰。技術研發上,星雲Clustar和微眾銀行雙方將在高性能異構計算、加速計算軟硬體開發、分布式高性能通信技術、分布式遠距離通信優化技術等進行深度研究和開發。
  • Linux 基金會宣布新項目 KOSP - OSCHINA - 中文開源技術交流社區
    Linux 基金會宣布了一個新的項目 Kinetic Open Storage Project(KOSP),以推進雲對象存儲技術的開源軟體和標準。
  • 2020年成國內深度學習框架開源元年 曠視科技開源天元加速AI落地與...
    人工智慧時代,開源作為算法創新與迭代的重要驅動力,在深度學習領域發揮著至關重要的作用。全球諮詢機構IDC《中國深度學習平臺市場份額調研》指出,在AI技術使用方面,接受調研的企業和開發者中,86.2%選擇使用開源的深度學習框架。
  • 微眾銀行楊強教授:聯邦學習的最新發展及應用丨CCF-GAIR 2019
    大家好,今天很榮幸和大家分享聯邦學習的最新發展與應用。AI機器人助力金融我們首先來看下微眾銀行這兩年所做的努力和成就。微眾銀行的目標是建立起強大的AI能力,助力小微企業成長。不過需要注意的是這只是2C的例子,是雲端面對大用戶群的例子。這個技術比較新,翻譯成中文是我們首先翻譯成「聯邦學習」,大家可能聽到其他的翻譯,比如「聯合學習、聯盟學習、協作學習」,我們決定採取聯邦學習的譯法,是因為聽起來比較入耳,一次就能記住,所以希望以後大家都叫聯邦學習。現在科學進入新領域,一定要涉及到多個學科的融合才能解決社會問題,聯邦學習就是很好的例子。
  • 聯邦學習 OR 遷移學習?No,我們需要聯邦遷移學習
    機器之心分析師網絡作者:仵冀穎編輯:H4O在這篇文章中,作者通過 4 篇論文詳細介紹了聯邦學習中的聯邦遷移學習問題,並探討了向經典聯邦學習中引入遷移學習的目的和意義。海量訓練數據是現代機器學習算法、人工智慧技術在各個領域中應用獲得成功的重要條件。
  • 開源:數位技術擴散促進數位技術創新
    開源運動源於開源軟體,開源軟體是指開放原始碼的軟體,即代碼創作者在遵循相關開源協議的基礎上,將自己開發的軟體原始碼向全世界公開,允許其他開發者進行自主學習、測試、修改、二次開發和傳播等活動,以協同方式改善軟體產品的質量和優化軟體功能等。開源軟體在作業系統、資料庫、中間件等都有許多流行的軟體產品,如Linux電腦作業系統、安卓手機作業系統、MySQL和PostgreSQL開源資料庫等。
  • 從論文到測試:Facebook Detectron開源項目初探
    從RCNN到更快RCNN,再到最近的FPN和獲得ICCV Best Paper的面具RCNN,深度學習在物體檢測中以絕對優勢從眾多機器學習算法中脫引而出。大家對Facebook的計算機視覺研究項目的開源期盼已久,經過1年多的漫長等待,今天Facebook終於開源了Detectron,Detectron開源項目使用caffe2和python接口。實現了10多篇計算機視覺最新的成果。下面我們簡單介紹一下Detectron所實現的論文。並且對Detectron進行初次測試,我們會在隨後的博客中更新我們自己測試得到的Detectron訓練模型和速度標準。
  • 萬物皆可內卷,開源社區GitHub都有人刷數據了
    根據爆料顯示,其最近突然收到了CSDN(國內最知名的中文IT技術交流平臺)發來的紅包私信,紅包上寫著「你點Star,我送豪禮」,點入之後發現,這是某開源AI框架的推廣頁面,其中顯示,只要為該項目點擊star就能獲得5元紅包、紀念 T 恤、定製鍵盤託、技術書籍,以及算力卡等禮品。star、watch、fork是微軟旗下知名開源社區Github,為每一個項目所提供的功能。
  • 騰訊天衍實驗室聯合微眾銀行研發醫療聯邦學習,讓腦卒中預測準確率...
    在這個問題下,聯邦學習成了一劑「良方」。聯邦學習是一種新興的人工智慧機器學習框架,其設計目標是在保障大數據交換時的信息安全、保護終端數據和個人數據隱私、保證合規的前提下,在多參與方或多計算結點之間開展高效率的機器學習。聯邦學習作為分布式的機器學習範式,可以有效解決數據孤島問題,讓參與方在不共享數據的基礎上聯合建模,能從技術上打破數據孤島,實現AI協作。
  • 第七屆開源作業系統年度技術會議(OS2ATC)盛大開幕,從編譯器到軟體...
    主論壇、內核技術、編程技術、全棧作業系統應用生態、虛擬化技術、架構及晶片技術六大論壇火熱進行。現場火爆,座無虛席。以下為精彩演講瞬間,你絕不可錯過~主論壇 7 大報告,從編譯器到軟體定義衛星!演講者——何徵宇:螞蟻金服研究員,系統部負責人議題:金融級系統軟體的實踐及開源協作金融系統是最封閉的,為什麼要講開源?因為金融是一個非常注重科技、追求極致及技術先進性的行業,這背後面臨著海量數據壓力下的服務連續性保障和資損風險監控等挑戰,螞蟻金服在過去十五年的發展就是從可用到可靠,再到可信,以金融為場景、開源為基石。
  • 英特爾:在開源生態系統各個層次展開合作
    最後介紹一下,英特爾在開源社區的貢獻和創新。    (PPT)我們從圖的左邊可以看到,對一個典型的企業級應用各個層次非常清楚,相對應的,在右邊我們也可以看到Linux在伺服器一些市場份額佔到30%,MySQL下載量也超過了千萬,從Web伺服器的角度來講,開源軟體優勢更加明顯,大概有70%的份額,從開發工具角度來講,我們可以看到,有超過2300萬是PHP的開發工具。
  • 從星際2深度學習環境到神經機器翻譯,上手機器學習這些開源項目必...
    另外,雷鋒網 AI 研習社在原文的基礎上補充了部分開源項目,為 AI 開發者提供更加詳細的 AI 項目和資源。機器學習是用數據來學習、概括、預測的研究。近幾年,隨著數據的開發、算法的改進以及硬體計算能力的提升,機器學習技術得以快速發展,不斷延伸至新的領域。