來源:新華網
近日,京東數字科技集團(簡稱:京東數科)正式推出自主研發的聯邦學習平臺——Fedlearn,旨在更好地挖掘數據價值,實現多方共贏的機器學習,在滿足數據隱私安全和監管要求的前提下,讓人工智慧系統更加高效準確地共同使用各自數據的機器學習框架。
Fedlearn平臺該平臺具有三大特點。第一,在數據和模型隱私方面,不同參與方之間沒有直接交換本地數據和模型參數,而是交換更新參數所需的中間數值。同時,為了避免從這些中間數值中恢復數據信息,採用增加擾動對這些數值進行保護,確保了數據和模型的隱私安全。其次,在通訊方面,引入中心化數據交換的概念,使得數據的交換獨立於參與方。最後,採用異步計算框架,極大地提高了模型訓練的速度。
融合了密碼學、機器學習、區塊鏈等聯邦學習算法的Fedlearn平臺,搭建出一套安全、智能、高效的連結平臺,在各機構數據不用向外傳輸的前提下,通過聯合多方機構數據,實現共同構建模型等多方數據聯合使用場景,獲得加成效應。相較於傳統的數據共享交換方法,Fedlearn平臺創新性地提出了並行加密算法、異步計算框架、創新聯邦學習等技術架構,在保證數據安全的前提下提升學習效率,並逐步達到融合億級規模數據的能力。
在京東數科開發Fedlearn平臺的過程中,實現了「基於核的非線性聯邦學習算法」。在安全性上,這一方法不傳輸原始樣本及梯度信息,充分保護數據隱私;在快速性方面,這一方法使用首創的雙隨機梯度下降,大大提高計算速度,充分利用計算資源,通過增加擾動提高數據的安全保護。這一技術創新已經形成了論文《解決多方垂直聯邦學習的安全核學習算法》(Federated Doubly Stochastic Kernel Learning for Vertically Partitioned Data)。
京東數科風險管理中心智能模型部負責人彭南博表示,「在京東數科風控『聯邦模盒』產品業務實踐中,著實取得較於傳統聯合建模更優的效果」。究其原因,一方面,聯邦學習理論上是能夠獲得最優解的,即通過梯度下降迭代過程,可以實現聯邦間的特徵組合和交叉建模,從而解決如「異或」這樣的非線性問題;另一方面,由於能夠保護數據隱私安全,因此無需限制建模樣本的數量,使聯邦學習可以使用更多數據建模,基於大數據更有效發現數據規律,進而提升模型效果。
目前京東數科金條、白條業務模型已經全面實現了傳統建模向聯邦建模的升級,聯邦模式下模型的風險識別能力和流量轉化率均得到了提升。除了在風控方面的應用,AI+智能城市領域,京東數科自研的聯邦學習平臺——Fedlearn平臺也有廣泛應用。
除此之外,京東數科依託在金融服務、數字營銷等領域積累的豐富實踐經驗,形成了多場景的解決方案,通過聯邦學習可以實現多場景的解決方案升級,結合各個客戶的自身情況,提供定製化程度更高的服務。目前,已實現多個不同類型的合作項目落地。
從底層代碼到算法再到平臺搭建,京東數科始終堅持自主研究創新,一路穩紮穩打。「我們希望依託數科強大的AI技術背景,通過Fedlearn平臺的科技能力輸出助力用戶和產業實現『聯結』,為各種規模企業實現賦能和增長,這也是我們作為聯邦學習應用落地領軍者的使命」,薄列峰表示。