京東數科首度公開聯邦學習戰略全布局,薄列峰詳解兩大算法突破

2020-12-14 雷鋒網

近日,雷鋒網《AI金融評論》聯合香港人工智慧與機器人學會(HKSAIR),邀請京東數字科技AI實驗室首席科學家薄列峰做客公開課,以《京東數科的聯邦學習戰略全布局》為題進行分享。

除了分享橫向和縱向聯邦學習以外,他也通過案例形式給出了京東數科對聯邦學習性能與安全性方面的研究成果,以及區塊鏈和聯邦學習的融合討論。

以下為薄列峰的課程分享全程回顧,雷鋒網AI金融評論做了不影響原意的編輯:

隨著網際網路發展,數據安全管理越發嚴格,對數據管理的關注也越來越全面化。怎麼在保護數據隱私的情況下,還能做一些好的機器學習模型,應用到各種各樣的問題?這就變得越來越重要,需要從集中式機器學習過渡到分布式機器學習。

而2006年開始掀起的深度學習熱潮,更把AI和機器學習模型對數據的需求推向了頂峰。

什麼是聯邦學習?就是在滿足數據隱私安全和監管要求的前提下,讓人工智慧系統更加高效準確地共同使用各自數據的機器學習框架。

應用方面,舉一個簡單的例子:各企業或機構大家都出不同的數據,相互進行模型學習,又不會看到對方的數據。數據還可能分布在不同的國家,各國數據監管政策有所不同,也可以把分布在各國數據高效利用、訓練模型,不存在數據上的交換。

兩個典型的聯邦學習算法,分別是橫向聯邦學習和縱向聯邦學習,橫軸表示特徵維度,豎軸表示用戶維度。

橫向聯邦學習,看兩方的數據和標籤,用戶重合度非常低,特徵重合度比較大。這裡顯示的是用戶無重合的極端情況,實際情況中它可能僅僅重合90%用戶特徵,5%用戶重合,到時進行對齊即可。

縱向聯邦學習,兩方用戶重合較多,可對用戶的部分對齊。A、B各擁有用戶一部分數據,可能都會有用戶的一部分標註,縱向聯邦學習也能去處理。

對計算機視覺、自然語言語音識別等領域而言,2006年深度學習(的出現)是非常大的推動。大家熟悉的語音識別、語音合成、人臉識別等應用,都是大量深度學習模型在背後發揮作用。

深度學習、梯度下降與橫向聯邦學習

三種典型深度學習

首先是深度神經網絡(Deep Neural Networks,DNN)在語音識別誤差上有30%的簡化,性能有非常大的提升。

後來是卷積神經網絡(Convolutional Neural Networks, CNN),它的訓練誤差相對於其他方法降低了十個百分點左右,在計算機視覺領域有著非常廣泛的應用。

遞歸神經網絡(Recursive Neural Networks,RNN)在自然語言處理領域是非常基礎性的工具。

優化神經網絡的典型方法:不管神經網絡有多複雜,大家實際上都能把它寫成一個f,一個輸入加一個參數。常用方法之一是隨機梯度下降。

大家都知道,優化最基本的是梯度下降,就是精確計算梯度,再對參數的方向和模型參數用梯度做下降。如果我的樣本量非常大,有100萬、1000萬,做梯度下降計算代價非常高。

實際運用中,我們可以隨機提出採樣。極端情況下,可以只採用一個樣本去估計梯度,比如包含50-100個樣本的小樣本集,它的梯度估計不準確,但計算代價非常低,這樣能有效優化神經網絡參數。

如圖,紅線是隨機梯度下降的結果,梯度估計不準所以路線較曲折。藍線是典型的梯度下降結果,估計比較精確所以不會拐彎的路線。但最終都會去到最優解。雖然紅色路線比較長,但它走每一步的代價明顯更低,相對於隨機梯度而言,整體效率還是更高。

這是典型的橫向聯邦學習框架。設置裡下面是客戶端(client1,2,3,……,t)。藍色雲是服務端(Server)。橫向聯邦學習的設置是數據的不同樣本存在不同用戶端,這實際上是對傳統分布式框架的改善。

首先每個客戶端訓練模型,產生參數w1、w2、w3……wt,參數傳到雲端,服務端對模型做平均,得到 w-。服務端做完模型平均之後,每個客戶端再下載模型w-,再對模型做幾輪梯度下降或優化,再將模型上傳到服務端,循環往復,形成這樣一個迭代的過程。

在這個過程中,客戶端的數據並沒有向服務端傳遞,傳遞的只是模型的參數w,保護了客戶端數據的隱私。

它與傳統分布式學習的不同之處在於,後者在此傳遞的是梯度;在聯邦學習裡,客戶端向服務端傳的是模型的參數。實際上現在也有證明表示,梯度信息其實也能洩露不少數據信息,而模型參數經過幾輪梯度下降後,對數據的保護會做得更好。

如圖,聯邦Average(FedAvg)和 聯邦SGD,前者實際使用代數明顯更少,就可以收斂,SGD需要的代數明顯更多。

在很多setting裡,在分布式學習裡,通信代價通常會是瓶頸,這個差異意味著FedAvg能有效降低這一代價,提升了訓練效率,同時也加強了對數據隱私的保護。

在這個設置下,實際上服務端還是知道我的模型參數的,有沒有可能進一步對我的模型參數加密和保護?其實不需要加密也有相當的安全性,但加密能對攻擊、對服務端、對可能的數據欺詐有更好的防護。

同態加密簡單來講,這是一個密碼學的算法,主要操作是生成公鑰和私鑰,加密算子,應用到明文,產生密文;用私鑰對密文解密,產生明文。同態加密的特點之一就是,兩個數m1和m2的和同態加密,等於m1的同態加密加m2的同臺加密;m和一個常數相乘的同態加密,等於對這個樣本同態加密,再乘以常數。

橫向聯盟學習+同態加密:和剛才的情況類似,傳遞參數過程中,可對w1……wt同態加密,然後在服務端對同態加密域做平均,以得到模型參數。

在這一設置下,服務端不知道私鑰,但客戶端知道。服務端實際上不能對w-解密,甚至連模型參數也不知道,它只知道同態加密域,但沒有私鑰就沒法解密。客戶端下載參數,用自己的私鑰解密,再更新自己的模型——因此同態加密也提升了數據安全性。

橫向聯邦學習之人臉識別應用:人臉識別有多場景的數據收集,比如打卡的門禁數據、多角度監控、證件類數據等。甚至還有一些海外業務,海外數據不能傳遞到國內,聯邦學習就能解決這個問題,有效提升在人證場景或配合式場景下的通過率。

Q:各方的特徵怎麼對齊?

在橫向聯邦學習,大家的特徵集是一樣的。舉個例子,a方和b方都是人臉數據,那麼模型取的就是人臉數據,可以規範化到一個圖像標準,比如說128×128的頭像,這樣輸入x就自然對齊了。

除了同態加密,另一個在橫向聯邦學習應用較多的是差分方法,思路是在分布式學習的時候傳遞梯度,同時對梯度加噪,以噪聲方式保證梯度安全性。

縱向聯邦學習

假設兩個公司各有數據的部分特徵,同時 b方擁有數據的標記,可以用一個安全的方法對齊數據ID,再做縱向聯邦學習。

這通常需要一個合作者Collaborator(有些方式可能不需要),AB兩方的數據交換都需要對它加密。此處設置為:合作者有公鑰和私鑰,兩個機構a和b,分別都只有公鑰,沒有私鑰,能通過加密保護自己的數據。

得到同態加密域的梯度之後,會對梯度加噪聲再送到合作者處,合作者會用自己的私鑰解密,然後把梯度還給它。在各方得到自己的梯度之後,可以進行梯度下降。

Q:若合作者方佔主導地位,是否有洩露風險?

這是實際操作中需要注意的問題,比如A方特徵佔10%,B方特徵佔90%,這塊你能寫出的方程數量明顯少於參數數量,理論上是推不出來的,但隨著不平衡性的增加,安全性也會下降。

縱向聯邦學習某種程度上,是有信息洩露的,但是從大方向說,它洩露的信息足夠少以至於別人推不出來主要的特徵。

線性回歸是一個典型的算法。在很多模型的應用中,當樣本量較大,線性回歸的性能或許不會很好。此處常用的方法之一是隨機森林(random forest)。

隨機森林Step 1:隨機森林會對原始特徵採樣(bootstrapped)。這個步驟是放回式採樣,比如說100個訓練樣本,它會每次放回,然後做採樣100個。完成採樣後,每個數的訓練樣本就不一樣了,都是原始訓練樣本衍生出來的。這樣主要是為了增加數的隨機性和多樣性,在樹的集成過程中會產生更好的效果。

Step 2:建每一棵樹時,在每個節點選擇一個特徵的一個隨機子集。舉個例子,這裡有30位特徵,建樹時隨機選擇五維的特徵;建每個節點時,隨機選的5個特徵都不一樣,再從中挑選最好的特徵,保了每個節點的多樣性。

建樹過程中,可以是深度優先,然後走到葉子節點,直到它滿足一個判據,完成樹的分支搭建,最後再逐個預測。

聯邦隨機森林大致思路是,主動方、被動方各一,主動方有標記,並加密標記和標記的平方,然後發送給被動方。此處三角號表示對yi、zi進行同態加密。

加密後,被動方根據自己每一維的特徵,當它的這維特徵被整個機制選中的時候,它會針對這個特徵做直方圖,然後用直方圖在同態加密域的yi和zi進行聚合。每一個直方圖會把它劃分成很多區間,在每個區間做平均,得到Y和Z。

簡單講,主動方傳同態加密後的y和zi是一個向量,該向量和樣本數一樣。被動方會對向量做聚合每次會選向量的一個子集,看哪個特徵落到區間上,再對傳遞過來的yi和zi平均進行同態加密域的求和運算。在隨機森林裡,既要選取特徵,也要選閾值,通過該閾值下的特徵得分算出y的矩陣,矩陣還給主動方。

此處主動方有公鑰和密鑰,被動方只有公鑰無密鑰,所以被動方無法解密y和z,它把Y和Z的矩陣傳給主動方,後者會依所得進行解密,再計算每個特徵和每個閾值的得分,擇其得分高者,如此即可完成隨機森林中一棵樹的某節點構建。重複該過程可構建不同的樹和整個隨機森林。

可以看到,主動方得到被動方的數據,實際只是得到聚合後自己發送的y和z,所以不知道被動方的特徵,也很難推導出;被動方只知道主動方同態加密運送來的y和z,並不知道更多的信息,整個過程可以保證安全。

何為快速安全的聯邦學習框架?

傳統縱向聯邦學習需要用同態加密進行保護,同態加密比較低效,我們是否能設計一個不依賴於同態加密的聯邦學習框架

設計快速安全的聯盟學習框架有如下特點:

第一,隱私能得到保護;

第二,利用樹狀通信結構,有效提升傳輸效率。利用不同的數聚合信息;

第三,新框架支持異步計算,能再次提升數據安全性。同時整個過程只涉及一些內積(此處不確定)計算,包括加噪後內積傳遞,所以該框架下不會用到同態加密,效率更高。

如圖,模型隱私在傳遞過程中,會傳遞參數和特徵的內積,再進行加噪保護,最終有數據結構的聚合。

整個框架的安全性如何?可以從理論上證明,這個算法能有效抵禦精確攻擊和近似推理攻擊。

看主要算法步驟,在第二步可以看到聚合的是內積+噪聲,以及聚合噪聲,然後返回到coordinator計算所有參數和所有內積再減去聚合的噪聲,得到決策值,不過此處並不得到模型參數,這也正是模型信息能被保護的原因。

coordinator在此只知道內積,不知道參數,所以它也無法推斷各參與方信息。

實現過程要確保通信的安全,數據在通信過程中不會被聯邦系統之外的攻擊者所獲取,也需要一個可信賴的第三方來進行調度。誰做coordinator?可以是監管機構,獨立第三方機構等。

原始數據主要通過兩項:1.任一通信節點接收到的均為加噪聲後的內積,由於樹狀結構的差異,隨機數又無法被移離,內積值因此得到保護。2.即使在串通的情況下,多個節點能移離隨機數,根據內積本身也只能構造出方程,也無法通過方程精確推斷所含變量。

有噪聲、有內積,方程數明顯少於變量數,樹機制……這些多重機制都能保證安全性。

剛才所講的邏輯回歸還是線性模型範疇,怎樣把線性模型推廣到非線性模型?這也是關鍵,推廣的非線性模型精度會大幅提升。

右邊算法概念大致是:先產生隨機特徵,生成隨機數,然後做cos生成隨機特徵;在隨機特徵域上,再做剛才提到的這種聯盟學習框架,來完成隨機特徵的參數學習。

隨機特徵這一步引入了非線性函數,它能很好逼近原始核函數。此處,各參與方會有一部分隨機特徵,特徵上的模型參數也保留在各方,不為他人所知。全程將通過噪聲、聚合等方式提升安全性。

隨機梯度下降法,是首次實現了快速安全的異步並行縱向聯邦隨機梯度算法,並理論上分析了其收斂率核問題的雙隨機梯度算法,則是首次實現了大規模、高速、安全的基於核方法的縱向聯邦學習。

測試性能結果對比如下。LIBSVM是很多同學在研究機器學習時常用的工具,PP-SVMV是一個隱私保護算法,FDSKL則是我們目前所設計的算法。可以看到訓練時間的對比。

PP-SVMV涉及核矩陣,因此在大樣本上操作非常慢。FDSKL收斂速度與DSG類似,後者沒有聯邦學習的設置。FDSKL幾乎達到了不在同態加密狀態下的訓練速度。

精度結果對比如下。FDSKL也接近了原始的不用聯邦學習的效果。

京東數科的最新工作也將在KDD發表。

區塊鏈聯邦學習

區塊鏈受到很大關注,數據上鏈有透明化、分布式、不能篡改等優勢,它是一種不依賴第三方,通過自身分布式節點,進行網絡數據存儲驗證傳遞和交流的技術方案。

區塊鏈的分布式、去中心化特點,和聯邦也有一些關係。實際上,聯邦學習在大型的多方參與項目中都有類似機制,也可以考慮採用去中心化。

最簡單的應用是,把聯邦學習和區塊鏈結合,建立在區塊鏈上的聯邦學習算法。我們也完成了二者更深層次的融合,包括共識機制等。

我們認為二者的結合在未來會有越來越多的應用。區塊鏈可以解決數的存儲,具有不可篡改性,聯邦學習能對數據隱私做表保護,其中有不少地方互補。

互動問答精選

問:聯邦學習可以不加入加密技術,不加密是不是也算對數據隱私保護?還是說得進行加密後,才算是各方進行隱私保護?

薄列峰:就像我剛才在橫向聯邦學習中提到的那樣,第一種算法實際上不加密,是用均值進行保護,整個過程中並沒有傳遞數據。

不同類型的聯邦學習算法,有不同方向的數據保護。現在的問題是,哪一種對信息的保護級別更高,效率更高?同態加密是一種方法;差分隱私基本上就是給梯度加噪。這方面,像我們剛才提到的方法,都是不用同態加密對數據保護的聯邦學習算法。

問:聯盟學習在京東有實際的落地場景和業務嗎?

薄列峰:有,其實聯邦學習就是在做多方機構的落地,比如人臉識別、營銷、風控等場景,京東數科都有案例。

問:聯邦學習和邊緣計算的區別是什麼?

薄列峰:邊緣計算講的是每個用戶端有自己的計算設施;聯邦學習講的是對數據隱私的保護,同時合作建模。大概念上還是非常不一樣。當然,在做這種分布式聯盟協議的時候,它也會用到各自的客戶端,有自己的計算設備,在這一點上它會和邊緣計算有一些結合點。

問:怎樣保護在客戶端的運算速度?

薄列峰:客戶端的運算速度,得靠其自身計算資源來進行保護。如果計算資源比較有限,通常它的數據也比較有限,參與更少的計算。如果數據比較多,它的計算資源也多,如果是多個機構合作,這都可以協調。

問:實驗中列出來的時間對比,是參與方與第三方之間通信,是內網還是外網?

薄列峰:我們在實驗比較時,沒有特別考慮網絡延遲因素,是相對理想情況下的比較。有網絡延遲的話,在計算的情況就會增加網絡延遲。網絡延遲針對每次具體的setting並不一樣,所以並不容易做標準化的比較。我們比較的是沒有網絡延遲的情況,具體有網絡延遲或者有各種情況,可能還是需要在具體設置裡做更好的處理。

問:每個客戶端上的特徵異構以及標籤異構如何理解?可以舉個例子嗎?

薄列峰:這個看是水平聯邦學習還是垂直聯邦學習。

在水平聯邦學習情況下,各個客戶端也有自己的標記。剛才我舉了個例子,比如說image net,每一個有1000類,每一類有1000個樣本,這樣你有100萬個樣本。假設有100個客戶端,然後每個客戶端有1萬個樣本,它有1萬個樣本標記,然後大家可以用橫向聯盟學習框架,可以有效地利用每個人手上的樣本來建模。最終,每個參與方建造的模型都用了別人的樣本,但是又不會去實際獲取別人的數據。

在縱向聯盟框架下,舉個例子,大機構和小機構做完用戶對齊,大機構作為主動方,小機構是被動方,各參與方都可以商討解決。

像橫向聯盟學習,在很多時候,參與方其實就是同一個公司的分布在不同的國家的情況,信任度實際上是有保證的。即使說不同的機構之間,大家也是有相互的信任度。如果完全沒有信任度,要去做這樣的聯邦學習,可能還是比較難的。參與方可能會對整個框架進行攻擊。它的安全性會變得更加複雜。所以,我們現在還是假設各參與方是honest,是相對比較協作的,在實際應用中是可以做很多協調的。

問:目前在聯邦學習研究遇到的瓶頸有哪些?是否有後續未來的規劃?

薄列峰:後續京東數科會在聯邦學習上做大量的投入,因為我們認為聯邦學習是整個人工智慧,包括整個機器學習的基石,它有潛力去改變所有的機器學習算法。

我們會做重點布局,研發越來越多的聯邦學習算法,來進一步提升聯盟學習在各個領域的落地,提升它的有效性和效率,包括和區塊鏈結合這種前沿方向。我們既會去提供一些可信度較高的軟體,同時也會去落地,考慮前沿的研究,帶動整個聯邦學習生態的建設。

問:是否可以動態變更合作機構的數量?

薄列峰:合作機構的數量,是可以變化的。在縱向聯盟學習裡,相對比較複雜。它不參與之後,可能有些東西需要重新開始。

但橫向聯盟學習,相對比較容易,因為大家都是擁有不同的樣本,假設有1000個參與方,兩三個不參與,那就少了千分之2,千分之3的樣本,並不影響整個聯盟學習的框架。橫向聯盟學習裡,也有一些機制,可以保證參與方突然不參與,還能完成這個模型的訓練。

問:聯邦學習可以用於表情識別嗎?

薄列峰:可以。舉個例子,不同機構之間有表情識別的不同數據,大家可以利用彼此的數據來增強模型,同時又不想把數據給到對方。表情識別更像是一個橫向聯盟學習問題,怎麼激勵大公司願意跟小公司之間共享信息。

我的個人理解,它還是商業利益的驅動問題,怎麼鼓勵這件事。如果現在聯邦學習的整個框架,只有一個小公司參與,大公司可能缺乏熱情,但是如果有1000個小公司參與,那麼這樣以小積多,有更越來越多的可供交換的數據,大公司參與的意願就會變強。

問:伺服器端,共享梯度和共享模型參數有什麼區別?

薄列峰:共享模型參數是做了幾輪梯度下降,針對共享梯度,它的一大優勢是通信代價會低;同時,對整個梯度信息的保護,也會更好。

關注「 AI金融評論 」,在對話框發送關鍵詞「聽課」進群,即可收看課程直播,和往期課程全部回放。

雷鋒網雷鋒網

相關焦點

  • 京東數科自研聯邦學習平臺Fedlearn正式亮相
    相較於傳統的數據共享交換方法,Fedlearn平臺創新性地提出了並行加密算法、異步計算框架、創新聯邦學習等技術架構,在保證數據安全的前提下提升學習效率,並逐步達到融合億級規模數據的能力。在京東數科開發Fedlearn平臺的過程中,實現了「基於核的非線性聯邦學習算法」。
  • 薄列峰:用全面AI能力助力實體經濟數位化轉型
    本場「數字農業」分論壇上,京東數科AI實驗室首席科學家薄列峰發表「用全面AI能力助力實體經濟數位化轉型」的主題演講,重點從人工智慧的研發技術角度介紹了如何提升實體經濟的生產力。2017年10月, 薄列峰博士出任京東數字科技集團AI實驗室首席科學家職位。
  • 封面故事|京東數科用人觀:理想、擔當排首位,專業能力是次要
    薄列峰 圖/京東數科提供 薄列峰打比方說,我們需要看到那個山頂(最終目的),同時也要能爬到那個山頂(爬到山頂的路徑)。程建波和團隊很早就引入人工智慧算法到風險管理領域,「AI雖然是個新技術,但跟風險的邏輯體系是一樣的,在離散、碎片、稀疏等不確定的信息海洋裡抽取規律,對風險進行洞察、預測和針對性管理,且在解決實際問題的過程中不斷學習改進,重新決策,這個過程周而復始。」
  • 研究|京東數科:子公司問題頻出拷問內部治理 京東白條催收不當涉嫌...
    而京東數科與競爭對手螞蟻集團的「較量」中,其專利數量及重要獎項「含金量」或落伍,「貓狗大戰」走向愈發撲朔迷離。一、兩大主營業務收入增速下滑,上半年再度陷入虧損近年來,京東數科自2018年扭虧為盈後,2020年上半年再次虧損。
  • 中信銀行與京東數科籤署戰略合作?協議
    來源:證券日報網本報記者 李冰近日,中信銀行與京東數字科技集團(簡稱「京東數科」)籤署戰略合作協議。而此次籤約,雙方將圍繞個人業務、公司業務、同業及資管業務、科技合作等幾大領域進一步深化交流,通過整合雙方優勢資源,探索金融科技在金融數位化轉型中的創新應用,以更好地服務於雙方的客戶。
  • 聯邦學習算法綜述
    關鍵詞:聯邦學習, 算法優化, 大數據, 數據隱私論文引用格式:王健宗,孔令煒,黃章成, 等. 聯邦學習算法綜述[J]. 大數據, 2020, 6(6): 64-82.WANG J Z, KONG L W, HUANG Z C, et al.
  • 京東數科打造「Mr.AI天團」,決勝未來還要靠技術硬實力
    身為京東數科首席數據科學家的鄭宇,有著與生俱來的領悟力和藝術天賦:跳國標達到競賽水平,繪畫和音樂也是興趣愛好……看起來和工作毫無關聯的特長,讓他擁有了難得的「感」和想像力。面對城市計算這個交叉學科,藝術與技術的搭建起一座橋梁,讓他放縱想像力去馳騁,總有想像不到的創意湧現。
  • 揭秘京東數科新牌局:科技、產業、to B
    隨即,京東數科在2013年12月推出了第一款供應鏈金融產品——京保貝,兩個月後,京東數科又推出了中國網際網路消費金融的開山之作「京東白條」;前者面向京東的供應商,後者面向消費者,迅速完成了供應鏈金融和消費金融兩大業務的布局。但這兩項業務的快速發展只是表象,業務之下,京東數科在這個階段耗費最大精力去做的事是建設底層能力,這才是「活下去」的壁壘。
  • 京東數科招賢納士 讓科技人才盡在腳下
    對於京東數科的管理制度,其實和大家想像的都大不相同,可能你會認為這樣的高科技人員都是那些上了年紀的成熟人員,事實上,他們確是一群熱血少年。京東數科副總裁曹鵬表示,他會以放手的方式管理,讓那些想徵服大海的少年可以從一個港口出發,而辦公室就是他們的港口,所以,在他們的辦公室裡,是充滿這熱情與激情的地方。
  • 「京東數科方案」亮相CSCMP2020中國大會
    「中國的大宗商品產業有可能成為下一個數字經濟和實體經濟深度融合的新藍海,由中儲股份和京東數科合資成立的中儲京科供應鏈管理有限公司(簡稱:中儲京科),致力於降低大宗商品行業的成本,提升行業的效率,推動市場模式數位化升級。
  • 資管轉型「行至深處」 京東數科打造資管科技開放生態布局
    在金融科技下半場,流量巨頭已經深入到了金融機構的數位化轉型中,圍繞資管機構全生命周期需求,京東數科打造了JT2智管有方,通過平臺化與定製化的綜合解決方案,締造下一代「阿拉丁」。以趕超阿拉丁為目標一直以來,阿拉丁被稱為貝萊德的「神燈」。
  • 京東數科喜獲廣漢農業農村局感謝信
    基於大數據+AI的農業作業系統在廣漢糧油產區快速落地,通過市場化的分析算法,讓廣漢好的產品走了出去!」 12月16日,京東數科收到了一封來自廣漢市農業農村局的感謝信。 這封沉甸甸的感謝信,是對京東數科打造的全國首個現代農業作業系統的充分肯定。
  • 拉動禽苗交易600多萬羽,京東數科喜獲廣漢市農業農村局感謝信
    基於大數據+AI的農業作業系統在廣漢糧油產區快速落地,通過市場化的分析算法,讓廣漢好的產品走了出去!」12月16日,京東數科收到了一封來自廣漢市農業農村局的感謝信。這封沉甸甸的感謝信,是對京東數科打造的全國首個現代農業作業系統的充分肯定。
  • 運維數智化時代——京東數科AIOps落地實踐(一)
    智能運維(ArtificialIntelligence for IT Operations,AIOps)通過引入大數據和人工智慧技術,從海量監控數據和複雜的IT軟硬體中學習和總結規律,自動、準確、快速地發現異常、定位故障和預測風險,提高企業IT系統可用性和運維效率,可以進一步處理自動化運維不能解決的問題。
  • 京東數科換將:李婭雲出任CEO,陳生強轉任副董事長
    12月21日,記者從京東數科了解到,經京東集團管理層提議,擬報京東數科董事會批准:任命京東數科CEO陳生強為京東數科副董事長及京東集團幕僚長,任命京東集團首席合規官李婭云為京東數科CEO。京東數科表示,出任京東數科副董事長及京東集團幕僚長,將有助於陳生強將更多精力聚焦前瞻發展和業務布局,憑藉其對行業的深刻理解和戰略洞察,在戰略規劃、產品打磨、技術升級上進一步構建數字科技業務的核心壁壘,協助京東集團劉強東從更高、更長遠的角度為京東數字科技超前謀劃、拓展未來。
  • 平安銀行與京東數科達成戰略合作,涵蓋大零售、企業金融、理財資管...
    每經記者 張卓青 每經編輯 廖丹 10月20日,平安銀行(000001,股吧)與京東數字科技集團(簡稱「京東數科」)在北京正式籤署戰略合作協議,雙方宣布將建立長期穩定的戰略合作關係,持續在大零售、企業金融、理財資管及金融市場、智能營銷運營、智能風控、金融數位化轉型等領域展開全面合作。
  • 卡位疫情後數位化風口 京東數科要做產業的「首席增長官」|十字財經
    京東數科「首席增長官」目標應運而生。早在2018年,京東金融升級數科之際,就已經 圍繞著幫實體產業做數位化的方向,此後兩年,京東數科的戰略路徑也更加清晰: 智能城市為抓手,深入到各個產業鏈條,對行業進行深度運營。AI技術和機器人、智能城市、數字營銷、金融科技四大板塊成為其核心市場。
  • 京東數科:子公司問題頻出拷問內部治理 京東白條催收不當涉嫌違規
    據聚投訴公開數據,截至2020年12月9日,通過聚投訴平臺,搜索關鍵詞「京東白條催收」顯示投訴帖539個,搜索關鍵詞「京東白條暴力催收」顯示投訴帖445個。  據黑貓投訴公開數據,截至2020年12月9日,通過黑貓投訴平臺,搜索關鍵詞「京東白條催收」顯示418條結果,搜索關鍵詞「京東白條暴力催收」顯示104條結果。
  • 獨家|京東數科正申請消費金融牌照
    有意思的是,這次京東數科內部的消費金融公司籌備組牽頭人是前中銀消費金融的總經理盧偉。2017年,盧偉離開中銀後成立了幾家公司,其中從事線下大額貸款助貸業務的深圳頂蓮普惠創新有限公司,2019年被京東數科併購。從種種跡象來看,京東數科今年大有征伐線下的決心。
  • SamtradeFX:京東數科新玩法落定
    SamtradeFX指出,到了2018年,品牌正式升級為京東數科,全行業內第一次提出了「數字科技」的定位。 通過數字科技的賽道切換以及模式的升級,京東數科在智能城市、數字營銷、數字農牧、零售、大宗商品、機器人等領域的布局已經逐一落地,藍圖已經畫出了一角,還有更多的領域需要開拓。 但是在現階段,京東數科已經開始引領數字經濟時代的產業數位化浪潮。