中新網1月7日電 近日,國際人工智慧領域頂級學術會議AAAI 2021(第35屆AAAI)論文收錄結果出爐。在國內AI陣營前列的京東數科以高達16篇論文的入選量成為本屆AAAI的一大黑馬。其研究方向包含了聯邦學習、對抗學習、深度學習、序列推薦、社交推薦、圖神經網絡、風險管理的反因果推斷,以及智能城市領域的時空AI等尖端技術領域。
在AAAI今年整體錄取率僅為21%的激烈競爭中,京東數科的高入選量極為難得。一系列研發成果的集中爆發,也充分顯示了京東數科在以AI驅動產業數位化的實踐中,在人工智慧領域具備的國際頂尖技術實力,以及高科技人才儲備方面的領先布局。值得注意的是,京東數科的系列研發能力已走出了單純實驗室階段,轉化為在智能城市、農業、大宗商品、零售、以及AI機器人等產業場景的落地應用,助力整個行業的產業數位化進程。
AAAI(Association for the Advance of Artificial Intelligence)是人工智慧領域中歷史最悠久、涵蓋內容最廣泛的的國際頂級學術會議之一,每年都會吸引大量研究員、開發者投稿和參會,論文競爭更是異常激烈。在中國計算機學會的國際學術會議排名中,AAAI被列為人工智慧領域的A類頂級會議,是未來人工智慧產業發展方向的重要風向標。據了解,新一屆 AAAI 2021 將全程在線上舉辦,時間為2月2日-2月9日。
AAAI 2021聯合主席Kevin Leyton-Brown在Twitter上表示,今年接受的投稿論文總數達到「驚人的高技術水平」。9034篇投稿論文中,7911篇接受評審,最終僅有1692篇論文被錄取,錄取率為21%。
京東數科自主研發聯邦學習平臺 破解數據孤島
如何在數據共享基礎上破解「數據孤島」難題,是業界近年來在聯邦學習方向上的重點探索。京東數科此前也推出自主研發的聯邦學習平臺——Fedlearn,融合了密碼學、機器學習、區塊鏈等聯邦學習算法,搭建出一套安全、智能、高效的連結平臺,在各機構數據不用向外傳輸的前提下,通過聯合多方機構數據,實現共同構建模型等多方數據聯合使用場景,獲得加成效應。
憑藉在聯邦學習平臺上的前沿技術投入,京東數科此次在該領域有兩篇論文入選AAAI 2021。《Secure Bilevel Asynchronous Vertical Federated Learning with Backward Updating 基於反向更新的雙層異步安全垂直聯邦學習》,提出一種新穎的融合了反向更新和雙層異步並行的垂直聯邦學習框架(VFB2),以及在此框架下的VFB2-SGD,VFB2-SVRG和VFB2-SAGA三種新算法,助力多方協同訓練模型並且不洩漏數據隱私,並在一定程度上破解垂直聯邦學習算法不夠高效的難點。
基於反向更新的雙層異步安全垂直聯邦學習
《On the Convergence of Communication-Efficient Local SGD for Federated Learning聯邦學習中高效通信的本地隨機梯度算法的收斂性分析》,在聯邦學習最經常使用的模型訓練算法「本地隨機梯度」之外,提出一種新的高效通信分布式隨機梯度算法,可以通過錯誤補償雙重壓縮機制,解決在聯邦學習大規模模型有效訓練中通信開銷較大的難題,顯著降低通信成本。
以時空AI打造智能城市作業系統 助力民生與產業發展
而在城市管理中,如何精準預測城市交通流量峰值、智能監管危化品全流程、「領導駕駛艙」實時查看城市運行全貌,這些背後支撐的都是智能城市領域的一系列領先技術。京東數科核心聚焦「時空AI」技術,此次也有論文入選AAAI 2021。如《Traffic Flow Forecasting with Spatial-Temporal Graph Diffusion Network基於時空圖擴散模型的交通流量預測》,設計了一種基於異構圖神經網絡的深度學習模型, 分別從時間和空間上對不同區域的流量信息進行建模。相較於現有僅考慮局部空間關係的流量預測算法有一定優越性, 可以實現整個城市不同區域更加精確的預測結果。
此外,《Robust Spatio-Temporal Purchase Prediction via Deep Meta Learning基於深度元學習的魯棒時空銷量預測》,提出了時空元學習預測(STMP)模型,用於零售行業在購物節期間的銷量預測。STMP是基於元學習的時空多任務深度生成模型,採用具有少量學習能力的元學習框架來捕獲銷量數據的時空表示。然後,生成模塊使用提取的時空表示和當前的銷量數據來推斷預測結果,從而助力商家基於爆發式銷量的預測提前做好充分準備。
值得注意的是,京東數科推出的智能城市作業系統,作為政府數位化服務的數字基石和技術底座,實際上包含了時空數據引擎、以時空AI為核心的時空智能引擎、基於聯邦學習的數字網關技術以及莫奈可視化平臺等諸多前沿科技,可以讓城市中海量數據高效、安全「對話」,AI算法模塊化輸出。以「時空大數據引擎」為例,「智能城市作業系統」的實現處理速度相比傳統數據平臺要快10—100倍,並且還不斷迭代;依託時空智能引擎,以前一個20人團隊做空氣品質分析和預測AI模型開發需要花費兩年時間。現在,「智能城市作業系統」只需要一個人花兩天時間即可完成,極大降低了人工智慧開發成本,加快AI落地的步伐。
在一系列技術領先應用下,京東數科的智能城市作業系統在雄安落地為塊數據平臺,成為雄安新區城市大數據資源中心的實際載體;基於京東數科「智能城市作業系統」,江蘇省南通市也建成了全國首個市域治理現代化指揮中心,匯聚南通市75個部門數十億量級的數據。全南通市交通運行、公共安全、環境汙染等情況都在一張大屏幕上實時呈現,從而實現一屏統覽。
序列推薦、社交推薦讓營銷服務更精準
如何基於用戶已有的行為標籤,為其推薦真正需要的商品智能化服務,進行千人千面的智能營銷?這背後則是推薦算法。京東數科此次圍繞推薦方向亦有論文入選AAAI 2021。
現有基於會話的序列推薦算法目前被廣泛應用,但它僅僅只是考慮了每個會話內商品的點擊轉換模式,忽略了不同會話間商品的潛在關聯性。為了解決現在算法的缺陷,論文《Graph-Enhanced Multi-Task Learning of Multi-Level Transition Dynamics for Session-based Recommendation基於圖模式增強多任務學習的會話序列推薦系統》提出了一種基於圖模式增強多任務學習的框架,運用異構的注意力機制對每個會話內的商品轉換模式進行學習,來實現基於會話的序列推薦;還引入了跨越不同會話的圖學習模型,在商品的表徵學習中增加了其全局關係的建模,因此可以實現對商品的短期以及長期序列關係同時進行學習。
基於圖模式增強多任務學習的會話序列推薦系統
論文《Knowledge-aware Coupled Graph Neural Network for Social Recommendation基於知識關係的聯結圖神經網絡的社交推薦系統》則是在社交推薦場景中引入商品的關係,並提出了一種基於知識關係的聯結圖神經網絡模型,從而學習到更加精確的用戶偏好,可以在一定程度上緩解稀疏用戶在推薦中帶來的影響,以增強推薦模型的魯棒性。
此外,在風控領域京東數科也有論文入選,《The Causal Learning of Retail Delinquency消費違約場景的因果學習》探討了額度對用戶風險的因果效應方法,通過前沿的雙重機器學習,克服了現有數據中的「倖存者偏差」問題,構造出能夠反映「策略——風險」因果關係的無偏估計量,促進風險管理與機器學習理論更深地結合,幫助信貸機構制定更科學的授信策略。
此次16篇論文入選AAAI 2021,是京東數科技術實力集中爆發的一大例證。事實上,截至2021年1月,京東數科在AAAI、IJCAI、CVPR、KDD、NeurIPS、ICML等國際AI頂級會議上共發表相關論文近150篇,在機器學習、計算機視覺、語音與自然語言處理等領域均取得世界級研究突破。此外,京東數科還持續加大對技術研發的投入力度,目前公司研發及專業人員佔比近70%,2020年上半年公司用於技術研發的投入佔比接近16%,該比例已與國際網際網路科技巨頭持平甚至更高。
未來,京東數科還將繼續沿著以AI推動產業數位化的方向,在國際頂尖研發領域不斷探索突破,打好堅實的科技基礎,以科技(Technology)+產業(Industry)+生態(Ecosystem)為客戶提供全方位數字服務,與實體產業共進。