京東AI成果再向前一步 方法領先Waymo、Facebook

2020-12-06 科技快報網

近日,第34屆神經信息處理系統大會(Conference on Neural Information Processing Systems,簡稱NeurIPS,NIPS)在線上召開。作為全球頂級的機器學習和計算神經科學會議,今年的NIPS依然受到了學者們的高度關注,甚至由於其線上開放的特性緩解了往年搶票難的問題,而將獲得更多的「聽眾」。

據悉,今年NeurIPS稿件錄取率為20.09%,創下歷史新低。在如此嚴苛的錄取標準之下,京東AI深度學習與語音語義實驗室提交的探索稀疏3D點雲Global Context的論文《Group Contextual Encoding for 3D Point Clouds》成功入選。今年以來,京東AI深度學習與語音語義實驗室的研究成果頻獲國際認可,此前還有多篇論文入選國際語音和語言處理頂會比如ACL 2020、AAAI 2020、INTERSPEECH 2020等。

Global Context對視覺感知至關重要,可以根據語義信息提高物體識別的準確率,但目前針對3D點雲的Global Context的研究還不夠充分,特別是在三維空間的情況下,數據呈現高維、稀疏的特點,對傳統深度學習算法提出了挑戰。因此,京東AI研究院基於其研究實習生計劃與東京大學合作了《Group Contextual Encoding for 3D Point Clouds》,針對這一研究領域提出了Group Contextual Encoding的Global Context學習方法。

從目前已有3D點雲Global Context的研究成果來看,比如LG-PointNet++ 【1】,其複雜度為,N是輸入點的個數。當場景複雜時,輸入點數較多會導致耗費相當大的算力。Contextual Encoding Layer【2】的複雜度是,是一種有效率的方法,K是該方法裡code word數目。但是點雲數據稀疏導致的過擬合現象(overfitting),會影響性能的提升,導致在ScanNet,SUN-RGBD數據集上3D檢測性能隨著Code word數目K的增長,性能卻很快就飽和不再增長。雖然目前有一些深度補全的算法可以解決數據稀疏這個問題,但是這些算法都存在結構複雜、耗費計算資源的問題,因此,京東AI研究院決定探索簡單有效的方法。

首先要解決數據的稀疏問題。通過把特徵通道分組,從而獲得更多的等效數據,如圖1所示,如果把通道分成G組特徵子向量,數據就相對應增廣了G倍。再將分組後的特徵子向量通過Encoding layer得到Global context,從而有利於在分組後的特徵子空間學習全局上下文, 然後通過channel attention的形式作用於分組後的特徵。最後通過Concat操作恢復為原特徵的尺寸。如此操作既解決了數據的稀疏問題,又解決算法結構複雜、算力耗費巨大的問題。

圖1:Group Contextual Encoding方法圖。

隨後,京東AI研究院又將這種方法在多個3D數集上進行驗證,不僅證實這種方法簡單有效,還刷新了SOTA方法的性能。將這種方法應用在PointNet++ Backbone上,並部署到VoteNet模型。如表1所示,在ScanNet數據集以mAP@0.25指標測評時,該方法領先VoteNet 【3】 2.2mAP,增幅已然明顯,但更令人驚喜的是,在更加嚴格的mAP@0.5 的指標下,如表2所示,該方法領先Waymo、Facebook AI Research以及Stanford大學提出的 VoteNet高達6.57 mAP,可視化結果如圖2所示。

表1:ScanNet數據集mAP@0.25評測指標的結果。

表2:ScanNet數據集mAP@0.5評測指標的結果。

圖2:ScanNet數據集的結果可視圖。在SUN-RGBD數據集,我們的方法也領先VoteNet 3mAP,具體定量以及定性結果如表3和圖3所示。

表3:SUN-RGBD數據集mAP@0.25評測指標的結果.

圖3:SUN-RGBD數據集的結果可視圖。

京東自2017年開始全面向技術轉型,用技術重塑了京東的生態系統,逐漸突破零售邊界,拓展至數字科技、物流、健康等眾多領域。一直以來,消費者們更多的在購物、物流等環節體驗到京東技術的進步,如今,京東在人工智慧領域的長足進展不僅獲得學術界的認可,也逐漸被更多的用戶所知悉,京東的智能語音技術也已經在智能外呼機器人、客服語音機器人等電話交互場景中實現成熟應用,此次提出的Group Contextual Encoding方法也可以應用在下遊的AR(增強現實)、MR(混合現實)以及機器人,自動駕駛等領域,推動這些領域的發展。京東技術將不僅賦能金融、醫療、教育、健康等行業,還將在更多領域為用戶提供便利。

參考文獻

【1】Wang, Xu, Jingming He, and Lin Ma. "Exploiting Local and Global Structure for Point Cloud Semantic Segmentation with Contextual Point Representations." Advances in Neural Information Processing Systems. 2019.

【2】Zhang, Hang, et al. "Context encoding for semantic segmentation." Proceedings of the IEEE conference on Computer Vision and Pattern Recognition. 2018.

【3】Qi, Charles R., et al. "Deep hough voting for 3d object detection in point clouds." Proceedings of the IEEE International Conference on Computer Vision. 2019.

相關焦點

  • 京東AI研究院獲QuAC機器閱讀理解競賽冠軍,模型能力業界領先
    ., 2018))比賽上,京東 AI 研究院語音語言實驗室提出的 EL-QA 模型(Single Model)登頂 QuAC Leaderboard,全部三項指標均獲得第一名。其中,在 F1-Measure(又稱為 F1-Score) 指標上達到 74.6,大幅拉近了機器與人類在該任務上的水平差距。
  • Facebook AI 正在升維突破:教AI像人類一樣理解三維世界
    Facebook AI近日在首爾國際計算機視覺大會(ICCV)上演示了他們在這個領域的最新研究成果,同時也在博客和 arxiv 上發布了技術簡介和論文,表現驚豔,研究成果之一還獲得了 ICCV 最佳論文提名。
  • AppsFlyer、Facebook、京東、5miles:出口電商大時代
    以下是圓桌探討全文:獨立站爆發元年徐宇:大家好,我叫徐宇,來自AppsFlyer,我們公司是全球領先的的移動歸因與營銷分析平臺。facebook從今年的下半年到2019年的主題都是partnership,就是希望產業上各家合作商,只要你覺得能夠幫助到跨境賣家的成長,能夠幫助到facebook的廣告業務,都歡迎來和我們合作。我們不只局限於花費,也希望他們能為我們帶來更多潛在廣告主的銷售線索。段曉慧:第一個關鍵詞同樣是獨立站。
  • Facebook AI的DETR,一種基於Transformer的目標檢測方法
    當前的深度學習方法試圖解決作為分類問題或回歸問題或綜合兩者的目標檢測任務。例如,在RCNN算法中,從輸入圖像中識別出幾個感興趣的區域。然後將這些區域分類為對象或背景,最後,使用回歸模型為所標識的對象生成邊界框。另一方面,YOLO框架(只看一次)以不同的方式處理目標檢測。
  • Facebook像素是什麼?facebook像素的安裝方法及功能
    但是,有很多人還不清楚Facebook 像素是什麼,也不知道Facebook像素究竟有什麼作用,那下面小黑就為大家介紹下Facebook像素的作用及安裝方法。一、什麼是facebook像素?再營銷:Facebook有Remarketing的功能,可以對那些在你的網站上下單了但是沒有付款的用戶進行再營銷。抓出精準受眾:可以構建類似的受眾(Looklike Audience),通過創建類似受眾來找到與網站訪客相似的新客戶,那麼這樣子你的廣告觸及的人群在未來會更精準。
  • AI讓MRI成像快了4倍,核磁檢查再也不用排隊了
    AI與MRI的結合要了解fastMRI的方法,首先回顧一下MRI的工作原理是有幫助的。為了創建需要審查的圖像,MRI使用磁場與身體軟組織和重要器官中的氫原子相互作用。這些原子然後發出電磁信號,就像燈塔一樣,指示原子在身體的什麼位置。這些信號被掃描儀收集為一連串單獨的二維頻率測量,即所謂的k空間數據。
  • 蘋果facebook登錄不了怎麼回事 手機facebook無法登陸解決方法?
    > 手機facebook無法登陸打開解決方法。剛剛申請了手機facebook帳號後,不知道怎麼了,居然無法登陸上去,密碼跟帳號都是沒有問題的。就是打不開,登陸不上去啊。下面就跟大家介紹一下手機facebook無法登陸打開解決方法。
  • 華人研究團隊推出AI「諷刺」檢測模型,準確率達86%
    龐大的社交網絡每天有成千上萬條帖子被發表,其中哪些有政治風險,哪些無政治風險,如果靠人工逐一審核再刪除的話,顯然有點不切實際。這時候,AI就派上用場了。最新的研究成果在2019年,首次引入多模態檢測的AI模型HFM,其準確率能夠達到83%。而近日,該項研究取得突破性進展,其準確率提升了2.74%。
  • 華人研究團隊推出AI「諷刺」檢測模型,準確率達86%
    龐大的社交網絡每天有成千上萬條帖子被發表,其中哪些有政治風險,哪些無政治風險,如果靠人工逐一審核再刪除的話,顯然有點不切實際。這時候,AI就派上用場了。最新的研究成果在2019年,首次引入多模態檢測的AI模型HFM,其準確率能夠達到83%。而近日,該項研究取得突破性進展,其準確率提升了2.74%。這項成果來自中國北京的信息工程研究所和中國科學院聯合研究團隊,他們研發的新型多模態AI諷刺檢測模型,經過Twitter數據集檢測準確率可達到86%。
  • 學界| Facebook新論文介紹相似性搜索新突破:在GPU上實現十億規模
    儘管 GPU 擅長數據並行任務,但之前的方法會在並行性不高的算法(如 k-min selection)上遇到瓶頸或不能有效利用內存的層次結構。我們提出了一種用於 k-selection 的設計,其可以以高達理論峰值性能 55% 的速度進行運算,從而實現了比之前最佳的 GPU 方法快 8.5 倍的最近鄰搜索。
  • 京東2019人工智慧大會發布十大實戰案例 引發AI+產業的化學反應
    該產品是悉見科技依託京東人工智慧開放平臺NeuHub平臺提供的圖像識別能力,通過集成、創新,再以模塊化和定製化的方式研發的一款智能終端。它可廣泛應用於各行業的智慧供應鏈場景,起到集中部署、針對解決的作用。例如在製造業和流通業的分揀場景幫助智能分揀、提升效率,讓後端的供應鏈一體化;在線下零售場景幫助實現門店管理、智能導購等功能,滿足消費者需求。
  • Facebook專家強烈質疑人類預測能力,未來只有靠AI才能自救!
    AI正在幫助我們拯救珊瑚礁、發現新的藥物,並研究新的癌症治療方法。挪威正在使用更智能化的機器,將更多的可再生能源納入電網,印度農民在一些情況下利用AI工具,將農作物產量提高了30%。這些進步都有助於避免重大災難的發生。 不過,Mikolov確實同意馬斯克的觀點。他聲稱,在人與機器之間建立共生關係可以避免計算機在未來接管世界。
  • 尖端科技網際網路+:讓我們領先快一步
    原標題:尖端科技網際網路+:讓我們領先快一步「網際網路+」作為網際網路思維領先的實踐成果,為我們追求美好的生活夯實了技術基礎,對推動社會經濟形態的發展提供了強有力的支持和保障。現在跟著GE,迅速了解一波當下最新最酷的科技成果吧!
  • 6篇論文入選全球頂會AAAI 京東數科以全面AI能力助力產業數位化
    這6篇論文的研究成果,均獲得層層評審的高分,最終脫穎而出。它們的研究成果,均實現了相應領域現有技術的突破,比如論文《基於空間語義網絡調製的深度對象聯合分割》,提出了一個基於空間和語義調製的協同分割深度學習網絡框架,可對多幅相關圖像中的共同目標進行分割,在四個圖像協同分割基準數據集上的大量實驗表明,與最新方法相比,該論文的方法實現了更高的精度。
  • AI 影響因子 8 月份回顧:騰訊 AI Lab 再佔榜首
    騰訊 AI Lab 憑藉多篇論文繼續霸佔八月活躍榜榜首,阿里巴巴、京東、滴滴也憑藉多篇論文獲得關注。Part.1 會議/期刊論文七、八、九三個月頂會密集召開,圍繞這些學術頂會,多家企業公布了錄用論文。在八月召開的 KDD 上,騰訊 AI Lab、京東 AI 研究院、阿里巴巴達摩院機器智能技術實驗室、京東金融 AI 實驗室、騰訊覓影均有相應得分。
  • 如何運營好Facebook並從中找到賺錢商機
    因此今天我們再來看下面這張圖片,真的會讓人感動!還有就是我們熟悉的賈伯斯,他有一句名言,「活著就是為了改變世界」蘋果手機完全顛覆了人們對手機的認識,在賈伯斯追求極致、完美的理念下,終於實現了藝術和技術的完美結合,iphone 為廣大的消費者帶來了一個易學易用:電腦、手機、網際網路、遊戲、影音集合的經典產品!這近乎天才般的作品,為蘋果開創了一個嶄新的時代!
  • Facebook 今年被 CVPR 收錄的論文都說了啥?
    作為工業界的學術實力幹將之一,Facebook AI 研究院在本次大會上的成果也備受矚目。而 Facebook AI 研究院也對自己今年的戰績進行了統計:共有 37 篇論文被收錄,其中包括 15 篇 Oral 論文。下面就讓我們一起來看看這些成果吧。
  • 從京東 618 導購機器人說起,機器如何更理解人類?
    今年6月,京東一年一度的618店慶拉開帷幕。許多京東用戶發現,在今年的618中,京東上線了全新的AI導購機器人JOY,它沿用了京東經典的機器狗形象,可以為用戶解答618店慶相關問題。在京東JOY強大的對話能力中,基於開放域目標驅動的生成式對話服務來自於人工智慧企業「深思考人工智慧」(iDeepWise.ai)。其在多模態深度語義理解、人機對話等核心AI技術上已不斷突破創新。這些新技術的不斷迭代,也在一步步推動AI實現商業化落地。AI對話機器人背後的黑科技究竟是什麼?
  • Facebook AI 年度總結來啦
    這就是為什麼我們正在探索多種方法來減少訓練中所需的監督,包括展示從半監督甚至非監督數據中學習從而受益的項目。例如,為了增加系統可能翻譯或理解的語言數量,我們演示了一種新的方法,在無監督數據上訓練自動翻譯 NMT 模型,其性能與在監督數據上訓練的系統相當。我們的系統的準確性比以前的無監督方法有了很大的提高。
  • 華為:寧可向前一步死,絕不後退半步生
    這句宣傳語就是:寧可向前一步死,絕不後退半步生。其實,自從公司成立以來,每一次面臨困境,華為都挺了過來,而且最終會浴火重生,變得更加強大。初創時的華為,啟動資金只有2.1萬元,條件非常艱苦;而且當時任正非已經四十多歲,窮困潦倒,根本不具備創業的條件,但是他硬是挺過來了,帶領大家走出第一步。