獲全球頂會NeurIPS、COLT雙認可 百度研究院優質論文解讀AI技術趨勢

2020-12-27 網易新聞

(原標題:獲全球頂會NeurIPS、COLT雙認可 百度研究院優質論文解讀AI技術趨勢)

近日,NeurIPS 2020(Neural Information Processing Systems Annual Meeting,神經信息處理系統年會)落下帷幕,作為人工智慧和機器學習領域的國際頂級會議,NeurIPS旨在促進有關神經信息處理系統的研究交流,在同行會議上介紹和討論新穎的研究。此次大會中,百度研究院參會並發表了多篇高質量論文,論文聚焦大規模稀疏學習的加速求解、新發現物種數量預測、隨機非凸優化、高維數據判別分析等問題,分別提出了創新算法及理論,突破原有算法在實際應用中泛化效果差、優化效率低等限制,有效提升AI技術在自然生態學、統計學習理論等領域中的應用價值,同時也彰顯出百度在人工智慧與機器學習領域的持續技術創新力。

(百度研究院多篇論文入選NeurIPS 2020)

首先,論文《Thunder: a Fast Coordinate Selection Solver for Sparse Learning》就大規模稀疏學習提出新方法。大規模稀疏學習是機器學習中的重要方法之一,但大規模稀疏學習的高效訓練卻是極具挑戰性的問題。雖然人們藉助凸目標函數和模型的稀疏性,已經提出很多優化方法來加速求解大規模稀疏學習問題,但當模型的稀疏度比較低或求解精度需求很高時,大多數優化提速方法便會失效,對此,本文提出了一種新穎的方法(Thunder)。

該方法儘可能地避免了在冗餘特徵上的計算,並可以保證算法選取特徵的安全性。目前,已在一系列大數據集上的實驗結果證明了方法的有效性。如下圖所示,在Finance數據集上,百度提出的新方法比現有最佳方法在效率優化上有巨大的提升。

其次,論文《Optimal Prediction of the Number of Unseen Species with Multiplicity》對自然生態學中新發現物種數量預測做出梳理。論文首先提出了更一般化的版本,即對新樣本中出現的未知元素依據數量劃分,從而實現更精確細緻的穩定預測。再通過資訊理論下界的構造,證明所提出的算法同時實現了最優時間和樣本複雜度。這一新的理論完整復現了此前七十年間的諸多研究成果,並在未知參數領域實現了非平凡的拓展,對自然生態學領域具有重要的現實意義。該工作已被機器學習旗艦會議NeurIPS 2020所接受並遴選為Spotlight報告文章。

論文《Towards Better Generalization of Adaptive Gradient Methods》則對統計學習理論中的重要問題「隨機非凸優化」給出新方案。為優化當前流行的動態梯度下降算法的泛化效果,百度提出穩定動態梯度下降算法,將差分隱私與梯度下降相結合,並巧妙利用差分隱私防止過擬合的這個優勢來提高算法的泛化性能。該算法已被證明可以減小泛化誤差,且具備一定優越性,為隨機非凸化問題帶去創新性解決方案。

最後,《Ratio Trace Formulation of Wasserstein Discriminant Analysis》一文,則針對高維數據的判別分析給出新算法。百度研究了維數約簡(DR)技術Wasserstein判別分析,提出用較少計算成本獲得可比或更好的結果的公式。同時從電子結構計算角度分析,將該判別分析技術轉化為一個比值跡問題,提出基於特徵解算器的判別分析技術判別子空間計算算法,依託於比值跡公式封閉形式的解,一旦正則化的最優輸運問題得到解決,就可以通過廣義特徵值分解得到。百度這一算法平均收斂時間更短,對初始化合參數的敏感性也更低。通過在實際數據集上的數值實驗表明,該算法在分類和聚類任務中都有很好的應用前景。

據悉,此次入選NeurIPS 2020的多篇優質論文來自百度研究院西雅圖研究院和百度認知計算實驗室,上述實驗室研究員一直是NIPS/NeurIPS會議的常客,2019年共有6篇論文入選NeurIPS,也曾經獲得過NIPS 2014的最佳論文獎;2020年,其在更具難度與深度的頂級機器學習算法和理論會議COLT(Conference on Learning Theory)中發表兩篇百度統一單位的論文,論文針對求解稀疏約束優化問題,提出了可以顯著降低計算複雜度的算法,為高維數據稀疏學習帶來算法與理論的新突破,這也是中國網際網路公司罕見的一次在COLT發表論文;另外,值得一提的是在2019年深度學習頂會ICLR上,實驗室研究員的理論論文解決了深度神經網絡的一個基礎問題,也是那年ICLR 2019的最高評分論文之一。

上述研究成果與百度研究院的發展布局緊密相連。今年八月,百度研究院宣布架構新升級,新增生物計算實驗室和安全實驗室。至此,百度研究院已囊括了從底層基礎技術到感知、認知技術的 AI全領域研究,匯聚數十位 AI領域的世界級專家,共同推動百度研究院的 AI基礎性研究和前瞻性洞察,助力 AI技術加速落地。

如今,百度研究院結合自身AI優勢,升級新架構,深入展開跨領域合作,取得的基礎性研究創新有目共睹;未來,百度研究院還將不斷推動百度AI技術的創新發展,夯實其在國際人工智慧領域的影響力,促使AI深入行業落地應用,為全球科技發展出一份力。

本文來源:大眾新聞 責任編輯:陳體強_NB6485

相關焦點

  • 百度研究院登上NeurIPS2020多篇論文解讀機器學習領先算法
    此次大會中,百度研究院參會並發表了多篇高質量論文,論文聚焦大規模稀疏學習的加速求解、新發現物種數量預測、隨機非凸優化、高維數據判別分析等問題,分別提出了創新算法及理論,突破原有算法在實際應用中泛化效果差、優化效率低等限制,有效提升AI技術在自然生態學、統計學習理論等領域中的應用價值,同時也彰顯出百度在人工智慧與機器學習領域的持續技術創新力。
  • AI影響因子5月回顧:國內企業研究院89篇頂會論文被錄用,商湯騰訊...
    作為全球計算機視覺頂會 CVPR 2018 的鑽石贊助商,曠視科技 Face++研究院將在孫劍博士的帶領下出席此次盛會,本次曠視共有 1 篇 spotlight 論文,7 篇 poster本屆國際自然語言處理頂會 ACL 共計有 1551 篇論文進入審查階段(1021 長篇,530 篇短篇),錄用率約為 20%。
  • 雲知聲- CMU 合作論文入選全球 AI 頂會 NeurIPS 2020
    在官方公布的論文入選名單中,雲知聲與 CMU (卡內基梅隆大學)張坤教授團隊等合作的針對機器學習典型的無監督領域自適應問題論文《Domain Adaptation As a Problem of Inference on Graphical Models》,憑藉基於數據驅動的圖模型框架解決方案的創新研究成功入選,彰顯了雲知聲在人工智慧與機器學習原創技術領域的持續創新能力。
  • NeurIPS2020獎項出爐:GPT-3等三項研究獲最佳論文獎,華人一作論文...
    北京時間 12 月 8 日凌晨,正在線上舉行的全球人工智慧頂會 NeurIPS 2020 公布了最佳論文等獎項。在一千八百餘篇論文中,三篇論文獲會議最佳論文獎項,OpenAI 等機構的 GPT-3 研究名列其中,可謂實至名歸。
  • NeurIPS 2020獎項出爐:GPT-3等三項研究獲最佳論文獎
    北京時間 12 月 8 日凌晨,正在線上舉行的全球人工智慧頂會 NeurIPS 2020 公布了最佳論文等獎項。在一千八百餘篇論文中,三篇論文獲會議最佳論文獎項,OpenAI 等機構的 GPT-3 研究名列其中,可謂實至名歸。
  • NeurIPS 2020 獎項出爐:GPT-3等三項研究獲最佳論文獎
    北京時間 12 月 8 日凌晨,正在線上舉行的全球人工智慧頂會 NeurIPS 2020 公布了最佳論文等獎項。在一千八百餘篇論文中,三篇論文獲會議最佳論文獎項,OpenAI 等機構的 GPT-3 研究名列其中,可謂實至名歸。人工智慧頂會 NeurIPS 2020 於本月 6 日 - 12 日在線上舉行,預計此次會議將迎來 18,000 名參會者。
  • GPT-3獲NeurIPS 2020最佳論文獎,蘋果華人學者獲經典論文獎
    今天早晨,大會評委會公布了獲得最高榮譽的論文名單:包括GPT-3在內的三篇獲得最佳論文獎,一篇2011年論文獲得時間檢驗獎。而去年新增的傑出新方向論文獎並未頒出。由於這些近似技術在機器學習中得到了廣泛的應用,本文有望產生實質性的影響,並給出新的見解,例如核方法、特徵選擇和神經網絡的雙下降行為等。
  • 17篇論文,詳解圖的機器學習趨勢|NeurIPS 2019
    必須承認,圖的機器學習(Machine Learning on Graphs)已經成為各大AI頂會的熱門話題,NeurIPS 當然也不會例外。NeurIPS2018中有幾篇論文對雙曲神經網絡的構建做了深入的理論分析,今年在NeurIPS2019上我們終於看到了雙曲幾何和圖結構結合的應用。
  • AI 算法解決二進位安全問題,騰訊安全NeurIPS 2020論文有新方法
    不久前,人工智慧頂會 NeurIPS 2020 放出接收論文列表,論文接收率創歷史新低。而騰訊安全科恩實驗室使用 AI 算法解決二進位安全問題的一項研究《CodeCMR: Cross-Modal Retrieval For Function-Level Binary Source Code Matching》成功入選。
  • 17篇論文,詳解圖的機器學習趨勢 | NeurIPS 2019
    必須承認,圖的機器學習(Machine Learning on Graphs)已經成為各大AI頂會的熱門話題,NeurIPS 當然也不會例外。在NeurIPS 2019上,僅主會場就有 100多個與圖相關的論文;另外,至少有三個workshop的主題與圖有關:我們希望在接下來的這篇文章裡,能夠儘可能完整地討論基於圖的機器學習的研究趨勢,當然顯然不會包括所有。
  • 17篇論文詳解圖的機器學習趨勢 | NeurIPS 2019
    必須承認,圖的機器學習(Machine Learning on Graphs)已經成為各大AI頂會的熱門話題,NeurIPS 當然也不會例外。 NeurIPS2018中有幾篇論文對雙曲神經網絡的構建做了深入的理論分析,今年在NeurIPS2019上我們終於看到了雙曲幾何和圖結構結合的應用。
  • 百度王海峰領銜百度AI再創佳音 10篇論文被ACL 2019錄取
    近日,自然語言處理(NLP)領域的國際頂級學術會議「國際計算語言學協會年會」(ACL 2019)公布了今年大會論文錄用結果,百度共有十篇論文被大會收錄,展現出在該領域的技術積澱和國際水準。由百度高級副總裁、AI技術平臺體系(AIG)和基礎技術體系(TG)總負責人、百度研究院院長王海峰領銜的百度AI取得新一輪創新突破。
  • NeurIPS2019機器學習頂會接受論文列表!
    來源:專知【導讀】人工智慧和機器學習領域的國際頂級會議NeurIPS 2019公布了接受論文,有效提交論文6743篇論文,
  • 頂會ACL這十年:百度披荊斬棘,中國NLP乘風破浪
    作為NLP領域最負盛名的國際頂會,今年雖在線上,但論文投稿數錄用率方面,中國依然勢頭兇猛,投稿數1084篇領跑,錄用率23.7%,僅次於美國。在入圍論文中,除了華人參與的研究斬獲最佳論文,王海峰、周明、俞棟、劉挺等知名大牛的名字,也依然出現在多篇成果中。這幾乎已經成為了常態。
  • 好未來測量技術論文再次入選國際教育測量學頂會NCME 2021
    近日,好未來集團中臺內容雲教育測量和算法團隊發表的兩篇有關教育測量技術理論與實踐的論文獲選參加美國國家教育測量委員會
  • 雲知聲原創技術獲肯定:多篇論文被國際語音頂會 INTERSPEECH 2020...
    文:薛剛   2020-10-23/11:31 近日,全球語音頂會
  • NeurIPS 2019放榜:華人作者貢獻42%,谷歌170篇屠榜;國內清華第一,騰訊領銜產業界
    是全球最受矚目的AI、機器學習頂級學術會議之一。盛況之隆,門票都一票難求。所以可以想像,論文入選NeurIPS又意味著什麼。現在,2019年NeurIPS論文入選完整名單已公布。也是AI領域的科研琅琊榜。NeurIPS 2019概況先說整體情況。
  • 11篇論文、首屆同傳研討會、技術分享,百度AI閃耀ACL2020
    這次會議,百度共有11篇論文被錄用,覆蓋自然語言處理眾多前沿研究方向;百度聯合谷歌、Facebook、清華大學等全球頂尖機構,共同舉辦首屆同聲傳譯研討會;在線上展臺主題技術TALK環節,百度還就開放域人機對話技術、ERNIE核心技術等業內關注的話題展開分享,展現了中國企業在自然語言處理及人工智慧領域的技術創新與落地實踐能力。
  • 從ISSCC2021論文看未來技術發展趨勢
    從論文來源看,全球共有15個國家和地區有論文錄用。其中遠東有中國大陸、中國澳門、中國臺灣、韓國、日本、新加坡;北美有美國、加拿大;歐洲有荷蘭、比利時、瑞士、德國、義大利、奧地利、法國。需要說明的是,在數字系統(DAS)分類中,有一篇來看中國百度公司的特邀論文。這一成績體現了當前中國在集成電路技術領域的穩固上升,產學研並進、百花齊放的良好發展勢頭,同時也證明了我國在集成電路領域的國際認可度及影響力正在不斷提升。
  • 蟬聯AI專業全球冠軍!清華力壓CMU再奪CSRankings高校AI排行王座
    排名依據:完全基於研究指標,以各大頂會發布的論文數量為主這份排行榜不同於常見的《美國新聞與世界報導》(US News and World Report)排名,《美國新聞與世界報導》完全以聲譽為基礎,依賴於向各部門主管和研究生院主任進行調查。