百度多篇論文入選NeurIPS 2020,機器學習領先算法、理論「強輸出」

2021-01-10 中國青年網

  近日,NeurIPS 2020(Neural Information Processing Systems Annual Meeting,神經信息處理系統年會)落下帷幕,作為人工智慧和機器學習領域的國際頂級會議,NeurIPS旨在促進有關神經信息處理系統的研究交流,在同行會議上介紹和討論新穎的研究。此次大會中,百度研究院參會並發表了多篇高質量論文,論文聚焦大規模稀疏學習的加速求解、新發現物種數量預測、隨機非凸優化、高維數據判別分析等問題,分別提出了創新算法及理論,突破原有算法在實際應用中泛化效果差、優化效率低等限制,有效提升AI技術在自然生態學、統計學習理論等領域中的應用價值,同時也彰顯出百度在人工智慧與機器學習領域的持續技術創新力。

(百度研究院多篇論文入選NeurIPS 2020)

  首先,論文《Thunder: a Fast Coordinate Selection Solver for Sparse Learning》就大規模稀疏學習提出新方法。大規模稀疏學習是機器學習中的重要方法之一,但大規模稀疏學習的高效訓練卻是極具挑戰性的問題。雖然人們藉助凸目標函數和模型的稀疏性,已經提出很多優化方法來加速求解大規模稀疏學習問題,但當模型的稀疏度比較低或求解精度需求很高時,大多數優化提速方法便會失效,對此,本文提出了一種新穎的方法(Thunder)。

  該方法儘可能地避免了在冗餘特徵上的計算,並可以保證算法選取特徵的安全性。目前,已在一系列大數據集上的實驗結果證明了方法的有效性。如下圖所示,在Finance數據集上,百度提出的新方法比現有最佳方法在效率優化上有巨大的提升。

  其次,論文《Optimal Prediction of the Number of Unseen Species with Multiplicity》對自然生態學中新發現物種數量預測做出梳理。論文首先提出了更一般化的版本,即對新樣本中出現的未知元素依據數量劃分,從而實現更精確細緻的穩定預測。再通過資訊理論下界的構造,證明所提出的算法同時實現了最優時間和樣本複雜度。這一新的理論完整復現了此前七十年間的諸多研究成果,並在未知參數領域實現了非平凡的拓展,對自然生態學領域具有重要的現實意義。該工作已被機器學習旗艦會議NeurIPS 2020所接受並遴選為Spotlight報告文章。

  論文《Towards Better Generalization of Adaptive Gradient Methods》則對統計學習理論中的重要問題「隨機非凸優化」給出新方案。為優化當前流行的動態梯度下降算法的泛化效果,百度提出穩定動態梯度下降算法,將差分隱私與梯度下降相結合,並巧妙利用差分隱私防止過擬合的這個優勢來提高算法的泛化性能。該算法已被證明可以減小泛化誤差,且具備一定優越性,為隨機非凸化問題帶去創新性解決方案。

  最後,《Ratio Trace Formulation of Wasserstein Discriminant Analysis》一文,則針對高維數據的判別分析給出新算法。百度研究了維數約簡(DR)技術Wasserstein判別分析,提出用較少計算成本獲得可比或更好的結果的公式。同時從電子結構計算角度分析,將該判別分析技術轉化為一個比值跡問題,提出基於特徵解算器的判別分析技術判別子空間計算算法,依託於比值跡公式封閉形式的解,一旦正則化的最優輸運問題得到解決,就可以通過廣義特徵值分解得到。百度這一算法平均收斂時間更短,對初始化合參數的敏感性也更低。通過在實際數據集上的數值實驗表明,該算法在分類和聚類任務中都有很好的應用前景。

  據悉,此次入選NeurIPS 2020的多篇優質論文來自百度研究院西雅圖研究院和百度認知計算實驗室,上述實驗室研究員一直是NIPS/NeurIPS會議的常客,2019年共有6篇論文入選NeurIPS,也曾經獲得過NIPS 2014的最佳論文獎;2020年,其在更具難度與深度的頂級機器學習算法和理論會議COLT(Conference on Learning Theory)中發表兩篇百度統一單位的論文,論文針對求解稀疏約束優化問題,提出了可以顯著降低計算複雜度的算法,為高維數據稀疏學習帶來算法與理論的新突破,這也是中國網際網路公司罕見的一次在COLT發表論文;另外,值得一提的是在2019年深度學習頂會ICLR上,實驗室研究員的理論論文解決了深度神經網絡的一個基礎問題,也是那年ICLR 2019的最高評分論文之一。

  上述研究成果與百度研究院的發展布局緊密相連。今年八月,百度研究院宣布架構新升級,新增生物計算實驗室和安全實驗室。至此,百度研究院已囊括了從底層基礎技術到感知、認知技術的 AI全領域研究,匯聚數十位 AI領域的世界級專家,共同推動百度研究院的 AI基礎性研究和前瞻性洞察,助力 AI技術加速落地。

  如今,百度研究院結合自身AI優勢,升級新架構,深入展開跨領域合作,取得的基礎性研究創新有目共睹;未來,百度研究院還將不斷推動百度AI技術的創新發展,夯實其在國際人工智慧領域的影響力,促使AI深入行業落地應用,為全球科技發展出一份力。

相關焦點

  • GPT-3獲NeurIPS最佳論文獎,華人學者獲經典論文獎
    1900篇論文被接收,創下歷史新高。,也是一篇關於學習理論的論文。、最出圈的論文,來自OpenAI的研究,也就是鼎鼎大名的GPT-3,作者數量達到31人之多!關於NeurIPS 2020今年NeurIPS共收到9454篇論文投稿,1900篇被接收,論文接收率僅為20.09%。
  • 17篇論文,詳解圖的機器學習趨勢 | NeurIPS 2019
    在NeurIPS 2019上,僅主會場就有 100多個與圖相關的論文;另外,至少有三個workshop的主題與圖有關:我們希望在接下來的這篇文章裡,能夠儘可能完整地討論基於圖的機器學習的研究趨勢,當然顯然不會包括所有。
  • 22篇入選CVPR 2020,百度 15 篇精選論文詳解
    今年,在6656篇有效投稿中,共有1470篇論文被接收,接收率為22%左右,相較去年25%的入選率,同比下降3%。本屆大會中,百度共有22篇論文入選,涉及主題涵蓋人臉檢測&識別、視頻理解&分析、圖像超分辨、及自動駕駛中的車輛檢測、場景實例級分割等領域。
  • CVPR 2020論文收錄揭曉:百度22篇論文入選 涵蓋全視覺領域
    近日,計算機視覺領域「奧斯卡」CVPR 2020官方公布論文收錄結果,伴隨投稿數量激增,接收率開始經歷了一個持續下降的過程。今年,在6656篇有效投稿中,共有1470篇論文被接收,接收率為22%左右,相較去年25%的入選率,同比下降3%。在論文接收率下降的同時,中國科技企業被錄取論文數量卻不降反增,百度作為AI代表企業今年中選22篇,比去年的17篇增加了5篇。
  • 阿里巴巴18篇論文入選機器學習頂會KDD 2020
    5月25日,國際機器學習頂會KDD 2020公布了論文入選結果,阿里巴巴18篇論文入選,是近幾年KDD會議論文入選數量最多的科技公司之一。據介紹,18篇論文中,涵蓋阿里巴巴在認知智能、曝光偏差、圖表示學習等前沿AI領域的研究突破。
  • NIPS 2017 騰訊AI Lab 八篇論文入選,含1篇Oral
    被譽為神經計算和機器學習領域兩大頂級會議之一的 NIPS(另一個為 ICML)近日揭曉收錄論文名單,騰訊 AI Lab 共有八篇論文入選,位居國內企業前列,其中一篇被選做口頭報告(Oral),該類論文僅佔總錄取數的 1.2%(40/3248),我們將在下文解析。
  • 百度的CVPR2020高光時刻——22篇論文 8項冠軍 2場Workshop
    近日,全球計算機視覺頂會CVPR 2020首次召開線上大會,百度不僅入選22篇接收論文,一舉拿下8項挑戰賽冠軍,涵蓋視頻動作分析、動作識別、圖像增強、智慧城市等多個領域,還主辦了2場重量級學術Workshop,在國際舞臺盡顯中國AI硬實力。這不僅從側面反映了百度傾斜AI「新基建」的策略已有成效,也再次讓中國自有的深度學習平臺飛槳閃耀全球。
  • CVPR 2020商湯斬獲3冠!62篇論文入選,算法工廠憑什麼領跑行業?
    魚羊 發自 凹非寺量子位 報導 | 公眾號 QbitAI「視覺實力秀」,CVPR 2020 正在線上舉辦中。本屆 CVPR 號稱十年來最難的一屆,共接收 6656 篇論文,中選 1470 篇,錄用率僅為 22%,為十年來最低的一次。不過,中國軍團依然表現亮眼。學術界清華領銜,商湯則以62 篇論文入選的成績,領跑產業界。
  • 中國AI「再戰」視覺頂會CVPR:百度全方位參與 入選論文達22篇
    (原標題:中國AI「再戰」視覺頂會CVPR:百度全方位參與 入選論文達22篇)
  • 被ACL 2020收錄11篇NLP論文?百度:小意思,見慣了
    近日,國際自然語言處理領域頂級學術會議「國際計算語言學協會年會」(ACL 2020)公布了今年大會的論文錄用結果。根據此前官方公布的數據,本屆大會共收到 3429 篇投稿論文,投稿數量創下新高。其中,百度共有11篇論文被大會收錄,再次展現出在自然語言處理領域的超高水準。
  • 深度圖高斯過程 | NeurIPS 2020論文分享第一期
    高斯過程是概率機器學習中的核心方法,憑藉其良好的解析性質和出色的不確定性建模能力,被廣泛應用於各類機器學習問題。採用深度學習層次化建模範式的「深度高斯過程」則進一步增強了其建模能力,拓寬了其應用範圍。然而,絕大多數現有方法不能很好的擴展到圖結構數據。
  • 天衍實驗室推薦系統糾偏方法論文入選NeurIPS-2020
    天衍實驗室推薦系統糾偏方法論文入選NeurIPS-2020 天衍實驗室推薦系統糾偏方法論文入選NeurIPS-2020 2020-12-02 10:05:29  來源:DOIT
  • 6篇論文入選全球頂會AAAI 京東數科以全面AI能力助力產業數位化
    日前,人工智慧的頂級學術盛會AAAI2020在美國紐約舉行。其中,處於國內AI實力第一梯隊的京東數字科技集團,有6篇論文被AAAI收錄,在AAAI論文整體錄取率僅有20%的情況下,難能可貴,也體現了京東數科在AI技術上的全面能力和深厚功力。
  • NeurIPS2020論文:新一代算法鑑黃師,中科院碩士一作
    今年的AI頂會NeurIPS 2020,阿里安全團隊一篇名為《啟發式領域適應》(Heuristic Domain Adaptation)的論文入選。在具體的三個領域適應場景中:無監督領域適應(UDA),半監督領域適應(SSDA)和多源域領域適應(MSDA),HDAN都取得了SOTA的結果。
  • 優必選獲IJCAI 2017最佳學生論文獎 13篇論文入選國際頂級人工智慧...
    該會議聚集了人工智慧領域最頂尖的研究者和優秀從業者,關注研討領域涵蓋機器學習、計算可持續性、圖像識別、語音技術、視頻技術等,對全球人工智慧行業具有巨大影響力。隨著近年來人工智慧領域的研究和應用持續升溫,越來越多的國內企業和學者也在積極參與 IJCAI並發表論文。今年,IJCAI共收到2540篇論文投稿,再創歷史新高,最終錄用660篇,錄用率為26%。
  • 繼CVPR、AAAI大豐收後,百度又有11篇論文被ACL 2020錄用
    近日,國際自然語言處理領域頂級學術會議「國際計算語言學協會年會」(ACL 2020)公布了今年大會的論文錄用結果。根據此前官方公布的數據,本屆大會共收到 3429 篇投稿論文,投稿數量創下新高。其中,百度共有11篇論文被大會收錄,再次展現出在自然語言處理領域的超高水準。
  • 京東雲與AI 10篇論文被AAAI 2020收錄,京東科技實力亮相世界舞臺
    美國時間2月7-12日,AAAI 2020大會在紐約正式拉開序幕,AAAI作為全球人工智慧領域的頂級學術會議,每年評審並收錄來自全球最頂尖的學術論文,這些學術研究引領著技術的趨勢和未來。京東雲與AI在本次大會上有10篇論文被AAAI收錄,涉及自然語言處理、計算機視覺、機器學習等領域,充分展現了京東用技術驅動公司成長的發展模式以及技術實力,技術創新和應用落地也成為這些論文最吸引行業關注的亮點。
  • 騰訊AI Lab入選20篇論文,含2篇Spotlight
    被譽為神經計算和機器學習領域兩大頂級會議之一的NIPS於近日揭曉收錄論文名單,此次為第32屆會議,將於 12 月 3 日至 8 日在加拿大蒙特婁舉辦。 騰訊AI Lab第三次參加NIPS,共有20篇論文入選,其中2篇被選為亮點論文(Spotlight),涵蓋遷移學習、模仿學習、半監督學習等多個研究主題,去年我們入選論文8篇,含1篇口頭報告(Oral)。
  • 機器學習頂會ICML 2018:復旦大學副教授獲最佳論文亞軍 騰訊清華...
    今年ICML 2018共入圍621篇論文,我國騰訊、清華、北大等研究機構也在論文入選排行榜上佔據一席之地。簡介:通常機器學習系統只考慮最大化整體的準確率,導致模型無法識別少數群體,這會造成少數群體在整體數據中的流失。該論文研究的是在不知道用戶分布的情況下,如何保證重複損失最小化的算法公平性。
  • 福州小夥2篇論文入選國際頂級學術會議
    東南網6月5日訊(福建日報APP-新福建記者 張穎)日前,由國際機器學習學會(IMLS)主辦的年度機器學習國際頂級會議——ICML (International Conference on Machine Learning,即國際機器學習大會)2020公布了1088篇入選論文名單。