一文讀懂 ICML 2020 論文入選數據

2020-12-13 鈦媒體APP

圖片來源@視覺中國

文丨學術頭條

6 月 3 日,國際機器學習頂會 ICML 2020 放出了論文接收結果。

據官方統計,ICML 2020 共提交 4990 篇論文,投稿數量再創新高,而最終接收論文 1088 篇,接收率 21.8%。與往年相比,接收率逐年走低。

近4年ICML論文接收情況

ICML 是機器學習領域最重要的會議之一,因此在該會議上發表論文的研究者也會備受關注。受到疫情影響,今年的 ICML 大會已經改為在 2020 年 7 月 13 日至 18 日線上舉行。

在ICML2020召開之前,我們根據論文作者,研究機構,國家和地區幾方面給出了對本屆ICML會議的基本統計數據,以便大家對此次會議有一個基本了解。

論文作者

讓我們首先來看一論文作者的排名(按論文數量)。

在 ICML 上發表論文是很困難的,因此能夠一次性發表多篇論文的作者會讓人印象深刻。來自日本理化學研究所(RIKEN)和東京大學的 Masashi Sugiyama 有 11 篇論文被接收,成為大會中被接收論文數量最多的作者。

在他之後是 Michal Valko(DeepMind)、Michael Jordan(UC Berkeley)以及 Dale Schuurmans(Google / U. of Alberta),三人均有 8 篇文章被接收。他們也是大多數論文的最後作者(這對大多數作者來說都是如此,許多人都是資深的資深研究者)。雖然沒有被列在這張圖的頂部,但是普林斯頓大學的 Chi Jin 作為第一作者的論文最多(3 篇第一作者論文超過 6 篇被接受的論文),而 Alexey Drutsa 是來自 YANDEX 的最多的單篇論文(2 篇論文是單獨作者超過 3 篇被接受的論文)。

排名前50的論文作者

從每篇論文的作者數量的分布來看,大多數論文有 3-4 個作者,但是也有一些例外情況,比如 15 個作者。

有 15 個作者的兩篇論文分別是:由來自谷歌、牛津大學、劍橋大學、哥倫比亞大學和伯克利大學 15 位研究者發表的論文《Stochastic Flows and Geometric Optimization on the Orthogonal Group》和來自天津大學、阿里巴巴、清華大學以及上海交大的 15 位研究者發表的論文《Dynamic Knapsack Optimization Towards Efficient Multi-Channel Sequential Advertising》。

國家地區

這一部分展示的是論文作者與其所在國家或地區之間的關聯,以便查看哪個國家或地區發表論文數量最多。這種關聯數據的統計可能會有偏差,主要是因為無法辨認的人名縮寫、不同人對同一機構的不同叫法、錯別字等問題。

不同國家的論文數統計

毫不意外,美國承包了絕大多數論文。美國研究者參與的論文有 728 篇,大約是論文總數的 3/4,與其他國家和地區相比具有巨大的優勢。

排在第二位的是英國(123 篇),第三位是中國大陸(122 篇),二者在接收論文數量上相差無幾,但同樣僅為美國的六分之一左右。

需要注意的是,國家或地區是根據組織機構的總部所在地而定,而非論文作者所在位置。因此,如果一位論文作者在 Google 蘇黎世工作,那麼該論文被計入美國,而不是瑞士。

儘管如此,統計數量和實際情況也相差不多。如果僅按照大學分類(全球只有一個從屬國家和地區的組織),那麼將得到下圖:

不同國家論文數(僅統計大學)

也就是說,即使不考慮企業機構的因素,美國研究者仍然參與了 ICML 發表論文的一半以上。如果加上所有在美國工作的工業界研究者,數量可能和之前的圖很接近。

值得一提的是,英國和中國大陸大約發表了相同數量的文章。

機構與組織

共有 494 個機構,362 所(73.3%)來自工業機構和 132(26.7%)來自學術界。587 篇論文(53.9%)純粹隸屬於學術研究,而只有 90 篇論文(8.3%)純粹來自工業研究組織,411 篇論文(37.8%)隸屬於兩者。

前 50 的機構發表了幾乎全部的論文,谷歌公司排名總體第一也是工業界排名的第一,谷歌的附屬機構 Deepmind 與 Google brain 也位於工業界排名的前 4 名,微軟公司在工業界排名第三。排名最高的大學分別為 MIT,Stanford,UC Berkeley,總體排名也僅次於 Google。在學術機構排名中 CMU 緊追上述 3 所大學排名第四。

總體排名及工業學術排名

讓我們再分別來看下論文數量排名靠前的幾個國家和地區機構的情況:

美國有大量的組織,無論是在工業還是在學術界,都有大量的論文。相反,英國的表現是由 DeepMind 領導的,其次是大學。

中國擁有強大的機構,但華為、阿里巴巴和百度等公司正在迎頭趕上。在加拿大,幾乎所有的論文都是大學發表的。另外除了美國和中國大陸,大多數國家和地區發表論文的頂級機構都是大學。從全球範圍看,大學發表的論文數量是公司的 3 倍。在美國以外,只有來自英國(DeepMind)、法國(Criteo)、中國大陸(華為、百度、阿里巴巴)、俄羅斯(Yandex)以及韓國(Samsung)的某些機構發表了 5 篇以上的論文。因此我們可以下結論說 ICML 仍然是以學術界為主導的會議。

參與每篇論文的組織數統計如下:

每篇論文參與的組織數

大多數論文有 1 或 2 個組織,但有些論文的撰寫有 7 個組織的參與。

兩篇有 7 個組織參與的論文分別是:由谷歌、微軟、華沙大學、阿姆斯特丹大學、加州大學歐文分校、蘇黎世聯邦理工學院以及倫敦帝國理工學院的研究者協作完成的《How Good is the Bayes Posterior in Deep Neural Networks Really?》和由蒙特婁大學、IIIT Hyderabad、麻省理工學院、Mila、德拉瓦大學以及 LinkedIn 等機構的研究者協作完成的《Learning To Navigate The Synthetically Accessible Chemical Space Using Reinforcement Learning》。

相關焦點

  • 一文速覽ICML2020高引論文與華人作者
    :據官方統計,ICML 2020 共提交 4990 篇論文,投稿數量再創新高,而最終接收論文 1088 篇,接收率 21.8%。接下來讓我們看看截至目前引用量較高的本次 ICML 會議論文以及中國機構和華人的表現吧。ICML AMiner:https://www.aminer.cn/conf/icml2020ICMl2020高引用量的論文Aminer 開發的 ICML 2020 頂會系統給出了本屆會議引用量排名靠前的論文。
  • ICML進行時|一文看盡獲獎論文及Google、Facebook、微軟、騰訊的最新科研成果
    今天,第35屆 ICML 大會在瑞典的斯德哥爾摩正式召開,與大家一同分享這一領域在這一年裡的突破。ICML 2018 共有 2473 篇論文投稿,共有 621 篇論文殺出重圍入選獲獎名單,接受率接近25%。其中 Google 強勢領跑,Deep Mind 、FaceBook和微軟也是精彩紛呈;而在高校中 UC Berkeley 和 Stanford 、CMU 以近 30 篇榮登 Top 榜。
  • 清華大四本科生2篇一作論文入選ICML 2020,後浪果然翻湧
    白交 發自 凹非寺量子位 報導 | 公眾號 QbitAIICML 2020放榜了。入選論文創新高,共有1088篇論文突出重圍。從整個榜單上看,谷歌仍為最強實力機構,共有138篇收錄(數據包含谷歌大腦、DeepMind)。
  • 北理工研二學生獲傑出論文獎!ICML 2020 大陸論文量居前三,各獎項出爐!
    這是因為,在下一像素預測(next pixel prediction)上訓練的足夠大的 transformer 模型最終可能學會生成具有清晰可識別物體的樣本。一旦學會了生成此類樣本,那麼通過「合成分析」,iGPT 將知道目標類別。實驗表明,iGPT 模型的特徵在大量的分類數據集上實現了當前 SOTA 性能,以及在 ImageNet 數據集上實現了接近 SOTA 的無監督準確率。
  • 近期必讀的六篇 ICML 2020【對比學習】相關論文
    代碼: https://github.com/google-research/simclr網址:https://proceedings.icml.cc/paper/2020/hash/36452e720502e4da486d2f9f6b48a7bb
  • ICML 2019最佳論文出爐 ETH、谷歌、劍橋分獲大獎
    論文錄取結果地址:https://icml.cc/Conferences/2019/AcceptedPapersInitial?)的論文,對近年來絕大多數的非監督解耦表示方法進行了探索、利用 2.5GPU 年的算力在 7 個數據集上訓練了 12000 多個模型。
  • ICML 2020 放榜:北理工碩士一作拿下傑出論文獎,清華大學佔據國內...
    論文標題:Gaussian Process Optimization in the Bandit Setting:No Regret and Experimental Design 論文連結:https://icml.cc/Conferences/2010/papers/422.pdf 這篇文章十年前發表在
  • 西安電子科技大學團隊論文被機器學習頂會ICML2020錄用
    未來網高校頻道6月30日訊(記者 楊子健 通訊員 馮毓璇)第37屆國際機器學習大會(International Conference on Machine Learning,https://icml.cc/)將於07月13日—07月18日,通過線上舉行。
  • ICML 2020百度AI之行:入選7篇論文 舉辦3場EXPO
    ICML 2020會議論文投稿量再創新高,接收率下降至21.8%左右。百度AI在激烈的投稿競爭中,成功入選論文7篇,涵蓋深度學習、遷移學習、自然語言處理、數據隱私以及語音等眾多熱門子領域;同時,百度AI積極申辦ICML EXPO,獲得3場舉辦資格,這是主辦方對百度AI技術實力的肯定,也展示出百度AI在全球人工智慧產業的行業領先地位。
  • 圍觀騰訊 AI Lab 的4篇 ICML 入選論文 | ICML 2017
    作為國內著名的人工智慧研究機構,騰訊 AI Lab 也有4篇論文入選了今年的 ICML。雷鋒網(公眾號:雷鋒網) AI 科技評論對這4篇論文簡單介紹如下。Hoi(新加坡大學信息系統學院),張潼(騰訊 AI Lab)論文簡介:條件梯度算法由於其應對大規模機器學習問題時高效的特點,近幾年來重新成為了研究的熱門話題。然而,目前為止的研究都沒有考慮過在線分布式環境下的算法表現,這種情況下本地的計算量就很輕微。在
  • ICML 2017首日公布兩大獎項:史丹福大學獲最佳論文獎
    據統計,ICML 2017 共評審了 1676 篇論文,接收了 434 篇,錄取率為 25.89%。在機器之心之前報導的論文中,也有眾多為 ICML 2017 所接收,比如百度有關 Deep Voice、Gram-CTC 的論文。據機器之心了解,騰訊 AI Lab 也有四篇論文入選 ICML 2017。
  • 一文讀懂「2020限塑令」!
    一文讀懂「2020限塑令」!06 16:58 來源:澎湃新聞·澎湃號·政務 一張圖讀懂限塑令新規
  • 一文盡覽 ICLR 2019 Facebook & Google 入選論文
    論文入選結果公布,各大公司和研究院紛紛在博客上公布了今年入選的論文。其中,Facebook 戰果滿滿,一共有 23 篇論文入選。值得注意的是,2018 年圖靈獎得主 Yann LeCun 是其中兩篇入選論文的共同作者之一。Facebook 人工智慧研究院研究員、圍棋項目負責人田淵棟博士也參與了其中兩篇論文的寫作。而一直備受關注的 Google 在今年也有 57 篇論文入選了 ICLR 2019,其中,oral 論文有三篇。
  • 南開數據安全團隊論文入選國際頂級學術會議
    南開新聞網訊 第三十屆USENIX Security國際頂級安全會議將於2021年8月在加拿大溫哥華舉行,南開大學網絡空間安全學院劉哲理教授帶領的數據安全團隊的論文「How to Make Private Distributed Cardinality Estimation Practical, and Get Differential
  • 獨家 | 一文讀懂Adaboost
    【集成學習】系列往期回顧:獨家 | 一文讀懂集成學習(附學習資源) 參考資料:1. 李航.《統計學習方法》2. 周志華.《機器學習》3. 曹瑩,苗啟廣,劉家辰,高琳. AdaBoost 算法研究進展與展望.
  • 聚焦遷移學習反向傳播缺陷,百度資深工程師帶來全新 ICML 工作分享
    其中,預訓練模型作為當下遷移學習的一種主流方法,讓「從零開始訓練一個新模型」的時代一去不復返。這類在大型數據集上訓練好的模型進行微調後,便能夠較好地適配類似的新目標任務,可以極大地節約時間和成本。      論文地址:https://proceedings.icml.cc/static/paper_files
  • 阿里7篇論文入選ICML 2020,達摩院讓機器學會「雙腦思考」
    ICML 2020放榜,接收率再創新低,為21.8%。縱覽榜單,中國學術界依然是清華領銜,公司維度上,阿里則以7篇論文入選的數量拔得頭籌。根據ICML官方資料,阿里7篇論文涵蓋在圖像識別、自然語言處理、搜索推薦等領域的研究成果。
  • ICML 2018入選論文名單公布,我國主力選手是清華和騰訊
    △Triplekill昨天,ICML 2018中選論文榜單公布,621篇論文披荊斬棘,衝出重圍。今年的競爭更加激烈,2473篇的投稿總數又突破了紀錄,比去年同樣成為歷史新高的1676篇,多出幾乎一半。有失落的選手收到評審組的郵件,其中顯示的入選論文是618篇。如果按照這個數字來算,那麼成功比例非常接近25%。只要再加上一篇,就會突破25%。據此,有人猜測評審組就是按這個比例來裁論文的。對比一下,去年的中獎率是25.89%,差距並不大,但人們還是感受到了愈加凜冽的比賽形勢。谷歌依舊?
  • 幾個主要機構在ICML 2019投遞的論文中重點關注的方向
    緊隨其後的就是以史丹福大學、MIT、CMU、UC伯克利為首的一流高校,他們都保持著論文高產的穩定趨勢。另外,歐洲的一些研究機構也榜上有名,比如 ETH、EPFL、INRIA 等學術機構。 通過上圖的統計還可以發現, ICML 會議論文的主要貢獻者還是學術研究機構,谷歌僅憑一己之力難以跟高校隊對抗,這和對整體情況的分析保持一致。
  • ICML 2019論文接收結果可視化:清華、北大、南大榜上有名
    大會共收到3424篇論文投稿,其中774篇被接收(接收率為22.6%)。近日,博世的分析人員根據接收論文列表做出了一份可視化圖表,從中可以看出各機構和作者的論文貢獻情況。接收論文列表:https://icml.cc/Conferences/2019/AcceptedPapersInitial排名前50的論文貢獻機構下圖顯示了ICML 2019接收論文貢獻排名前50的機構。排名以機構貢獻的論文總數為準,至少有一名作者隸屬於該機構,因此一篇論文可能出現在多個機構中。