2017年裡,哪十篇 arXiv 機器學習論文在 Twitter 上最熱門?

2021-01-10 雷鋒網

雷鋒網 AI 科技評論按:隨著 2017 年結束、2018 年開始,各個媒體和研究者都撰寫了各自的年度總結和新年祝願。在過去一年的論文動態裡,除了研究者們在總結文裡根據自己的研究興趣選出論文回顧之外,我們也想看看論文在社交網絡上的傳播情況,看看廣大「群眾」都對哪些論文感興趣。

Twitter 上有個帳號 StatMLPapers 會每天摘錄20篇左右機器學習相關論文分別發推,2017年一年共發送了五千多條論文推特。我們找出了其中點讚最多的10條論文推特,給大家看看是哪10篇論文在twitter上得到了最多的關注。

Top 1. Don't Decay the Learning Rate, Increase the Batch Size

論文地址:https://arxiv.org/abs/1711.00489

內容簡介:當學習曲線不理想的時候,大家通常的選擇是選用更小的學習率。然而在這篇論文中作者提出此時應該換用更大的 batch size,這對 SGD、帶有動量的 SGD、動量 Nesterov、Adam 都有效。更大的 batch size 在同樣的訓練 epoch 之後可以達到同等的測試精度,而所需的參數更新操作更少,這讓更高的並行度和更短的訓練時間都成為可能。作者們還討論了幾個訓練參數之間如何協調。作者們最終用高達 65536 的 batch size 在 ImageNet 上訓練了 Inception-ResNet-V2,只經過 2500 次參數更新就達到了 77% 的驗證準確率。

神經網絡訓練和參數選擇對研究人員們來說往往是玄學般的存在,這篇論文確實幫大家解答了一些疑惑、給出了新的觀點和方法,同時也引發了研究者們之間的更多討論,是一篇有價值的論文。

Top 2. Stopping GAN Violence: Generative Unadversarial Networks

論文地址:https://arxiv.org/abs/1703.02528 

內容簡介:這是一篇非常嚴肅的論文(誤)。根據作者們所述,隨著生成性對抗式網絡 GANs 在研究界的流行,其中的「對抗性」也越來越多地激發了人性中的暴力。所以在這篇論文中,作者們對 GANs 引發的財經、社會、信仰、文化、語言以及皮膚問題進行了量化討論,並據此提出了生成式不對抗性網絡(Generative Unadversarial Networks,GUNs),以便為和平做出貢獻。網絡中的生成器 G 會盡力捕捉自己喜歡的數據分布,而鼓勵器 M 則會幫助 G 達到自己的目標。兩個模型間的衝突是絕對禁止的,而且它們能學會尊重它們之間的差別從而變得更好。這是一場共贏的比賽,雙方選手需要肩並肩嘗試達到最高的分數。實驗表明,在和睦的協作中,所提的模型得以同時佔據道德和對數似然的高地。論文的工作基於積蓄已久的、經過反覆詳細討論的匿名 YouTube 評論中的觀點立場,而這也表明了解決網絡和網絡之間的暴力問題需要 GUNs(guns)。

這篇論文正文中還有非常多的笑料,歡迎閱讀雷鋒網(公眾號:雷鋒網) AI 科技評論詳細報導文章「用充滿愛與和平的GUNs挑戰GANs?我可能看了篇假論文」

Top 3. Deep Probabilistic Programming

論文地址:https://arxiv.org/abs/1701.03757

內容簡介:這篇論文中,作者們提出了一種圖靈完備的概率程式語言「Edward」。論文中展示出,概率編程的靈活性和計算高效性就和傳統的深度學習一樣好。Edward 也可以集成在 TensorFlow 中,相比其它現有的概率系統取得了明顯的性能提升。這篇論文也被 ICLR 2017 接收。

4. Generalization in Deep Learning

論文地址:https://arxiv.org/abs/1710.05468 

內容簡介:如題,這篇論文圍繞深度學習領域最令人迷惑的開放性問題之一進行了討論,對深度學習模型雖然有很大的容量、可能的算法不穩定、不魯棒、尖銳極點等問題,但還是具有優秀的泛化性的性質給出了自己的解答。基於作者們的理論見解,這篇論文還提出了一組新的正則化方法,其中最簡單的方法也可以幫助基準模型在 MNIST 和 CIFAR-10 中取得有競爭力的表現。此外,這篇論文還提出了依靠數據和不依靠數據的泛化保證,並帶有更高的收斂速度。

5. Deep Learning: A Bayesian Perspective

論文地址:https://arxiv.org/abs/1706.00473 

內容簡介:這篇論文中,作者們把貝葉斯概率方法引入深度學習中,為深度學習找到更高效的優化算法和超參數調節方法。傳統的數據降維方法,PCA、PLS、RRR、PPR 等,在基於深度學習的降維方法面前都顯得效果一般。另一方面,貝葉斯正則化方法也可以在尋找網絡的權重和連接中起到重要作用,在預測偏差和穩定性之間取得更好的平衡。

6. GPflowOpt: A Bayesian Optimization Library using TensorFlow

論文地址:https://arxiv.org/abs/1711.03845 

內容簡介:又一篇貝葉斯相關的論文,這確實是今年的熱點話題之一。這篇論文介紹了用於貝葉斯優化的新 Python 框架 GPflowOpt。代碼庫基於熱門的高斯過程庫 GPflow,同時也利用到了自動微分、並行化和 GPU 加速等等 TensorFlow 提供的功能。框架已經經過了徹底的測試,文檔也編寫精美,同時提供了一定的拓展性。論文發表時的 GPflowOpt 發行版提供了標準的單一目標獲取函數、最先進的最大熵搜索以及貝葉斯多目標等方法。GPflowOpt 也提供了易用的自定義建模策略。

7. Dance Dance Convolution

論文地址:https://arxiv.org/abs/1703.06891

內容簡介:2017 年 3 月的時候遊戲 AI 還沒有現在這麼火熱,所以這篇用循環神經網絡和卷積神經網絡合力玩遊戲的論文在當時馬上引發了關注。這款遊戲名為 Dance Dance Revolution(勁舞革命),玩家需要跟著音樂的節奏,按遊戲的提示按下上下左右鍵,而這款 AI 的要做的就是為歌曲生成新的動作單(滿足玩家的新鮮感)。AI 模型也就很自然地分為了兩個部分,一部分決定何時布置下一個動作,另一部分選擇一個方向。作者們用 RNN+CNN 從低階音頻特徵中提取節奏特徵用來預測布置動作的時間;而方向選擇的生成式 LSTM 也比傳統的 n 元、固定窗口方法有更好的表現。

雷鋒網 AI 科技評論詳細報導請見 「人工智慧也能玩音樂遊戲,自動學習編曲變身勁舞大師」

8. How Well Can Generative Adversarial Networks (GAN) Learn Densities: A Nonparametric View

論文地址:https://arxiv.org/abs/1712.08244 

內容簡介:這篇論文討論了生成性對抗式網絡 GANs 學習數據密度時的收斂速度,同時加入了一些非參數化統計中的思想。作者們提出了一種改進的 GAN 估計器,通過利用目標密度和評價指標的一定光滑性,達到了更高的收斂速度,同時也理論上可以緩解其它文獻中提到的模式崩潰問題。作者們構建了一個極大極小下界,顯示出當維度很高是,這個新的 GAN 中的收斂速度的指數已經逼近了最優值。對於讀者來說,可以把這篇文章看作是對於「在層次化的評估指標下,GAN 學習各種各樣的、帶有不同的光滑性的密度的能力有多好」的回答。

9. A Closer Look at Memorization in Deep Networks

論文地址:https://arxiv.org/abs/1706.05394 

內容簡介:這篇論文研究了深度學習的記憶能力,嘗試在網絡容量、泛化能力和對抗性樣本的魯棒性之間建立聯繫。雖然深度神經網絡有能力記憶數據噪聲,不過作者們的研究結果表明,網絡還是傾向於先學習簡單的模式的。作者們通過實驗揭示了基於梯度優化的深度神經網絡在學習噪聲和真實數據之間的量化區別。同時,作者們也表明,對於適當選擇的顯式正則化方法(比如 dropout),用噪聲數據訓練網絡時可以降低網絡的表現,同時並不影響網絡在真實數據上的泛化性水平。作者們的分析還指出,獨立於數據集的「有效容量」這一概念並不能解釋用梯度方法訓練的深度神經網絡的泛化性表現,因為訓練數據自身就能夠對網絡的記憶水平產生影響。

10. On Unifying Deep Generative Models

論文地址:https://arxiv.org/abs/1706.00550 

內容簡介:生成式對抗性網絡 GANs 和變分自動解碼器 VAEs 都是強有力的深度生成學習範式,人們也往往把它們看作兩種迥異的方法,分別進行深入研究。這篇論文通過一種新的 GANs+VAEs 方程在這兩種方法之間建立了正式的聯繫。作者們表明,GANs 和 VAEs 根本上都是在縮小各自的後驗概率和推理分布的 KL 距離,只不過是在不同的方向上,從而分別產生了這兩種分時激活的算法。這篇論文中提出的統一視角為分析現有的各種模型變種提供了一個有力的工具,並且可以幫助前沿研究人員們以正式的方法交流觀點。量化實驗結果也表明了不同方法之間互相借用的拓展方法的通用性和有效性。


這十篇論文中毫不意外地包含了工程技術討論和新開發框架介紹的論文,而獨樹一幟的 GUNs (搞笑)論文也讓我們期待起2018年會不會有更多一本正經地搞笑、甚至就是完全開腦洞的論文呢?論文作者們自黑起來畢竟毫不客氣啊。希望2018年大家都能在做出成果、推動學術進步的同時,也在學術研究和社會生活中獲得更多的樂趣。

雷鋒網 AI 科技評論整理編譯

相關文章:

告別高潮迭起的 2017,2018 年人工智慧將走向何方?

回望2017,基於深度學習的NLP研究大盤點

2017年度人工智慧熱門事件大盤點,哪些令你印象最深刻?

迎來 PyTorch,告別 Theano,2017 深度學習框架發展大盤點

2018 年最值得期待的學術進展——致人工智慧研究者們的年終總結

雷鋒網版權文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • CVPR 2019接收論文公布:共1300篇,接收率降4%,你中了沒?
    昨天,一年一度的視覺頂會CVPR放出了今年的接收論文。翹首以盼多日的CV er紛紛前來圍觀,場面一下子好生熱鬧。官網數據顯示,本屆CVPR大會共收到5265篇有效投稿,共接收論文1300篇,接收率為25.2%。目前放出的只有接收論文的ID,組委會表示,Oral、Spotlight和Poster論文的評審結果改日再放。
  • ACL 2019最佳論文出爐:華人團隊包攬最佳長短論文一作,中科院、華為等榜上有名
    在WMT 2018(英語-德語SMT和NMT)的兩個數據集上進行基準測試,OpenKiwi在單詞級任務中達到了性能,在句子級任務中接近於最先進的性能。ACL 2019接收了765篇論文,接受率為25.8%,相較於前兩年的24%左右略有上升。其中,長論文接收了447篇,短論文接收213篇,34篇demo論文被接收,還有71篇student workshop。
  • 這個機器學習模型是怎麼辦到的?
    相關論文介紹該機器學習模型來自論文:Progressive Face Super-Resolution via Attention to Facial Landmark(https://arxiv.org/abs/1908.08239),論文提出了一種新的人臉識別方法,用這個方法可生成逼真的8倍超解析度的人臉圖像的同時,完全保留其面部細節。
  • AAAI 2021最佳論文獎出爐,北航成最大贏家,還有這樣一批華人學術新星!
    轉載自 | 機器之心第 35 屆 AAAI 人工智慧會議已於 2 月 2 日在線上召開。在剛剛舉行的開幕式上,組委會頒發了今年的最佳論文獎和提名獎,分別有三篇論文獲獎。其中來自北航的學者以一作身份分別獲得了一篇最佳論文獎和一篇提名獎。此外,會議還宣布了「學術新星獎」,共有多名華人獲得獎項。
  • 每日論文速遞:自然語言處理相關(12月24日更新版)
    Rajaram, Puneet Manchanda連結 | https://arxiv.org/abs/2012.12311 下載1:四件套在機器學習算法與自然語言處理公眾號後臺回復>「四件套」,即可獲取學習TensorFlow,Pytorch,機器學習,深度學習四件套!
  • CVPR 2019:華人斬獲兩篇最佳論文,李飛飛ImageNet十年後再獲殊榮
    今年的CVPR上,華人收穫頗豐,兩篇最佳論文和最具影響力論文獎有華人的身影。其中,來自卡內基梅隆大學的辛書冕等人獲得了最佳論文獎,而最佳學生論文獎被加州大學聖巴巴拉分校的王鑫等人獲得。李飛飛、李佳等人因 ImageNet的貢獻獲得最具影響力論文獎。
  • 每日論文速遞:自然語言處理相關(12月23日更新版)
    , Univ College London (2020)下載1:四件套在機器學習算法與自然語言處理公眾號後臺回復「四件套」>,即可獲取學習TensorFlow,Pytorch,機器學習,深度學習四件套!
  • ICCV 2017獎項公布:最大贏家何愷明獲最佳論文,參與最佳學生論文
    今日,大會公布了本屆 ICCV 的獲獎論文,Facebook AI 研究員何愷明獲得最佳論文獎,同時是最佳學生論文的作者之一。算上此前在 CVPR 2009、CVPR 2016 上的兩篇「最佳論文」,何愷明現在已獲得了四個最佳論文稱號。
  • 每日論文速遞:自然語言處理相關(12月7日更新版)
    /abs/2012.02197 下載1:四件套在機器學習算法與自然語言處理公眾號後臺回復「四件套」,即可獲取學習TensorFlow,Pytorch,機器學習,深度學習四件套!」,即可獲取195篇NAACL+295篇ACL2019有代碼開源的論文。
  • 生成對抗網絡GAN論文TOP 10
    本文列出了 10 篇關於 GAN 的論文,這些論文將為你提供一個很好的對 GAN 的介紹,幫助你理解最先進技術的基礎。該模型很難在本地機器上實現,而且 BigGAN 有許多組件,如 Self-Attention、 Spectral Normalization 和帶有投影鑑別器的 cGAN,這些組件在各自的論文中都有更好的解釋。不過,這篇論文對構成當前最先進技術水平的基礎論文的思想提供了很好的概述,因此非常值得閱讀。
  • [轉]正會最後一日,ACL 2017最佳論文和終身成就獎揭曉 | ACL 2017
    五篇獲獎論文今年的outstanding論文(也可以看作最佳論文的預選論文)共22篇,其中長論文15篇、短論文7篇,相比 ACL 2016 的共10篇有大幅增加。會議中也把這22篇論文分為了4組,在四個不同的session中演講。
  • 每日論文速遞:自然語言處理相關(11月13日更新版)
    /abs/2011.06380 下載1:四件套在機器學習算法與自然語言處理公眾號後臺回復「四件套」,即可獲取學習TensorFlow,Pytorch,機器學習,深度學習四件套!」,即可獲取195篇NAACL+295篇ACL2019有代碼開源的論文。
  • AAAI 2020最佳論文公布,800人缺席!Bengio支持的遠程參會請願書火了
    戳右邊連結上 新智元小程序 了解更多!作為2020年人工智慧學界的第一個頂會,AAAI 2020已經在美國紐約拉開了帷幕。今年AAAI大會主席是IBM 研究院的Francesca Rossi教授 ,杜克大學Vincent Conitzer教授、南加州大學沙飛教授是聯合程序主席。
  • 這篇綜述文章用166篇參考文獻告訴你答案
    來自港科大和第四範式的這篇綜述論文提供了解答。數據是機器學習領域的重要資源,在數據缺少的情況下如何訓練模型呢?小樣本學習是其中一個解決方案。來自香港科技大學和第四範式的研究人員綜述了該領域的研究發展,並提出了未來的研究方向。
  • 西電陳渤團隊兩篇論文被頂級會議錄用
    該會議是跨學科的,主要包括人工智慧和自然神經信息處理,代表著熱門科研領域的最前沿,具有廣泛而深遠的國際影響力。NeurIPS會議每年舉辦一次,是國際公認的機器學習和人工智慧研究領域頂尖會議,也是中國計算機學會 (CCF) A類top會議,代表著當今機器學習人工智慧領域的最高水平,受到來自學術界和工業界的共同關注。
  • 百篇最值得一讀的「認知圖譜」經典論文
    再來看看入選作者,有一位大佬有 4 篇論文入選,他正是 DeepMind 的研究科學家 Oriol Vinyals,在今年被評為 AI 2000 機器學習全球最具影響力學者之一。
  • 近萬人參與的CVPR2019全紀錄 | 含優秀論文解讀、全部論文下載
    )評審,評委們從50 篇最佳論文候選名單中評選出 4 篇獲獎論文,分別是 2 篇最佳論文榮譽提名、1 篇最佳學生論文和 1 篇最佳論文。50篇最佳論文候選名單今年的CVPR上,華人收穫頗豐,幾乎包攬了最佳論文、最佳學生論文和最具影響力論文獎。這些獎項分別由來自卡耐基梅隆大學的辛書冕等人、加州大學聖巴巴拉分校的王鑫等人和李飛飛團隊等人取得。
  • 每日論文速遞:自然語言處理相關(2月2日更新版)
    >在機器學習算法與自然語言處理公眾號後臺回復「四件套」,>即可獲取學習TensorFlow,Pytorch,機器學習,深度學習四件套!」,即可獲取195篇NAACL+295篇ACL2019有代碼開源的論文。
  • 百度17篇論文入選全球頂尖視覺盛會CVPR 百度大腦實力超群成幕後贏家
    隨著深度學習的迅猛發展,計算機視覺已成為人工智慧領域影響最深遠的技術之一。在計算機視覺領域深入研究、有著強大技術積累的百度,以 17 篇論文入選計算機視覺和模式識別大會 CVPR 2019,其不俗成績再次成為國際視覺頂級盛會中受矚目的「中國面孔」。
  • 最好的Python機器學習庫
    引言毫無疑問,神經網絡和機器學習在過去幾年一直是高科技領域最熱門的話題之一。這一點很容易看出,因為它們解決了很多真正有趣的用例,如語音識別、圖像識別、甚至是樂曲譜寫。因此,在這篇文章,我決定編制一份囊括一些很好的Python機器學習庫的清單,並將其張貼在下面。