引用次數最多的深度學習論文出自誰手?(無監督學習/生成模型篇)

2020-12-27 雷鋒網

雷鋒網AI科技評論:我們通常都會學習前輩或大牛的經典作品,而引用次數自然也成為了論文的一個重要標杆。在GitHub上,@Terryum整理了一份精心編寫的論文推薦列表,其中包含了在深度學習領域中引用次數最多的前100篇論文(自2012年起)。

有一些深度學習論文,無論它們屬於哪個應用領域,都值得仔細研習。文章在精不在多,雷鋒網提供的這些文章,都被認為是值得一讀的優秀論文。囿於篇幅限制,雷鋒網(公眾號:雷鋒網)整理編譯了無監督學習/生成模型的七篇論文,並增加了論文的概要,方便讀者快速了解。

自然圖像分布的建模在無監督學習中是一個裡程碑式的難題,因為圖像的高維度和高結構性,建模時需要考慮模型的可表達性,可控性和可擴展性,這使得很多模型在建立時以犧牲性能為代價,才能提取出有意義的圖像表徵。來自Google的Aaron van den Oord,Nal Kalchbrenner和Koray Kavukcuoglu在《Pixel Recurrent Neural Networks》一文中提出了一種能連續預測圖像像素的二維RNN模型(PixelRNN)和全卷積網絡CNN模型(PixelCNN)。作者對原像素的離散概率建模,並編碼了完整的圖像依賴關係。模型在MNIST和CIFAR-10上進行了測試,取得的對數似然函數值明顯優於當下的技術發展水平。最後作者還給出了PixelRNN生成的一個樣本定性評估。

[1] Pixel recurrent neural networks (2016), A. Oord et al. [pdf]

來自OpenAI 的多位技術專家聯合發表了一篇名為《Improved Techniques for Training GANs》的論文,他們在論文中給出了訓練GAN模型時應用的一些技巧。這些技巧的應用使得他們在MNIST,CIFAR-10和SVHN數據集的半監督分類問題中取得了目前技術發展的最高水平。視覺圖靈測試證實了模型生成圖像的高質量,連肉眼也無法分辨模型生成的MNIST樣本和真實數據的區別,而模型生成的CIFAR-10樣本,人類判斷的錯誤率為21.3%。模型生成的ImageNet樣本更是達到了空前未有的解析度。作者在文章提出,這些技巧使得模型能夠學習ImageNet類的可辨別特徵。

[2] Improved techniques for training GANs (2016), T. Salimans et al. [pdf]

近幾年在計算機視覺領域,卷積神經網絡在有監督學習問題上得到了大量應用,而在無監督學習問題上卻鮮少有人關注。Alec Radford,Luke Metz和Soumith Chintala在論文《Unsupervised representation learning with deep convolutional generative adversarial networks》中介紹了一類名為深度卷積生成式對抗網絡(DCGAN)的CNN模型,並認為這種模型很適合無監督學習問題。通過在不同的圖像數據集上訓練,模型在生成器和判別器上,從物體物件到場景圖像,都能學習到的一種層次的表徵。最後,將學習到的特徵應用到新任務中,證明了它們作為通用圖像表徵的適用性。

[3] Unsupervised representation learning with deep convolutional generative adversarial networks (2015), A. Radford et al. [pdf]

《DRAW: A Recurrent Neural Network For Image Generation》一文出自Google的DeepMind實驗室,介紹了一種可應用於圖像生成的Deep Recurrent Attentive Writer(DRAW)神經網絡模型,此模型能夠生成高質量的自然圖像,並提高了當前在MNIST數據集上生成模型表現的最好水平。此外,使用SVHN數據集訓練的DRAW模型生成的圖片,裸眼無法分辨其與真實數據的區別。

[4] DRAW: A recurrent neural network for image generation (2015), K. Gregor et al. [pdf]

作為生成對抗網絡(GAN)的開山之作,《Generative Adversarial Nets》論文初次提出了這種對抗過程估計生成模型的新框架,文中同時訓練了兩個模型,一個生成模型G(獲取數據分布),一個判別模型D(估計樣本來自訓練數據集或者生成模型G 的概率)。生成模型G的訓練目標是最大化判別模型D犯錯的概率。這個模型類似於兩個人在玩極小極大算法的遊戲。對於任意的函數G和D,存在唯一解,使得G恢復訓練數據分布,而D處處為1/2。 當G和D由多層感知器定義時,整個系統都可以用反向傳播算法來訓練。在訓練和樣本生成過程中不需要任何的馬爾科夫鏈或者unrolled approximate inference。實驗通過對生成樣本的定性和定量評估,證明了此框架的潛力。

[5] Generative adversarial nets (2014), I. Goodfellow et al. [pdf]

在面對連續的潛變量,複雜的後驗分布和數據集龐大的情況下,貝葉斯概率模型(directed probabilistic models)如何進行有效的推理和學習?Diederik P. Kingma 和Max Welling在《Auto-Encoding Variational Bayes》一文中提出了一種隨機變分推理和學習算法,能夠適應龐大的數據集和弱可微條件。論文提出了一種新的變分下界估計,可以直接應用SGD來優化和調整。另外,論文引入了自動編碼變分貝葉斯(AEVB),這是針對有效推理和學習的一種高效算法。

 [6] Auto-encoding variational Bayes (2013), D. Kingma and M. Welling [pdf]

「有沒有可能從無標籤的圖像數據中學習一個面部特徵器?」《Building High-level Features Using Large Scale Unsupervised Learning》一文討論了關於大規模無監督高層特徵構建的問題。論文作者基於龐大的圖像數據集,訓練了一個9層的局部連接稀疏自編碼網絡模型,模型帶有池化層和局部對比歸一化層。通過模型並行化和異步SGD在1000個機器(16000個核)上訓練了3天,由此證明了從無標籤圖像數據中訓練面部特徵器是可行的。對照實驗表明,訓練出來的特徵探測器在平移,縮放和平面外旋轉上都體現了魯棒性。除此之外,相同網絡對於其他高層概念的探測表現的很靈敏,比如對貓臉、人類身體結構的探測。通過這些學習到的特徵,訓練的網絡在識別22000類物體的ImageNet數據集上獲得了15.8%的準確率,相對之前的最高水平有了70% 的性能提升。

[7] Building high-level features using large scale unsupervised learning (2013), Q. Le et al. [pdf]

本文只介紹了列表中屬於無監督學習/生成模型的七篇引用次數最多的論文,對於其他類別的論文,請參考作者其他編譯文章或者原文連結:https://github.com/terryum/awesome-deep-learning-papers#unsupervised--generative-models,雷鋒網編譯。

雷鋒網版權文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 引用次數最多的深度學習論文出自誰手?無監督學習/生成模型篇
    雷鋒網AI科技評論:我們通常都會學習前輩或大牛的經典作品,而引用次數自然也成為了論文的一個重要標杆。在GitHub上,@Terryum整理了一份精心編寫的論文推薦列表,其中包含了在深度學習領域中引用次數最多的前100篇論文(自2012年起)。有一些深度學習論文,無論它們屬於哪個應用領域,都值得仔細研習。
  • 深度 計算機視覺和深度學習領域,被引用次數最多的三十篇論文(附下載)
    不過,2012年以來,這個領域變了很多,當時深度學習技術開始成為潮流,而且在許多計算機視覺基準方面其表現超過了傳統方法。無論這一趨勢是否能夠持久,我認為,應該將這些技術放入名單。正如我提到的那樣,被引越頻繁未必意味著文章貢獻越大。不過,高引證率經常暗示著人們已經發現了某些有趣的東西。據我所知,以下就是計算機視覺和深度學習領域被引最多的論文。
  • (免費下載)深度學習 Top100:近 5 年被引用次數最高論文
    【導讀】這裡是近5年100篇被引用次數最多的深度學習論文,覆蓋了優化/訓練方法、無監督/生成模型、卷積網絡模型和圖像分割
  • 【資源】深度學習Top100:近5年被引用次數最高論文(下載)
    這裡是近5年100篇被引用次數最多的深度學習論文,覆蓋了優化/訓練方法、無監督/生成模型、卷積網絡模型和圖像分割/目標檢測等十大子領域。重要的論文能夠超越其應用領域讓人獲益。新智元在每個領域都選擇了一篇論文重點介紹,這將是你縱覽深度學習研究絕好的開始。這裡是100篇被引用次數最多的深度學習論文,從海量的相關論文中脫穎而出。
  • 深度 一篇文章帶你進入無監督學習:從基本概念到四種實現模型(附論文)
    除了基本概念,本文還介紹了無監督學習的四種實現模型:聚類學習、自動編碼器、生成模型、PredNet。前幾日,Culurciello 教授根據最近無監督學習的發展對此篇文章進行了更新與調整,機器之心對此進行了編譯。文中提到的論文可點擊「閱讀原文」下載。
  • 機器學習和深度學習引用量最高的20篇論文(2014-2017)
    Pham機器之心編譯參與:邵明、黃小天機器學習和深度學習的研究進展正深刻變革著人類的技術,本文列出了自 2014 年以來這兩個領域發表的最重要(被引用次數最多)的 20 篇科學論文,以饗讀者機器學習,尤其是其子領域深度學習,在近些年來取得了許多驚人的進展。重要的研究論文可能帶來使全球數十億人受益的技術突破。這一領域的研究目前發展非常快,為了幫助你了解進展狀況,我們列出了自 2014 年以來最重要的 20 篇科學論文。
  • 引用次數最多的七篇深度學習論文出自誰手?Hinton、Yoshua榜上有名
    據悉,為快速識別代表委員,AI小明項目組抓取了數萬張照片對小明進行模型訓練;與此同時,三角獸科技為了讓「小明」了解代表委員的履職情況,分析了 40 多萬篇有關媒體報導和官方報告對其進行訓練,從 29 萬個詞彙中挖掘出近 5000 個與兩會相關的關鍵詞,並據此整理出針對每一位代表委員的個性化報導。   光明日報為何要嘗試人工智慧?
  • 2016深度學習重大進展:從無監督學習到生成對抗網絡 | 網際網路數據...
    過去幾年,深度學習成為了機器學習社區的核心話題,2016 年更是如此。在 Tryo Labs 的這篇盤點文章中,作者回顧了對該領域貢獻最大(或有潛力的)的進展以及組織和社區如何保證這些技術能以一種使所有人都受益的方式被使用。
  • 8篇論文深入學習深度估計:深度預測;自我運動學習;觀看《冰雪奇緣...
    Video (CVPR 2017)論文連結:https://arxiv.org/abs/1704.07813v2這篇論文的作者提出了一種無監督的學習框架,用於完成從非結構化視頻序列中進行單目深度和攝像頭  移動估計的任務。
  • 有監督學習:從過去到現在的模型流行度(深度翻譯好文)!
    在分析中包括以下13種監督方法:神經網絡,深度學習,SVM,隨機森林,決策樹,線性回歸,邏輯回歸,泊松回歸,嶺回歸,套索回歸,k近鄰,線性判別分析和對數線性模型。其中,對於套索回歸,搜索時考慮了搜索套索回歸和套索模型。
  • 世界上被引用次數最多的科學論文
    一篇就足夠了,這可是全世界被引用次數最多的論文。截至2004年1月,這篇題為《用Folin-酚試劑測量蛋白質》的生物學論文已經獲得了275699次引用。論文中,洛瑞根據自己在美國紐約公共健康研究所作的研究,提出了一種測定蛋白含量的方法。
  • ​2018深度學習引用數最高的十大論文
    魯棒性的開源工具、雲計算以及大量可用的數據是深度學習能夠取得成功的重要基石。下面,我們列出2018年度十大深度學習論文:R., Joel V et al (2015) (Cited: 2,086)這篇論文開發一種被稱為深度「Q-網絡」的新型人工智慧體。利用最近在深度神經網絡訓練方面的進展,我們使用一種端到端強化學習策略,直接從高維的傳感輸入中學習成功的策略。此外,這種智能體已經在經典 Atari 2600 遊戲的一些挑戰性領域中的得到了測試。
  • 海康威視提出:無監督圖像分類的深度表徵學習
    論文:https://arxiv.org/abs/2006.11480最近因為工作原因,對半監督和無監督論文比較感興趣,今天看到一篇講圖像分類無監督的文章"Unsupervised Image Classification
  • 【深度】自監督學習,如何從數據困境中拯救深度學習?
    然而監督式學習過於依賴大規模標註數據集,數據集的收集和人工標註需耗費大量的人力成本。自監督模型解決了這一難題,它能夠從大規模未標記數據中學習圖像特徵,而無需使用任何人工標註數據。每個深度學習實踐者都認同的一件事是:深度學習模型是數據低效的。
  • 深度 | 當前最好的詞句嵌入技術概覽:從無監督學習轉向監督、多任務學習
    目前最常用的模型是 word2vec 和 GloVe,它們都是基於分布假設(在相同的上下文中出現的單詞往往具有相似的含義)的無監督學習方法。儘管像平均詞嵌入這樣簡單的基線也能夠一直給出很好的實驗結果,但一些新的類似於無監督和監督學習以及多任務學習的方法,在 2017 年底 2018 年初出現在了人們的視野中,並且取得了令人矚目的性能提升。讓我們快速瀏覽一下目前研究出來的四種嵌入方法吧:從簡單的詞向量平均的基線到無監督/監督學習方法,以及多任務學習方案(如上文所述)。
  • DCGAN:深度卷積生成對抗網絡的無監督學習,補全人臉合成圖像匹敵真實照片
    最近做了一個項目,使用深度卷積生成對抗網絡進行圖像補完,取得了非常不錯的效果。作者 Alec Radford, Luke Metz, Soumith Chintala 表示,據他們所知,當時還沒有任何事實證據表明在使用 SGD 和小的學習率的情況下,只通過一個階段的訓練模型就記住了樣本。
  • 深度學習:基於語境的文本分類弱監督學習
    深度學習:基於語境的文本分類弱監督學習 丁磊 發表於 2021-01-18 16:04:27 高成本的人工標籤使得弱監督學習備受關注。seed-driven 是弱監督學習中的一種常見模型。
  • 機器學習實戰-監督學習、無監督學習
    上一篇:機器學習實戰-特徵選擇之遞歸特徵消除最近兩天收到同學的私信,對於算法中的一些監督學習,無監督學習不是很了解,也不知道從何下手,本篇小編就來介紹一下這三者是什麼東西。在監督學些中,最常見的是回歸與分類,常見的算法有KNN,SVM,隨機森林等無監督學習相比於監督學習,無監督學習,其實就是少了這個監督,也就是沒有標籤。
  • 大盤點:Top100 深度學習論文+7 篇下載量最多的 AI 研究文章!
    從人臉識別到網頁新聞推薦,都有它的身影,而這些也離不開深度學習。深度學習從大量數據中學習樣本數據的內在規律,最終讓機器能夠像人一樣具有分析學習能力,能夠識別文字、圖像和聲音等,並在語音和圖像識別方面取得巨大的成果。
  • 【PyTorch 挑戰 TensorFlow】28303 篇 arXiv 論文看深度學習 6 大趨勢
    cat=)呢?它的功能很酷:只需要輸入關鍵詞,就可以看到該詞的搜索量隨時間變化的情況。這個產品在一定程度上啟發了我,恰巧我有在過去五年中發表在(arxiv)機器學習論文資料庫(http://arxiv-sanity.com/)上的28303篇論文,所以我想,為什麼不研究一下該領域發展變化的情況呢?研究結果相當有趣,所以我決定跟大家分享一下。