NeurIPS 2017 論文 2018 年引用量排名揭曉,這裡是排名前三的論文...

2020-11-22 雷鋒網

雷鋒網 AI 科技評論按,12 月上旬,NeurIPS 2018 在加拿大蒙特婁會展中心(Palais des Congrès de Montréal)成功舉辦,雷鋒網對此進行了報導。今年的會議在主題活動、投稿論文數量和參會人數上,相比往年都上了一個新臺階。NeurIPS 2018 吸引了近九千人參加,最終 1010 篇論文被接收,其中,有四篇論文被評為最佳論文,接收的覆蓋了十大研究領域。

看完新論文,別忘舊論文。日前,學術頭條對入選 NeurIPS 2017 的論文在 2017.12 至 2018.12 之間的引用量進行了統計,引用量超過 100 的論文有 19 篇,論文名單如下:

可以看到,引用量排名前三的論文分別是 Attention Is All You Need、Improved Training of Wasserstein GANs 和 Dynamic Routing Between Capsules。此前,雷鋒網(公眾號:雷鋒網)對這幾篇論文也有過解讀,今天,就和大家一起再複習下吧。

這是谷歌與多倫多大學等高校合作發表的一篇論文,他們提出了一種新的網絡框架——Transformer。Transformer 是完全基於注意力機制(attention mechanism)的網絡框架,放棄了 RNN 和 CNN 模型。

眾所周知,在編碼-解碼框架中,主流的序列傳導模型都是基於 RNN 或者 CNN,其中能完美連接編碼器和解碼器的是注意力機制。而谷歌提出的這一新框架 Transformer,則是完全基於注意力機制。

Transformer 用於執行翻譯任務,實驗表明,這一模型表現極好,可並行化,並且大大減少了訓練時間。Transformer 在 WMT 2014 英德翻譯任務上實現了 28.4 BLEU,改善了現有的最佳成績(包括超過 2 個 BLEU 的集合模型),在 WMT 2014 英法翻譯任務中,建立了一個新的單一模式,在八個 GPU 上訓練了 3.5 天后,最好的 BLEU 得分為41.0,這在訓練成本最小的情況下達到了最佳性能。由 Transformer 泛化的模型成功應用於其他任務,例如在大量數據集和有限數據集中訓練英語成分句法解析的任務。

注意力機制是序列模型和傳導模型的結合,在不考慮輸入輸出序列距離的前提下允許模型相互依賴,有時(但是很少的情況),注意力機制會和 RNN 結合。

模型結構如下:

編碼器:編碼器由 6 個完全的層堆棧而成,每一層都有兩個子層。第一個子層是多頭的 self-attention 機制,第二層是一層簡單的前饋網絡全連接層。在每一層子層都有 residual 和歸一化。

解碼器:解碼器也是由 6 個完全相同的層堆棧而成,每一層有三個子層,在編碼棧的輸出處作為多頭的 attention 機制。

注意(attention):功能是將 Query 和一組鍵-值對映射到輸出,那麼包括 query、鍵、值及輸出就都成為了向量。輸出是值的權重加和,而權重則是由值對應的 query 和鍵計算而得。

在該論文中,蒙特婁大學的研究者對 WGAN 進行改進,提出了一種替代 WGAN 判別器中權重剪枝的方法。

論文摘要

生成對抗網絡(GAN)將生成問題當作兩個對抗網絡的博弈:生成網絡從給定噪聲中產生合成數據,判別網絡分辨生成器的的輸出和真實數據。GAN 可以生成視覺上吸引人的圖片,但是網絡通常很難訓練。前段時間,Arjovsky 等研究者對 GAN 值函數的收斂性進行了深入的分析,並提出了 Wasserstein GAN(WGAN),利用 Wasserstein 距離產生一個比 Jensen-Shannon 發散值函數有更好的理論上的性質的值函數。但是仍然沒能完全解決 GAN 訓練穩定性的問題。

所做工作

通過小數據集上的實驗,概述了判別器中的權重剪枝是如何導致影響穩定性和性能的病態行為的。

提出具有梯度懲罰的 WGAN(WGAN with gradient penalty),從而避免同樣的問題。

展示該方法相比標準 WGAN 擁有更快的收斂速度,並能生成更高質量的樣本。

展示該方法如何提供穩定的 GAN 訓練:幾乎不需要超參數調參,成功訓練多種針對圖片生成和語言模型的 GAN 架構。

WGAN 的 critic 函數對輸入的梯度相比於 GAN 的更好,因此對生成器的優化更簡單。另外,WGAN 的值函數是與生成樣本的質量相關的,這個性質是 GAN 所沒有的。WGAN 的一個問題是如何高效地在 critic 上應用 Lipschitz 約束,Arjovsky 提出了權重剪枝的方法。但權重剪枝會導致最優化困難。在權重剪枝約束下,大多數神經網絡架構只有在學習極其簡單地函數時才能達到 k 地最大梯度範數。因此,通過權重剪枝來實現 k-Lipschitz 約束將會導致 critic 偏向更簡單的函數。如下圖所示,在小型數據集上,權重剪枝不能捕捉到數據分布的高階矩。

由於在 WGAN 中使用權重剪枝可能會導致不良結果,研究者考慮在訓練目標上使用 Lipschitz 約束的一種替代方法:一個可微的函數是 1-Lipschitz,若且唯若它的梯度具有小於或等於 1 的範數時。因此,可以直接約束 critic 函數對其輸入的梯度範數。新的 critic 函數為:

使用 GAN 構建語言模型是一項富有挑戰的任務,很大程度上是因為生成器中離散的輸入輸出序列很難進行反向傳播。先前的 GAN 語言模型通常憑藉預訓練或者與監督最大似然方法聯合訓練。相比之下,使用該論文的方法,不需採用複雜的通過離散變量反向傳播的方法,也不需要最大似然訓練或 fine-tune 結構。該方法在 Google Billion Word 數據集上訓練了一個字符級的 GAN 語言模型。生成器是一個簡單的 CNN 架構,通過 1D 卷積將 latent vector 轉換為 32 個 one-hot 字符向量的序列。

該文提供了一種訓練 GAN 的穩定的算法,能夠更好的探索哪種架構能夠得到最好的生成模型性能。該方法也打開了使用大規模圖像或語言數據集訓練以得到更強的模型性能的大門。

本論文在github上開源了代碼:github

本論文同時也提供了詳細的數學證明,以及更多的示例,進一步了解請閱讀原論文:Improved Training of Wasserstein GANs

為了避免網絡結構的雜亂無章,Hinton 提出把關注同一個類別或者同一個屬性的神經元打包集合在一起,好像膠囊一樣。在神經網絡工作時,這些膠囊間的通路形成稀疏激活的樹狀結構(整個樹中只有部分路徑上的膠囊被激活),從而形成了他的 Capsule 理論。Capsule 也就具有更好的解釋性。

Capsule 這樣的網絡結構在符合人們「一次認知多個屬性」的直觀感受的同時,也會帶來另一個直觀的問題,那就是不同的膠囊應該如何訓練、又如何讓網絡自己決定膠囊間的激活關係。Hinton 這篇論文解決的重點問題就是不同膠囊間連接權重(路由)的學習。

解決路由問題

首先,每個層中的神經元分組形成不同的膠囊,每個膠囊有一個「活動向量」activity vector,它是這個膠囊對於它關注的類別或者屬性的表徵。樹結構中的每個節點就對應著一個活動的膠囊。通過一個迭代路由的過程,每個活動的膠囊都會從高一層網絡中的膠囊中選擇一個,讓它成為自己的母節點。對於高階的視覺系統來說,這樣的迭代過程就很有潛力解決一個物體的部分如何層層組合成整體的問題。

對於實體在網絡中的表徵,眾多屬性中有一個屬性比較特殊,那就是它出現的概率(網絡檢測到某一類物體出現的置信度)。一般典型的方式是用一個單獨的、輸出 0 到 1 之間的回歸單元來表示,0 就是沒出現,1 就是出現了。在這篇論文中,Hinton 想用活動向量同時表示一個實體是否出現以及這個實體的屬性。他的做法是用向量不同維度上的值分別表示不同的屬性,然後用整個向量的模表示這個實體出現的概率。為了保證向量的長度,也就是實體出現的概率不超過 1,向量會通過一個非線性計算進行標準化,這樣實體的不同屬性也就實際上體現為了這個向量在高維空間中的方向。

採用這樣的活動向量有一個很大的好處,就是可以幫助低層級的膠囊選擇自己連接到哪個高層級的膠囊。具體做法是,一開始低層級的膠囊會給所有高層級的膠囊提供輸入;然後這個低層級的膠囊會把自己的輸出和一個權重矩陣相乘,得到一個預測向量。如果預測向量和某個高層級膠囊的輸出向量的標量積更大,就可以形成從上而下的反饋,提高這兩個膠囊間的耦合係數,降低低層級膠囊和其它高層級膠囊間的耦合係數。進行幾次迭代後,貢獻更大的低層級膠囊和接收它的貢獻的高層級膠囊之間的連接就會佔越來越重要的位置。

在論文作者們看來,這種「一致性路由」(routing-by-agreement)的方法要比之前最大池化之類只保留了唯一一個最活躍的特徵的路由方法有效得多。

網絡構建

作者們構建了一個簡單的 CapsNet。除最後一層外,網絡的各層都是卷積層,但它們現在都是「膠囊」的層,其中用向量輸出代替了 CNN 的標量特徵輸出、用一致性路由代替了最大池化。與 CNN 類似,更高層的網絡觀察了圖像中更大的範圍,不過由於不再是最大池化,所以位置信息一直都得到了保留。對於較低的層,空間位置的判斷也只需要看是哪些膠囊被激活了。

這個網絡中最底層的多維度膠囊結構就展現出了不同的特性,它們起到的作用就像傳統計算機圖形渲染中的不同元素一樣,每一個膠囊關注自己的一部分特徵。這和目前的計算機視覺任務中,把圖像中不同空間位置的元素組合起來形成整體理解(或者說圖像中的每個區域都會首先激活整個網絡然後再進行組合)具有截然不同的計算特性。在底層的膠囊之後連接了 PrimaryCaps 層和 DigitCaps 層。

膠囊效果的討論

在論文最後,作者們對膠囊的表現進行了討論。他們認為,由於膠囊具有分別處理不同屬性的能力,相比於 CNN 可以提高對圖像變換的健壯性,在圖像分割中也會有出色的表現。膠囊基於的「圖像中同一位置至多只有某個類別的一個實體」的假設也使得膠囊得以使用活動向量這樣的分離式表徵方式來記錄某個類別實例的各方面屬性,還可以通過矩陣乘法建模的方式更好地利用空間信息。不過膠囊的研究也才剛剛開始,他們覺得現在的膠囊至於圖像識別,就像二十一世紀初的 RNN 之於語音識別——研究現在只是剛剛起步,日後定會大放異彩。

論文全文參見:https://arxiv.org/pdf/1710.09829.pdf

對這三篇論文感興趣的朋友們,可以點擊如下地址,查看更多更詳細的解讀:

谷歌推出基於注意機制的全新翻譯框架,Attention is All You Need!

蒙特婁大學研究者改進Wasserstein GAN,極大提高GAN訓練穩定性

終於盼來了Hinton的Capsule新論文,它能開啟深度神經網絡的新時代嗎?

雷鋒網版權文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • SIGIR 2020開幕在即,一文詳解過去五年引用量TOP論文
    入圍論文在 2015 年至 2019 年的五年間,在 SIGIR 發表的論文作者,男性比例佔據了 84%,女性僅佔 16%;這些作者主要來自美國、中國、義大利、日本、英國等國家。根據對近 5 年 SIGIR 論文的關鍵詞提取,可以看到 SIGIR 的關鍵詞主要集中在信息檢索、網絡檢索、問答、社交網絡等領域。
  • 2018年中國高校發表SCI論文綜合排名報告
    在過去的2018年裡,我國科研論文發表數量和質量依然呈現出持續增長的趨勢。據SCI資料庫最新檢索至少包含一位中國作者的論文結果顯示,去年中國科研人員發表SCI論文的總數已累計39萬餘篇,較2017年(33萬餘篇)約增長18.2%,位居世界第二。其中,各高校在JCR一區期刊上發表的論文總數超過51000篇,較2017年(43000餘篇)增長約18.6%。
  • 中國SCI論文中化學學科論文最多,被引用次數排名世界第1位
    國際高被引論文數量世界排名第二 2009-2019年被引用次數處於各學科世界前1%的論文稱為高被引論文。中國高被引論文數為30755篇,佔世界份額為20.0%,數量比2018年增加了23.9%,排在世界第2位,位次比上一年度上升一位,佔世界份額提升了近3個百分點。
  • 資訊丨LetPub最新發布《2017年中國高校發表SCI論文數量排名》
    在剛剛過去的2017年,我國科研論文發表數量依然呈現出持續增長的趨勢。
  • 2018年中國卓越科技論文超31萬篇,臨床醫學論文數最多
    新華社北京11月19日電 中國科學技術信息研究所19日發布的中國卓越科技論文產出狀況報告顯示,2018年中國卓越科技論文共計31.59萬篇,比2017年增加12.4%,包括卓越國際科技論文14.45萬篇,卓越國內科技論文17.15萬篇。
  • 軟科發布2018年ARWU排名,看你心儀的日本大學排名如何!
    今年ARWU列出了1000所全球學術領先的研究型大學,前500名屬於全球領先的500所研究型大學,排名在501-1000的學校被稱為「世界500強潛力高校」。下面跟蔚藍留學小編一起看一下2018ARWU軟科世界大學學術排名之日本大學排名:ARWU世界大學學術排名的參考依據是:1. 曾經有教師或校友獲得過諾貝爾獎或菲爾茲獎的大學;2. 有高被引科學家的大學;3. 過去10年中所有在《自然》 (Nature) 或《科學》 (Science) 雜誌上作為通訊作者單位發表過論文的大學;4.
  • GPT-3獲NeurIPS最佳論文獎,華人學者獲經典論文獎
    包括GPT-3在內的三篇獲得最佳論文獎,一篇2011年論文獲得時間檢驗獎。時間檢驗獎NeurIPS每年都會從大約十年前的大會上選取一篇論文,授予時間檢驗獎清華大學計算機系2008年本科畢業生。該公司2017年被蘋果以2億美元收購。
  • 2018年ESI(最新)中國大學綜合排名TOP100,這個排名有點靠譜!
    2018年ESI中國大學綜合能力排名前100名已經公布了,本次評估結果是在11月公布的,是最新一期的學校排名。U.S NWES大學排名由《美國新聞與世界報導》發布,該排名比較晚,2014年10月28日開始首次發布世界大學排名,依據的是大學的學術水平以及國際聲譽等十項指標,同樣是世界學校的重要參考指標。
  • 國內高引論文排行榜,中國科學院排名第一,大連理工大學挺進前十
    文|冷絲欄目|絲說大學校園這幾天又一份關於高校和科研院所的排行榜引起了人們的關注——愛思唯爾中國學者和科研單位高引論文排行榜,中國科學院排名第一,清華大學和北京大學分別排名第二和第三,大連理工大學挺進前十名。
  • 2019全球園藝學高被引論文及高產作者排名
    本次發布的是園藝學高被引論文和高產作者,令人疑惑的是一些論文是水稻和玉米的,也出現在列表中。一些高產作者從沒發表過園藝作物的論文竟然也出現在名單中。因此這個表單僅供參考了!Web of Science核心合集收錄的2014-2018年的SCI和SSCI論文數據,檢索時間為2019年9月。
  • 中國國際論文被引用數 排名上升至全球第二位
    中國國際論文被引用數排名上升至全球第二位(厲害了,中國科技)  本報北京10月31日電 (記者劉詩瑤)科技部中國科學技術信息研究所31日發布的最新中國科技論文統計結果顯示:2007年至2017年10月我國科技人員發表的國際論文共被引用19335萬次,較2016年統計時增加29.9%,排名比去年上升兩位,超越英國和德國躍居世界第二位。
  • 2018年納米技術熱點論文文獻計量分析 曹原魔角石墨烯論文登頂
    2018年共出版了222篇與納米技術相關的熱點論文,其中中美大學的出版量最大。環境和能源相關問題是這些文章中調查的最重要的主題之一; 石墨烯及其衍生物佔有這些納米材料研究論文的最高比例。在2018年發表的所有納米技術論文中,222篇被認為是過去兩個月的熱點論文。這些論文總共被引用了8,000多次。
  • 2018年中國科技論文統計結果發布 國際頂尖學術期刊發表論文數居...
    原標題:國際頂尖學術期刊發表論文數居全球第四 11月1日上午,中國科學技術信息研究所發布中國科技論文統計結果。統計顯示,我國科技論文產出轉向高質量發展階段,在國際頂尖學術期刊上發表論文數量排名前進到世界第4位,發表在各學科最具影響力國際期刊上的論文數量連續第八年排在世界第2位,其中材料科學領域論文被引用次數保持世界首位。 據統計,2017年被引次數超過10萬次且影響因子超過35的國際期刊有7種,包括《自然》、《科學》等。
  • 論文主題、引用量、中國機構 & 華人學者,KDD 2020 關鍵數據搶先看
    自 1995 年以來,KDD 已經連續舉辦了二十餘屆大會,今年是第 26 屆。今年的 KDD 大會原定於2020 年 8 月 23 日 ~27 日在美國美國加利福尼亞州聖地牙哥舉行。而由於疫情影響,本次大會將以線上形式舉行。前兩個月,KDD 2020 官方發布接收論文,共有1279篇論文提交到Research Track,共有216篇接受,接受率16.8%。
  • 2018中國高校ESI排名情況統計:看看哪所大學上升了,誰退步了?
    近一年,ESI百強高校國際排名如下(中國地質大學、中國石油大學和中國礦業大學三所高校並沒有區分兩地辦學的情況;近一年平均排名為六期ESI排名的平均值;近一年進步位次=2017年11月國際排名-2018年9月國際排名):ESI前1%學科數
  • 2018 年重磅復盤:中國產出全球 25% AI 論文、政府署名 AI 論文...
    第一份報告《AI Index 2017》於 2017 年 12 月份正式推出,上個月 17 日,第二份報告《AI Index 2018》如期發布。經雷鋒網 AI 科技評論分析,與上一年相比,《AI Index 2018》的分析指標更全面細緻,同時不再只注重於北美地區的 AI 活動分析。
  • 多學科類科學期刊排名發布 《自然》居首
    ,分列第一、三、五位。Nature是2013年世界上被引用最多的科學期刊,高達590, 324次,另有8篇論文列入2013年Altmetric 最受關注的百篇論文榜 **。NPG旗下期刊共有18篇論文進入該榜單。
  • 中國高質量國際論文數排名世界第二!彰顯科技評價話語權提升
    2019年發表高質量國際論文數量最多的世界研究機構中,中國共有5所機構進入前十,其中中國科學院生態環境研究中心以發表492篇居研究機構類榜首,中國科學院化學研究所則以377篇位居第三。在高質量國際論文統計中,2019年中國共有8個學科領域高質量國際論文數量在學科排名中列世界首位,另有4個學科領域排名世界第二。
  • 2018世界大學學術排行揭曉 法國高校仍表現不佳
    【環球網綜合報導】據法國商業調頻電視臺(BFMTV)8月15日報導,在最近頒布的軟科世界大學學術排名中,有19所法國大學進入前500強榜單,包括入圍百強的三所高校:第36位的索邦大學、第42位的南巴黎大學(巴黎十一大)和第64
  • 四年發表兩萬多篇論文,上海交大因此排名世界高校第二
    近日,荷蘭萊頓大學發布了2019年世界大學排行榜,針對全球各大高校的學術論文表現(2014-2017年)進行排行。具體指標有各大高校的學術論文發表數量、各個領域論文引用前50%、10%或前1%等等。根據榜單數據顯示,上海交大在2014至2017年的四年期間,共發表各類學術論文2.23萬篇,其中引用在前1%的論文數量有144篇,前1%論文佔論文總數的比例為0.6%。上海交大之後的國內高校,就是浙大,世界高校排名第四。