ICML 2018最佳論文出爐:伯克利、MIT最佳論文,復旦大學榜上有名

2020-12-16 機器之心Pro

機器之心報導

機器之心編輯部

人工智慧頂級會議 ICML 2018 即將於 7 月 10 日至 15 日在瑞典首都斯德哥爾摩舉行。昨天,大會提前公布了最佳論文獲獎名單,在超過 600 篇被接收論文中,來自 MIT 和 UC Berkeley 的研究人員分享了最佳論文的殊榮。值得一提的是,此前攻破 ICLR 2018 大會七篇對抗樣本防禦方法的研究眾望所歸地成為了最佳論文。

而復旦大學副教授黃增峰一人署名的論文《Near Optimal Frequent Directions for Sketching Dense and Sparse Matrices》則和 DeepMind、史丹福大學的兩篇論文一同位居「亞軍」論文行列。

Best Paper Awards

來自 MIT 的 Anish Athalye 與來自 UC Berkely 的 Nicholas Carlini 和 David Wagner 獲得了最佳論文。早在今年 2 月份,這項攻破 ICLR 2018 七篇對抗樣本防禦論文的研究就引起了深度學習社區的熱烈討論。該研究定義了一種被稱為「混淆梯度」(obfuscated gradients)的現象。在面對強大的基於優化的攻擊之下,它可以實現對對抗樣本的魯棒性防禦。這項研究引起了深度學習社區的討論,GAN 提出者 Ian Goodfellow 也參與其中。機器之心曾對此做過報導。

論文:Obfuscated Gradients Give a False Sense of Security: Circumventing Defenses to Adversarial Examples

論文地址:https://arxiv.org/abs/1802.00420

項目地址:https://github.com/anishathalye/obfuscated-gradients

摘要:我們發現了一種「混淆梯度」(obfuscated gradient)現象,它給對抗樣本的防禦帶來虛假的安全感。儘管基於混淆梯度的防禦看起來擊敗了基於優化的攻擊,但是我們發現依賴於此的防禦並非萬無一失。對於我們發現的三種混淆梯度,我們會描述展示這一效果的防禦指標,並開發攻擊技術來克服它。在案例研究中,我們試驗了 ICLR 2018 接收的 8 篇論文,發現混淆梯度是一種常見現象,其中有 7 篇論文依賴於混淆梯度,並被我們的這一新型攻擊技術成功攻克。

來自 UC Berkeley EECS 的 Lydia T. Liu、Sarah Dean、Esther Rolf、Max Simchowitz 和 Moritz Hardt 的論文同樣也獲得了最佳論文獎。由於機器學習系統易受到數據偏見而導致歧視性行為,人們認為有必要在某些應用場景中用公平性準則約束系統的行為,並期待其能保護弱勢群體和帶來長期收益。該研究探索了靜態公平性準則的長期影響,發現結果和人們的期望相去甚遠。

論文:Delayed Impact of Fair Machine Learning

論文地址:https://arxiv.org/abs/1803.04383

摘要:機器學習的公平性主要在靜態分類設置中得到研究,但沒有關注這些決策如何隨時間改變潛在的群體。傳統的觀點認為公平性準能提升他們想保護的群體的長期利益。

我們研究了靜態公平性標準如何與暫時的利益指標相互作用,例如利益變量的長期提升、停滯和下降。我們證實了即使在一步反饋模型中,常見的公平性準則沒有隨時間帶來改善,並可能實際上給特定案例帶來傷害(無約束的目標函數反而不會)。

我們完整地總結了三個標準準則的延遲影響,對照了和這些準則的行為存在質的不同的制度。此外,我們發現一種自然形式的度量誤差可以放寬公平性準則能夠在其中順利執行的制度。

我們的結果強調了評估公平性準則的度量和時序建模的重要性,展示了一系列的新挑戰和權衡問題。

BAIR 博客此前曾經介紹過這篇論文,參見:前沿 | BAIR 探索機器學習公平準則的長期影響:對弱勢群體的善意真的種出了善果?

Best Paper Runner Up Awards

在最佳論文亞軍(Runner Up)論文中,復旦大學數據科學學院副教授黃增峰完成的在線流(online streaming)算法獲得了這一榮譽,黃增峰為這篇論文的唯一作者。該論文討論的這種在線流算法可以在只有非常小的協方差誤差的情況下,從大型矩陣抽取出最能近似它的小矩陣。

論文:Near Optimal Frequent Directions for Sketching Dense and Sparse Matrices

論文地址:http://203.187.160.132:9011/www.cse.ust.hk/c3pr90ntc0td/~huangzf/ICML18.pdf

摘要:給定一個 n×d 維的大型的矩陣 A,我們考慮計算一個 l×d 維的概要矩陣(sketch matrix)B,概要矩陣的維度 l 要顯著小於原矩陣 A,但它仍是矩陣 A 優良的近似。我們希望最小化協方差誤差:

現在我們考慮流模型(streaming model)中的問題,其中的算法只能在有限的工作空間內傳輸輸入一次。而流行的 Frequent Directions 算法(Liberty, 2013)與它的變體實現了最優空間和誤差間的權衡。然而運行時間是否能提升還是一個懸而未決的問題。在本論文中,我們幾乎可以解決這個問題的時間複雜度。特別是,我們提供了有更快運行時間的新型空間-最優(space-optimal)算法。此外,除非矩陣乘法的當前最優運行時間能顯著提升,否則我們算法的運行時間是近似最優的(near-optimal)。

對於大規模矩陣運算,精確的算法通常會非常慢,因此有非常多的研究聚焦於設計一種快速的隨機近似算法。為了加速計算,採用小矩陣近似大矩陣的矩陣概要是常用的技術。而在實際應用中,數據通常以流式的形式傳輸,將整個數據集儲存在主內存中通常是不切實際和不可能的。

在本論文中,作者黃增峰研究了在小的協方差下保留概要矩陣的在線流算法。在流模型中,輸入矩陣的行秩能一次降低到 1;該算法只允許在有限的工作空間內傳輸一次,這是持續保留概要矩陣所必須的。

流行的 Frequent Directions 算法在空間佔用和近似誤差間實現了最優的權衡,該算法目前已經廣泛應用於在線學習。然而,我們仍然不太清楚它們的運行時間是否能提升,也許我們只能寄希望於得到線性(稀疏)時間的算法,這在很多矩陣問題上是可能的。本論文主要由以下問題驅動:

是否存在輸入稀疏時間的 Frequent Directions 算法,能夠實現同等最優的空間-誤差權衡?

以下展示了黃增峰提出的主要算法,他的核心思想是在原始 FD 中使用快速逼近的 SVD,產生次優的時間。

來自 DeepMind 和牛津大學的研究者也獲得了 Best Paper Runner Up Awards。

論文:The Mechanics of n-Player Differentiable Games

作者:David Balduzzi, Sebastien Racaniere, James Martens, Jakob Foerster, Karl Tuyls, Thore Graepel

論文地址:https://arxiv.org/abs/1802.05642

摘要:支撐深度學習的基石是保證目標函數能利用梯度下降收斂到局部極小值。不幸的是,這個保證在某些情況下會失效,例如生成對抗網絡,其中有多個交互損失。在博弈中,基於梯度的方法的行為並沒有得到很好的理解,隨著對抗性和多目標架構的數量激增,這變得越來越重要。在這篇論文中,我們開發了新的技術來理解和控制一般博弈中的動態。主要的結果是將二階動態分解為兩個部分。第一個和潛博弈(potential game)相關,可以用內含的函數簡化為梯度下降;第二個和哈密頓博弈相關,這是一種新的博弈類型,遵循一種守恆定律——類似於經典力學系統中的守恆定律。該分解啟發了辛梯度調整(Symplectic Gradient Adjustment,SGA),這是一種用於尋找一般博弈中的穩定不動點的新算法。基礎實驗表明 SGA 的性能和近期提出的尋找 GAN 穩定不動點的算法不相上下,同時可以應用到更多的一般博弈中,並保證收斂性。

同樣獲得該榮譽的還有來自史丹福大學的研究者。

論文:Fairness Without Demographics in Repeated Loss Minimization

作者:Tatsunori Hashimoto, Megha Srivastava, Hongseok Namkoong, Percy Liang

論文地址:https://arxiv.org/abs/1806.08010

摘要:機器學習模型(如語音識別器)通常被訓練以最小化平均損失,這導致了表徵差異(representation disparity)——少數群體(如非母語說話者)對訓練目標函數的貢獻較少,並因此帶來了更高的損失。更糟糕的是,由於模型準確率會影響用戶保留,因此少數群體的數量會隨著時間而日益減少。本論文首先展示了經驗風險最小化(ERM)的現狀放大了表徵差異,這甚至使得最初公平的模型也變得不公平了。為了緩解這一問題,我們開發了一種基於分布式魯棒優化(distributionally robust optimization,DRO)的方法,可以最小化所有分布上的最大風險,使其接近經驗分布。我們證明了該方法可以控制每個時間步的少數群體風險,使其符合羅爾斯分配正義,同時該方法對群體的標識並不清楚。我們證明 DRO 可以阻止樣本的表徵差異擴大,而這是 ERM 做不到的,我們還在現實世界的文本自動完成任務上證明了該方法對少數群體用戶滿意度的改進。

相關焦點

  • ICML 2018大獎出爐:伯克利、MIT獲最佳論文,復旦大學榜上有名
    昨天,大會提前公布了最佳論文獲獎名單,在超過 600 篇被接收論文中,來自 MIT 和 UC Berkeley 的研究人員分享了最佳論文的殊榮。值得一提的是,此前攻破 ICLR 2018 大會七篇對抗樣本防禦方法的研究眾望所歸地成為了最佳論文。
  • ICML 2019最佳論文出爐 ETH、谷歌、劍橋分獲大獎
    新智元原創來源:Twitter、Reddit等編輯:金磊、小芹【新智元導讀】今日,國際機器學習頂會ICML公布2019年最佳論文獎:來自蘇黎世聯邦理工大學、谷歌大腦等的團隊和英國劍橋大學團隊獲此殊榮。另外,大會還公布了7篇獲最佳論文提名的論文。
  • 機器學習頂會ICML 2018:復旦大學副教授獲最佳論文亞軍 騰訊清華...
    智東西(公眾號:zhidxcom)文 | 心緣智東西7月12日消息,第35屆機器學習國際大會ICML 2018在7月10日至15日期間登陸瑞典斯特哥爾摩。ICML官網上提前公布了最佳論文名單,來自MIT和UC Berkeley的研究人員摘得最佳論文的桂冠。
  • 不被Hinton認同,否定同行成果,谷歌這篇研究拿下ICML最佳論文
    順便提一句,這是一項中選了ICLR 2019 workshop的研究,卻最終成了ICML的最佳論文。最佳論文2:稀疏變分高斯過程回歸的收斂速率今年ICML的第二篇最佳論文是來自英國劍橋大學和機器學習平臺Prowler.io的研究。
  • UC伯克利拿下EMNLP最佳論文,復旦黃萱菁當選下一屆程序主席
    作者 | 陳大鑫今日上午, EMNLP 2020各項大獎出爐!其中最佳論文獎由加州大學伯克利分校的David Gaddy、Dan Klein兩人獲得,愛丁堡大學華人博士生 Yanpeng Zhao 獲得了最佳論文榮譽提名獎(共4篇)。
  • ICML進行時|一文看盡獲獎論文及Google、Facebook、微軟、騰訊的最新科研成果
    而今年不得不說咱們國內的成績,雖然清華被收錄了 12 篇,相比之下還是有差距,不過相比往年的數量和今年如此激烈的競爭下,進步是不可忽視的,尤其是今年復旦大學的一篇論文與 DeepMind、史丹福大學的兩篇論文一同獲得 Runner Up 獎,騰訊 AI Lab 也是有超十篇論文被收錄,都讓我們對國內研究抱有更多的期待,也相信國內的研究所與高校在人工智慧領域的基礎性研究方面會取得更驕人的成績
  • ACL 2019最佳論文出爐:華人團隊包攬最佳長短論文一作
    郭一璞 安妮 邊策 發自 凹非寺量子位 出品 | 公眾號 QbitAIACL 2019最佳論文新鮮出爐了。剛剛,自然語言處理領域的頂會ACL 2019公布最佳論文,本次共頒布了4個獎項,共有8個獲獎名額,分別是:最佳長論文最佳短論文最佳DEMO論文
  • ICML 2019論文接收結果可視化:清華、北大、南大榜上有名
    大會共收到3424篇論文投稿,其中774篇被接收(接收率為22.6%)。近日,博世的分析人員根據接收論文列表做出了一份可視化圖表,從中可以看出各機構和作者的論文貢獻情況。接收論文列表:https://icml.cc/Conferences/2019/AcceptedPapersInitial排名前50的論文貢獻機構下圖顯示了ICML 2019接收論文貢獻排名前50的機構。排名以機構貢獻的論文總數為準,至少有一名作者隸屬於該機構,因此一篇論文可能出現在多個機構中。
  • 硬核ICML 2019最佳論文出爐
    本屆大會共收到3424篇論文投稿,其中774篇被接收(接收率為22.6%)。今日,大會放出了最佳論文。今年有兩支團隊收穫了最佳論文的獎項,來自劍橋大學、科技公司 PROWLER.io 的《Rates of Convergence for Sparse Variational Gaussian Process Regression》與蘇黎世聯邦理工學院(ETH)、德國馬普所、谷歌大腦共同完成的《Challenging Common Assumptions in
  • ICML 2018 | 清華排名國內居首:大會論文接收情況一覽
    本文介紹了在瑞典斯德哥爾摩舉行的機器學習技術國際會議(ICML)中接收論文的情況。[ 導讀 ] ICML 2018 於 7 月 10 日在瑞典斯德哥爾摩舉行,今日該會議公布了接收論文列表,本次會議共收到 2473 篇論文,621 篇被接收,接收率為 25.1%(與去年基本持平)。
  • ICML 2017首日公布兩大獎項:史丹福大學獲最佳論文獎
    今日,ICML 2017 公布了最佳論文、Test of Time Award 以及榮譽提名論文,共 7 篇獲獎論文。獲獎論文如下:最佳論文獎Honorable MentionsTest of Time AwardHonorable
  • ICML 2019 最佳論文公布:繼霸榜後,谷歌再添重磅獎項!
    據 ICML 2019 前不久公布的論文結果,今年大會共收到 3424 篇有效投稿論文,最終收錄的論文數量為 774 篇,接收率為 22.6%。而今天,萬眾矚目的 ICML 2019 最佳論文結果最新出爐,將會議推向了高潮。
  • ICML 2020論文貢獻榜排名出爐:Google單挑斯坦福、MIT、伯克利
    ICML 2020論文貢獻榜排名出爐,斯坦福則獲高校第一。國內高校、企業上榜。[ 導讀 ] ICML 2020論文貢獻榜排名出爐,Google在眾多企業中以壓倒性優勢拔得頭籌,斯坦福則喜獲高校第一。國內高校企業中,清華榮獲全球高校14名,百度、阿里、華為均上榜。
  • 【CVPR2018最佳論文重磅出爐】斯坦福伯克利折桂,何愷明獲TPAMI年輕研究員獎
    最佳論文最佳論文題目:Taskonomy: Disentangling Task Transfer Learning論文地址:https://arxiv.org/pdf/1804.08328.pdf作者來自史丹福大學和加州大學伯克利分校,包括計算機視覺領域的著名教授Jitendra
  • ICML 2019最佳論文:測試12000個模型後,谷歌質疑現有無監督分離式表徵學習
    大數據文摘出品當地時間6月12日,ICML 2019於美國長灘市公布了本屆大會最佳論文結果。谷歌大腦、MaxPlanck和蘇黎世聯邦理工學院合作的《挑戰無監督分離式表徵的常見假設》,以及劍橋大學的一篇《稀疏變分高斯過程回歸的收斂速率》作為最佳論文摘得桂冠。
  • 剛剛,ACL2019最佳論文獎出爐,劉群團隊獲最佳長論文獎
    雷鋒網 AI 科技評論按:剛剛,ACL2019最佳論文出爐,共八篇文章獲獎。其中包含一篇最佳長論文、一篇最佳短論文、五篇傑出論文、一篇最佳 Demo 論文。值得注意的是,最佳長論文獎、最佳短論文獎以及兩篇傑出論文獎(共5篇)一作皆為華人。其中最佳長論文獎由張文(計算所)、馮洋(計算所)、孟凡東(騰訊)、Di You(Worcester)和劉群(華為諾亞方舟)獲得。最佳短論文由俄亥俄州立大學的Nanjiang Jiang獲得。南京理工大學夏睿團隊和港科大的 Pascale Fung 團隊分別獲得了傑出論文獎。
  • CVPR 2018獎項出爐:兩篇最佳論文,何愷明獲PAMI 青年研究員獎
    據統計,本屆大會有超過 3300 篇的大會論文投稿,錄取 979 篇(接受率約為 29%,其中包括 70 篇 Oral 和 224 篇 Spotlight 論文)。而在一個小時前,最受關注的 CVPR 2018 最佳論文結果揭曉:來自史丹福大學和 UC Berkeley 的 Amir R.
  • KDD 2020最佳論文揭曉!杜克大學陳怡然組獲最佳學生論文獎
    【新智元導讀】KDD 2020最佳論文新鮮出爐!最佳學生論文、最佳論文亞軍均被華人學生(一作)摘得,來看看這些論文出自誰之手吧!KDD Best Paper 終於來了!受疫情影響,今年第26屆國際數據挖掘頂會 ACM SIGKDD 於8月23日-27日以虛擬線上方式召開。
  • ICLR 2019最佳論文出爐:微軟、MILA、MIT獲獎
    深度學習頂會 ICLR 2019 的兩篇最佳論文現已放出,來自蒙特婁大學、微軟研究院和 MIT CSAIL 的研究者獲得了最佳論文獎。其中一篇最佳論文探討自然語言處理問題,提出利用神經元排序將對自然語言層級結構的考慮納入網絡。另一篇最佳論文探討了模型壓縮問題,提出了一個新的概念:彩票假設。
  • 幾個主要機構在ICML 2019投遞的論文中重點關注的方向
    對比 ICML 2018 排名前20的機構對比 為了進一步了解 ICML 2018 與 2019 兩年接收論文的情況,營長根據論文第一作者的通訊單位對這兩年的論文進行統計與可視化,這裡主要展示論文接收數量排名前 20 的高校或企業。