學界|2016 ICML 微軟研究者提交的十八篇論文(附論文)

2021-02-20 機器之心

選自 blogs.msdn.microsoft

作者: Athima Chansanchai

機器之心編譯

參與:微胖

機器學習覆蓋面廣。在微軟,機器學習被用來偵測謊言,識別人類反應以及預測財務狀況以及提升搜索、自然語言處理、廣告、安全以及遊戲等。這個範圍很廣的領域正通過人工智慧和雲觸及我們日常生活,而且發展迅猛。


紐約微軟研究實驗室的機器學習專家 John Langford 說,機器學習正在發揮作用。給許多對未來很有意義的應用帶來了巨大變化。他也是 ICML 的大會主席。由於機器學習技術的成功,ICML人數也增長了65%。搞清楚如何使用數據幫助人們做決定,正是機器學習想要做的事情。

機器學習節省大量時間。先進的分析和數據科學資源使得決策過程變得迅速。


較之前些年,現在,我們看到了更多神經網絡以及深度學習方面的工作和進展。有很多人從事不同主題研究。這次會議是有史以來最大規模的 ICML。 這一領域真地在快速壯大。

6月19日,關注機器學習、算法以及系統的 ICML 將如期召開。會議包括專題報告、 接收論文演講以及談論更多近期研究的研討會。近3千名與會者參加為期五天的會議。

微軟一直在這個機器學習社區深耕多年。幾十年來,微軟一直支持者機器學習研究。今年雖然提交了1300多份論文,不過,只有332篇論文被接收,其中,有18篇論文是與微軟研究人員合著。


其中,No Oops, You Won’t Do It Again: Mechanisms for Self-correction in Crowdsourcing (by Nihar Shah at UC Berkeley ,Dengyong Zhou of Microsoft Research) 關注的是使用自我校正機制(self-correction mechanism)提升數據質量。

CryptoNets: Applying Neural Networks to Encrypted Data with High Throughput and Accuracy, (by Nathan Dowlin of Princeton; Ran Gilad-Bachrach, Kim Laine, Kristin Lauter, Michael Naehrig , John Wernsing of Microsoft Research)  觀察了機器學習如何幫助維護隱私以及醫療、金融以及其他敏感數據安全。這些研究都涉及了一種方法:允許個人以加密方式將個人數據傳輸到主持網絡的雲服務,保護數據隱秘性,因為雲端沒有接觸解碼密鑰的渠道。

Doubly Robust Off-policy Value Evaluation for Reinforcement Learning (by Nan Jiang at the University of Michigan and Lihong Li of Microsoft Research) 研究的是,根據從一個不同的強化學習決策中收集到的數據來評估一個新決策的值。當我們將強化學習用來解決真實世界中的問題時,這個問題通常很關鍵。

其他被大會接收的論文還有:

1. Dropout Distillation

作者:Samuel Rota Bulò (FBK), Lorenzo Porzi (FBK), Peter Kontschieder (Microsoft Research Cambridge)

2. Parameter Estimation for Generalized Thurstone Choice Models

作者:Milan Vojnovic, Seyoung Yun (Microsoft)

3. Network Morphism

作者: Tao Wei (University at Buffalo), Changhu Wang , Yong Rui (Microsoft Research), Chang Wen Chen

4. Exact Exponent in Optimal Rates for Crowdsourcing

作者:Chao Gao and Yu Lu (Yale University), Dengyong Zhou (Microsoft Research)

5. Analysis of Deep Neural Networks with Extended Data Jacobian Matrix

作者: Shengjie Wang (University of Washington), Abdel-rahman Mohamed, Rich Caruana (Microsoft), Jeff Bilmes (University of Washington), Matthai Phlilipose, Matthew Richardson, Krzysztof Geras, Gregor Urban (UC Irvine), Ozlem Aslan

6. Analysis of Variational Bayesian Factorizations for Sparse and Low-Rank Estimation

作者: David Wipf (Microsoft Research)

7. Non-negative Matrix Factorization under Heavy Noise

作者:Jagdeep Pani (Indian Institute of Science), Ravindran Kannan, Chiranjib Bhattacharya , Navin Goyal (Microsoft Research India)

8. Optimal Classification with Multivariate Losses

作者: Nagarajan Natarajan (Microsoft Research India), Oluwasanmi Koyejo (Stanford University and University of Illinois at Urbana Champaign), Pradeep Ravikumar (UT Austin), Inderjit

9. Black-box Optimization with a Politician

作者:Sebastien Bubeck (Microsoft), Yin Tat Lee (MIT)

10. Efficient Algorithms for Adversarial Contextual Learning

作者: Vasilis Syrgkanis, Akshay Krishnamurthy and Robert Schapire (Microsoft Research)

11. Principal Component Projection Without Principal Component Analysis

作者:Roy Frostig (Stanford University), Cameron Musco , Christopher Musco (MIT), Aaron Sidford (Microsoft Research)

12. Faster Eigenvector Computation via Shift-and-Invert Preconditioning

作者: Dan Garber (TTI Chicago), Elad Hazan (Princeton University), Chi Jin (UC Berkeley), Sham, Cameron Musco (MIT), Praneeth Netrapalli , Aaron Sidford (Microsoft Research)

13. Efficient Algorithms for Large-scale Generalized Eigenvector Computation and CCA

作者: Rong Ge and Chi Jin (UC Berkeley), Sham, Praneeth Netrapalli , Aaron Sidford (Microsoft Research)

14. The Label Complexity of Mixed-Initiative Classifier Training

作者: Jina Suh (Microsoft), Xiaojin Zhu (University of Wisconsin), Saleema Amershi (Microsoft)

15. Bayesian Poisson Tucker Decomposition for Learning the Structure of International Relations

作者:Aaron Schein, Mingyuan Zhou, Blei David (Columbia), Hanna Wallach (Microsoft)

除了以上論文,還有兩個與微軟研究人員合作的研討會:Multi-View Representation Learning(與 Xiaodong He,Scott Wen-tau Yih )以及 Advances in non-convex analysis and optimization (by Praneeth Netrapalli)

©本文由機器之心編譯,轉載請聯繫本公眾號授權

✄---

加入機器之心(全職記者/實習生):hr@almosthuman.cn

投稿或尋求報導:editor@almosthuman.cn

廣告&商務合作:bd@almosthuman.cn

相關焦點

  • ICML 2019收錄774篇論文:谷歌153篇,清華北大26篇
    據統計,今年大會收到3424份提交申請,共有774篇論文被收錄,接收率為22.6%。一位來自博世公司的網友Andreas Doerr對這份名單按作者和機構進行了分類統計。由於圖片尺寸較大,我們只展示其中一部分。
  • ICML 2018 | 騰訊張潼中8篇論文,清華排名國內居首:大會論文接收情況一覽
    ICML 2018 於 7 月 10 日在瑞典斯德哥爾摩舉行,今日該會議公布了接收論文列表,本次會議共收到 2473 篇論文,621 篇被接收,
  • ICML 2016精選論文
    每年的各大頂級會議、研討班錄用好幾千篇論文,即便是親臨現場也很難追蹤到所有前沿信息。在時間和精力有限的情況下,選擇精讀哪些論文,學習哪些熱門技術就成為了AI學者和從業人員頭疼的問題。本欄目就是要幫助大家篩選出有意思的論文,解讀出論文的核心思想,為精讀提供閱讀指導。
  • 資源 NIPS 2016上22篇論文的實現匯集
    日前,LightOn CEO 兼聯合創始人 Igor Carron 在其博客上放出了其收集到的 NIPS 2016 論文的實現(一共 22 個)
  • ICML, KDD, SIGIR論文接受率回顧與2021提交時間一覽
    相比去年774篇收錄,3424份提交申請,以及22.6%的接收率,雖然在錄取的「絕對數量」上面有所增長,但是分母的增長,也帶來了錄取率的下降。2021年的錄取率怎麼樣呢?歡迎加入ICML'21,吃瓜,討論群KDD 2020 官方發布接收論文,共有1279篇論文提交到Research Track,共有216篇接受,接受率16.8%。
  • ACL 2020:微軟摘得最佳論文,Bengio論文獲時間檢驗獎,大陸論文量第二
    在陸續放出時間檢驗獎、終身成就獎和傑出服務獎之後,ACL 2020 終於公布了今年的最佳論文獎。該獎項由來自微軟研究院、華盛頓大學和加州大學歐文分校的研究者摘得,主題是與任務無關的 NLP 模型測試方法。
  • ICML 2021剛剛做出了一個「艱難的決定」:將論文接收率直接砍掉10%
    今天,馬裡蘭大學計算機系副教授 Tom Goldstein 在推特上表示,他從一位 ICML 2021 主席那兒獲知,大會主辦方正準備削減本次的論文接收數量。「請與您的SAC一起提升水準,AC/SAC 不再僅因為未出現錯誤就同意接收一篇論文。」ICML 是機器學習領域最重要的會議之一,在該會議上發表論文的研究者也會備受關注。
  • KDD2016落幕,雅虎獲最佳論文,附10年最佳論文合集
    KDD2016吸引了來自全球的專家學者3000餘人,涵蓋數據挖掘、知識發現、數據科學等領域。作為數據科學的頂級盛宴,KDD的演講報告、接受論文都代表了人工智慧領域的最新進展和最前沿應用。● ● ●亞熱帶地中海氣候賦予了這個城市獨特的冬暖夏涼、陽光充足,同時也造就了獨一無二的舊金山灣區、金門大橋和漁人碼頭。
  • 硬核ICML 2019最佳論文出爐
    本屆大會共收到3424篇論文投稿,其中774篇被接收(接收率為22.6%)。今日,大會放出了最佳論文。7 篇最佳論文提名獎介紹了此屆 ICML 的兩個新變化:高風險高獎勵論文;提交代碼。所以 ICML 2019 為這樣的論文設計了 High Risk High Reward 特殊類別,也就是 5% 的接收論文屬於高風險高獎勵論文。此外,ICML 2019 還公布了代碼提交情況。ICML 大會今年做出的一項重要改變是:為了促進可復現性,委員會鼓勵提交的論文附帶代碼。
  • 吳恩達建議這麼讀論文(附機器學習研究者的養成指南)
    此外其它很多研究者也有自己獨特的見解,吳恩達在斯坦福 CS230 課程中專門開了一課介紹論文怎麼看、研究怎麼做;Reddit 社區資深研究者對於快速做 ML 產品、高效做 ML 研究都有獨門秘籍。這樣以來,你學到的知識除滿足日常工作所需之外,才不會停滯不前,也不會陷入到所謂的舒適區域。充實機器學習領域知識的方法很多,主要有閱讀教材書、學位論文和其他論文,並從這些源材料中復現算法。在研究生涯初期,作者建議把時間重新分配在教材書和論文上,重點選擇一部分來消化貫通,同時基於自己感興趣的論文來復現模型和算法。
  • ICML 2021傑出論文公布!上交大校友折桂,田淵棟rebuttal加分論文獲榮譽提名
    本次會議共收到5513篇論文投稿,接收1184篇論文,其中包含1018篇短論文和166篇長論文,接收率為21.48%,近五年最低。在接收的一千多篇論文中,組委會最終挑出了四篇論文,分別頒發了一個傑出論文獎,三個傑出論文提名獎。
  • 機器學習研究者的養成指南,吳恩達建議這麼讀論文
    此外其它很多研究者也有自己獨特的見解,吳恩達在斯坦福 CS230 課程中專門開了一課介紹論文怎麼看、研究怎麼做;Reddit 社區資深研究者對於快速做 ML 產品、高效做 ML 研究都有獨門秘籍。這樣以來,你學到的知識除滿足日常工作所需之外,才不會停滯不前,也不會陷入到所謂的舒適區域。充實機器學習領域知識的方法很多,主要有閱讀教材書、學位論文和其他論文,並從這些源材料中復現算法。在研究生涯初期,作者建議把時間重新分配在教材書和論文上,重點選擇一部分來消化貫通,同時基於自己感興趣的論文來復現模型和算法。
  • 學界 | 微軟亞洲研究院CVPR 2017 Oral論文:逐層集中Attention的卷積模型
    通過計算機視覺方法識別紋理細密的物體種類已經受到了學界的強烈關注。
  • 【腦洞大開】IBM AAAI2018論文DLPaper2Code:自動從深度學習論文生成執行代碼程序(附作者博士論文下載)
    在最近的一次人工智慧頂級會議NIPS 2016 上總共有總共有2500篇投稿,錄用了大概685篇,而他們的主題都是「深度學習或者神經網絡」。但是大部分被錄用的論文都沒有提供相應的實現代碼,在NIPS 2016 上101/567也就是僅僅大概18%的的論文開源了他們的代碼。對於深度學習並不精通的軟體工程來說,實現論文中的代碼往往要花費數天時間。
  • Quora:暮光之城女主角文章毫無價值,算不上人工智慧論文
    論文地址:https://arxiv.org/pdf/1701.04928v1.pdf總共3頁。1.難點在於找到一個足夠輕量(lightweight)的解決方案(vgg16 vs vgg19),並且設置降噪的常規。 如果你把文章中的「Kristen Stewart」 名字去掉,ML 界不會有人看這篇論文超過兩次,這麼說你應該能理解其中的科學含量有多少了。除此之外,這一文章也是一個減少 Erdős–Bacon 數量的嘗試。顯然,這是實實在在的。
  • CVPR2019提交論文爆炸增長!有效論文數達5165,在線編輯器一度崩潰
    今天,CVPR2019程序主席微軟華剛在朋友圈透露,他和另外三位程序主席一起清點完CVPR2019的送審論文,發現:CVPR2019一共收到5165篇有效投遞論文,比去年CVPR2018增加了56%。CVPR2019一共有7144篇論文提交,數量龐大。
  • 資源 | 從文本到視覺:各領域最前沿的論文集合
    RobustFill:無需程式語言,讓神經網絡自動生成程序》3.DeepCoder: Learning to Write Programs時間:2016 年 11 月 7 日地址:https://arxiv.org/pdf/1611.01989解讀:《學界 | 劍橋與微軟提交ICLR 2017論文提出DeepCoder:組合其它程序代碼生成新程序
  • NeurIPS 2019最佳論文出爐,今年增設「新方向獎」,微軟華人學者獲經典論文獎
    大會評委還希望能夠避免一些效率低下、過於複雜的論文,推薦一些趨勢性的傑出文章,為此增設了傑出新方向論文獎,以表彰那些為未來研究提出新方向的傑出工作。此外,大會還推薦了另外4篇獲得最佳論文提名的文章。最佳論文今年分別各有一篇文章獲得傑出論文獎和傑出方向論文獎,另外各有兩篇獲得相應提名。
  • 一周論文 ACL 2016 十篇論文:Logic Form、NMT、Summarization、QA、Chatbot等
    世界頂級語言學會議 ACL 2016 已經落下帷幕,機器之心發布了多篇關於此次會議的文章:深度 | 自然語言處理頂級會議ACL2016
  • 乾貨 KDD 2016最佳論文及全部208篇入選論文下載
    由ACM知識發現及數據挖掘專委會(SIGKDD)主辦的數據挖掘研究領域頂級年會——ACM SIGKDD(簡稱KDD)將於2016由Yi Chang等幾位雅虎研究員撰寫的論文「Ranking Relevance in Yahoo Search」在今年同時斬獲了KDD和WSDM的最佳論文獎(Best Paper Award),其主要創新點包括排序算法、語義匹配特徵和查詢重構。