原創 Synced 機器之心
機器之心報導
機器之心編輯部
國際數據挖掘頂會 KDD 2020 剛剛公布了最佳論文、最佳學生論文等多個獎項。最佳論文獎由谷歌的研究者摘得,最佳學生論文獎由杜克大學的 Ang Li、Huanrui Yang、陳怡然和北航段逸驍、楊建磊摘得。此外,湯繼良、盛勝利、唐傑等華人學者在本屆 SIGKDD 大會上也斬獲了多項大獎。
第 26 屆 ACM SIGKDD 知識發現和數據挖掘會議(KDD)將於太平洋標準時間 8 月 23 日 - 27 日以虛擬方式召開。剛剛,最佳論文、最佳學生論文等多個獎項悉數出爐。
KDD 會議始於 1989 年,是數據挖掘領域歷史最悠久、規模最大的國際頂級學術會議,也是首個引入大數據、數據科學、預測分析、眾包等概念的會議。儘管本次會議在線上舉辦,但仍然提供與往年相同的活動內容,包括主題演講、專題小組、特邀報告、精選研究、應用數據科學論文、信息實踐教程和 workshop。
KDD 2020 聯席主席 Rajesh K. Gupta 表示:「最初我們希望會議至少一部分是『面對面』的,但組委會最終決定,對於我們這個社區來說,以完全虛擬的方式舉行會議是最安全的選擇。」
KDD 2020 聯席主席、南加州大學計算機科學系副教授 Yan Liu 表示:「在過去的三十年裡,數據科學實現了爆炸式的增長,正在重塑著眾多不同的學科。KDD 2020 的應用數據科學特邀演講嘉賓就是一個例子,今年我們邀請到了 18 位業界領先的專家,他們來自西門子、微軟、Facebook、谷歌、亞馬遜和優步等頂尖企業。」
本次會議將包含 4 場主題演講、18 場應用數據科學特邀報告,217 篇接收論文將在包括口頭報告、workshop、tutorial 在內的共 43 場活動中分別進行展示。
4 場主題演講的內容分別是《Explanations that Matter through Meta-Provenance》、《AI for Intelligent Financial Services: Examples and Discussion》、《A Look at State-Space Multi-Taper Time-Frequency Analysis》、《Computational Epidemiology at the Time of COVID-19》。
最佳論文獎
今年的最佳論文獎由來自谷歌的研究者 Walid Krichene、Steffen Rendle 摘得,獲獎論文是《On Sampled Metrics for Item Recommendation》。
項目推薦(item recommendation)任務需要根據給定的條件對大型項目目錄進行排序。項目推薦算法是使用依賴於相關項目位置的排名度量指標來評估的。為了加快度量指標的計算,近來的一些研究經常使用抽樣的度量指標(sampled metrics),僅對較小的一組隨機項和相關項進行排序。Google 研究小組對這些抽樣指標進行了更詳細的研究,結果表明它們與其 exact version 不一致。也就是說,它們沒有保持 relative statements。
論文連結:http://walid.krichene.net/papers/KDD-sampled-metrics.pdf
展示頁面:https://www.kdd.org/kdd2020/accepted-papers/view/on-sampled-metrics-for-item-recommendation
最佳學生論文獎
最佳學生論文獎由杜克大學的 Ang Li、Huanrui Yang、陳怡然和北京航空航天大學的段逸驍、楊建磊摘得,獲獎論文是《TIPRDC: Task-Independent Privacy-Respecting Data Crowdsourcing Framework for Deep Learning with Anonymized Intermediate Representations》。
論文連結:https://arxiv.org/abs/2005.11480
展示頁面:https://www.kdd.org/kdd2020/accepted-papers/view/tiprdc-task-independent-privacy-respecting-data-crowdsourcing-framework-for
這篇論文的亮點在於:杜克大學的研究小組提出了一個任務獨立、尊重隱私的數據眾包框架——TIPRDC。它帶有匿名中間表徵。該框架的目標是學習一個能夠向中間表徵隱藏隱私信息的特徵提取器,同時最大限度地保留嵌入在原始數據中的原始信息,以供數據收集器完成未知的學習任務。
論文第一作者 Ang Li 是杜克大學電子和計算機工程系的一名在讀博士,導師為陳怡然和 Hai "Helen" Li 教授。Ang Li 的主要研究方向是移動和 IoT 平臺上的深度學習系統。在進入杜克大學之前,他曾在 2018 年獲得阿肯色大學計算機科學博士學位,2013 年獲得北京大學軟體工程碩士學位,2010 年獲得河南大學計算機科學本科學位。
他的導師陳怡然教授是 IEEE Fellow,本科和碩士就讀於清華大學,博士畢業於美國普渡大學,現任杜克大學電子與計算機工程系教授、杜克大學計算進化智能中心主任,同時也是美國 NSF 新型可持續智能計算中心主任。
最佳論文亞軍
來自維吉尼亞大學的 Mengdi Huai、Jianhui Sun、Renqin Cai、Aidong Zhang 和來自紐約州立大學布法羅分校的 Liuyi Yao 獲得了最佳論文的亞軍,獲獎論文是《Malicious Attacks against Deep Reinforcement Learning Interpretations》。
這篇論文將深度學習和強化學習結合(DRL),並證明了其在眾多序列決策問題中建模 dynamics 的能力。為了提高模型的透明度,已經有研究提出了針對 DRL 的各種解釋方法。但是,這些 DRL 解釋方法隱式地假定它們是在可靠和安全的環境中執行的,但在實際應用中並非如此。維吉尼亞大學的研究團隊調查了一些 DRL 解釋方法在惡意環境中的漏洞。具體而言,他們提出了第一個針對 DRL 解釋的對抗性攻擊的研究,提出了一個優化框架來解決所研究的對抗性攻擊問題。
創新獎
創新獎也是 KDD 大會頗具分量的獎項,旨在表彰在數據發現和數據挖掘領域做出傑出技術貢獻的研究者,這些貢獻對促進理論和 / 或商業系統的發展產生了持久的影響。它是數據發現和數據挖掘領域的最高技術獎項,獲獎者通常為某一領域的學術領袖。伊利諾伊大學香檳分校計算機系教授韓家煒、伊利諾伊大學芝加哥分校傑出教授劉兵、加拿大西蒙弗雷澤大學教授裴健和清華大學數據科學研究院院長俞士綸等華人學者都獲得過此獎項。
獲得 KDD 2020 創新獎的是康奈爾大學計算機科學與信息科學教授 Thorsten Joachims,獲獎理由是「他在機器學習方面的貢獻廣受認可,包括信息檢索中的人類偏見、支持向量機、結構化輸出預測等方面的重要研究」
此外,Thorsten Joachims 以往參與的研究曾獲得過 9 項最佳論文獎和 4 項時間檢驗獎,最近的獎項為 SIGIR 2020 最佳論文《Controlling Fairness and Bias in Dynamic Learning-to-Rank》。
服務獎
SIGKDD 服務獎旨在表彰在數據發現和數據挖掘領域提供傑出服務的個人或團隊,包括專業協會和會議的運營、學生和專業人士的教育、資助研發活動等專業服務。
本次服務獎的獲得者為淡馬錫人工智慧戰略和解決方案負責人 Michael Zeller,他在 KDD 執行委員會工作了八年,在多個 KDD 會議的策劃中發揮了重要作用,促進了研究機構與行業組織之間形成牢固的夥伴關係,並特別強調人工智慧的應用,這也是知識發現領域持續取得成功的關鍵。
學位論文獎
ACM SIGKDD 學位論文獎旨在表彰在數據科學、機器學習和數據挖掘領域做出的傑出研究生工作。今年的學位論文獎頒給了加州大學伯克利分校計算機科學新晉助理教授 Rediet Abebe 的博士論文——《Designing Algorithms for Social Good(公益算法的設計)》。
Abebe 是首位進入哈佛學會(Harvard Society of Fellows)的計算機科學女性科學家,還參與創立了 Mechanism Design for Social Good(MDSG)。加州大學聖地牙哥分校計算機科學助理教授 Jingbo Shang 憑藉其《Constructing and Mining Heterogeneous Information Networks from Massive Text》獲得學位論文獎的第二名。
新星獎
Rising Star Award(新星獎)是 ACM SIGKDD 今年新設的一個獎項,旨在獎勵博士畢業五年內取得突出成果的研究者。獲得今年新星獎的有兩位研究者:密西根大學計算機科學與工程 Morris Wellman 助理教授 Danai Koutra 和密西根州立大學計算機科學與工程助理教授湯繼良。
左:湯繼良;右:Danai Koutra。
Danai Koutra 在大規模數據挖掘方面的研究集中於有原則的、可解釋的、可擴展的網絡總結和多網絡分析方法。湯繼良的著名工作主要集中於表徵學習領域,特別是圖網絡及其在網絡和社交媒體領域的應用。
湯繼良本科、碩士畢業於北京理工大學,之後前往美國亞利桑那州立大學攻讀計算機博士,師從 IEEE Fellow、ACM Fellow 劉歡教授。2016 年,湯繼良獲 SIGKDD 最佳應用論文獎。目前,他的 Google Scholar 被引量已經超過 12000 次。
時間檢驗研究獎
SIGKDD 時間檢驗獎旨在表彰過去十年對數據挖掘研究社區產生重大影響且目前仍被引作新研究分支基礎的 KDD 大會傑出論文。今年的時間檢驗研究獎(Test of Time Award for Research)頒給了 Victor S. Sheng(盛勝利)、Foster Provost 和 Panagiotis Ipeirotis 等人合著的《Get Another Label? Improving Data Quality and Data Mining Using Multiple, Noisy Labelers》(2008)。該論文討論了標籤不完善時重複獲取數據項標籤的問題。
論文連結:https://archive.nyu.edu/bitstream/2451/25882/4/kdd2008.pdf
Victor S. Sheng 本科畢業於蘇州大學,之後在加拿大西安大略大學獲博士學位。他現在是德克薩斯理工大學(Texas Tech University)計算機系副教授,主要研究領域為數據挖掘與機器學習、大數據、深度學習、人工智慧、數據安全和決策支持及其在商業、醫療診斷、軟體工程等領域的應用。目前,Victor S. Sheng 在 Google Scholar 上的被引量已經接近 6000。
時間檢驗應用科學獎
SIGKDD 時間檢驗應用科學獎(Test of Time Award for Applied Science)也是今年新設立的獎項,旨在表彰在現實世界應用中產生真正影響的數據科學研究工作。今年的時間檢驗應用科學獎頒給了唐傑、李涓子等人合著的《ArnetMiner: Extraction and Mining of Academic Social Networks》(2008)。
唐傑是清華大學計算機科學與技術系長聘教授,研究興趣包括社會網絡分析、數據挖掘、機器學習和知識圖譜等。2006 年,他主持研發了研究者社會網絡挖掘系統 AMiner。今年年初,他又參與創辦了一個 AI 新期刊——並擔任主編,專注於 AI 的開放共享,此舉得到了劉知遠、劉群、馬少平等多位國內研究者的支持。
最後,如果你想了解更多的 KDD 2020 接收論文,可以參考這個官方列表:https://www.kdd.org/kdd2020/accepted-papers,每篇論文幾乎都有對應的視頻介紹。
擴展閱讀:名師出高徒,華人領風騷,KDD 風雲人物盤點
近日,南京大學周志華教授的專著《集成學習:基礎與算法》中文版上市,讓我們能夠有機會系統的學習這一經典的機器學習方法。
為了更好的幫助機器之心的讀者們了解集成學習,我們邀請到本書的譯者、周志華教授的學生李楠博士分別於8月16日與8月23日帶來 2 期線上分享,帶領大家一起學集成學習。
我們也將在直播過程中,送出10本《集成學習:基礎與算法》,識別二維碼即可報名。
© THE END
轉載請聯繫本公眾號獲得授權
投稿或尋求報導:content@jiqizhixin.com
原標題:《杜克大學陳怡然組獲獎,數據挖掘頂會KDD 2020全部獎項公布》
閱讀原文