【新智元導讀】近日,KDD 2020公布了6大獎項的獲得者。來自清華大學唐傑榮獲時間檢驗應用科學獎,還有兩位華人學者湯繼良和盛勝利均上榜。
KDD 2020 大獎出爐!
近日,KDD 2020 宣布了今年 ACM SIGKDD 六項大獎的獲得者,這六大獎項分別是時間檢驗研究獎、時間檢驗應用科學獎、新星獎、創新獎、學位論文獎、服務獎。
這些獎項是為那些在數據科學、大數據分析和挖掘、機器學習以及計算機科學領域做出傑出貢獻的研究人員設立的,旨在表彰那些對整個行業產生深遠影響的人。
今年獲得KDD 2020榮譽的華人有來自密西根州立大學湯繼良教授,清華大學唐傑、張靜、李娟子等教授、還有美國阿肯色中央大學的盛勝利教授。
一起來了解下這幾位華人學者和其他學者分別榮獲的獎項吧。
首次設立獎項:新星獎和時間檢驗應用科學獎
今年KDD新設立了兩個獎項:新星獎和時間檢驗應用科學獎
新星獎
今年是KDD第一屆設立年度新星獎(Rising Star Award)。
該獎項的設立是為了表彰KDD社區裡在博士畢業五年內取得卓越成就的學者。
今年的新星獎頒發給了兩位學者:
湯繼良(Tang Jiliang) 和 Danai Koutra(Morris Wellman)
湯繼良教授來自密西根州立大學數據科學與工程實驗室。此前,他是Yahoo Research的研究科學家,並於2015年從亞利桑那州立大學獲得博士學位。他的研究興趣主要包括社交計算,數據挖掘和機器學習及其在教育中的應用。
湯教授榮獲此獎項是因為他在特徵學習領域所取得的傑出成就,尤其是圖和圖在網絡、社交媒體和智能教育上的應用。
Danai Koutra(Morris Wellman)是第二位KDD年度獲新星獎的學者,她目前在密西根大學計算機科學與工程系的任助理教授,她研究主要集中於用於網絡匯總和多網絡分析的有原則、可解釋和可擴展的方法。
時間檢驗應用科學獎
今年也是首次頒發時間檢驗應用科學獎(Test of Time Award for Applied Science),為了表彰在數據科學的實際應用中具有影響力的研究。
清華大學唐傑、張靜、李娟子等人憑藉他們在2008年發表的論文「ArnetMiner: Extraction and Mining of Academic Social Networks 」獲得了該獎項,這篇論文主要關於學術社會網絡挖掘。
本篇論文中討論的ArnetMiner系統旨在提取和挖掘學術社交網絡,該系統側重從 從Web上自動提取研究人員的個人資料、將現有數字圖書館出版數據整合到網絡中、對整個學術網絡進行建模、為學術網絡提供搜索服務。
論文連結:
https://static.aminer.org/upload/pdf/985/1447/1704/53e9a5afb7602d9702edacce.pdf
唐傑目前是清華大學計算機科學與技術系長聘教授,計算機系副主任、清華-工程院知識智能聯合實驗室主任。研究興趣包括:社會網絡分析、數據挖掘、機器學習和知識圖譜。發表論文200餘篇,擁有專利20餘項。
唐傑教授主持研發了研究者社會網絡挖掘系統AMiner,吸引了220個國家/地區1000多萬獨立IP訪問。
華人學者盛勝利榮獲時間檢驗研究獎,表彰十年前的傑出KDD論文
SIGKDD的時間檢驗研究獎是為了表彰已發表數十年的傑出KDD論文。
今年,時間檢驗研究獎(Test of Time Award for Research)頒給了盛勝利(Victor S. Sheng),Foster Provost和Panagiotis Ipeirotis。
盛勝利(Victor S. Sheng)教授是美國阿肯色中央大學計算機科學系教授和數據分析實驗室主任,同時也是IEEE的高級成員。他是多個會議的會議組織者,也是多個期刊的編輯委員會成員。他主要的研究領域為數據挖掘與機器學習、人工智慧、數據安全和決策支持,已在機器學習和數據挖掘的會議和期刊上發表了140多個研究論文。
盛教授和其餘兩位研究者在2008年發表的論文「Get Another Label? Improving Data Quality And Data Mining Using Multiple, Noisy Labelers」對數據挖掘研究界產生了深遠影響。
論文連結:
http://crowdsourcing-class.org/readings/downloads/econ/get-another-label.pdf
這篇論文主要討論了當標籤不完善時,重複獲取數據項標籤的問題。
論文摘要:
我們研究了通過重複標記在數據質量方面的改進或不足,特別是有監督歸納的訓練標籤的改進。隨著小任務的外包變得越來越容易,例如通過Rent-A-Coder或亞馬遜的Mechanical Turk,可以經常以低成本獲得不太專業的標籤。使用低成本標記,準備未標記的數據部分可能會比標記成本更高。
我們提出了增加複雜性的重複標記策略,並給出幾個主要結果:
1 重複貼標籤可以提高標籤質量和模型質量,但並非總是如此。
2 當標籤嘈雜時,即使在標籤不是特別便宜的傳統環境中,重複標籤也可能比單標籤更可取。
3 一旦處理未標記數據的成本不菲,即使是多次標記所有內容的簡單策略也可以帶來巨大優勢。
4 最好反覆標記一組精心選擇的點,並且我們提出了一種強大的技術,該技術可以結合不同的不確定性概念來選擇質量應提高的數據點。
結果清楚地表明,當標籤不夠完美時,選擇性地獲取多個標籤是數據挖掘人員應採取的一項策略,對於某些標籤質量/成本制度,好處是巨大的。
創新獎、學位論文獎和服務獎
創新獎
ACM SIGKDD創新獎是知識發現和數據挖掘領域技術卓越的最高榮譽,此次獎項授予給Thorsten Joachims。
Thorsten Joachims是康奈爾大學計算機科學與信息科學教授,美國計算機協會、美國人工智慧學會院士。因其在機器學習方面的貢獻,包括在信息檢索,支持向量機(SVM)和結構化輸出預測方面研究人類偏見的有影響力的工作獲得該獎項。
此外,值得一提的是,Joachims與其他合作者發表的一篇論文「Controlling Fairness and Bias in Dynamic Learning-to-Rank」在今年的SIGIR 2020上獲得了最佳論文獎。
學位論文獎
ACM SIGKDD 論文獎旨在表彰在數據科學,機器學習和數據挖掘領域所做的傑出工作的研究人員,Rediet Abebe獲得了KDD年度論文獎。
Rediet Abebe現任加州大學伯克利分校計算機科學系助理教授,她的博士論文「Designing Algorithms for Social Good」獲得了今年的ACM SIGKDD學位論文獎。
論文連結:https://www.cs.cornell.edu/~red/AbebeDissertation.pdf
Abebe是第一位入選哈佛研究員學會的女性計算機科學家,也是第二位獲得計算機科學博士學位的初級研究員。
她是社會公益機制設計(MDSG)的聯合創始人,這是一個多機構倡議,旨在改善歷史悠久,服務水平低下的弱勢社區的機會。
服務獎
ACM SIGKDD服務獎是該領域所授予服務的最高認可,授予給Michael Zeller。
Zeller是Temasek人工智慧戰略與解決方案負責人,因致力於在ACM SIGKDD擔任志願司庫和執行委員會秘書而在該領域做出的傑出貢獻而獲次榮譽。