蕭簫 發自 凹非寺量子位 報導 | 公眾號 QbitAI
數據挖掘、知識發現領域的最高學術會議——KDD 2020的所有獎項已全部公布。
KDD,全稱Knowledge Discovery and Data Mining,由SIGKDD舉辦,後者是美國計算機學會ACM旗下數據挖掘和知識發現的專業組織。
在這次的AI頂會中,中國力量,依然奪目。
其中,北航學生獲得最佳學生論文,滴滴出行6篇論文入選;
而在挑戰賽上,美團、第四範式、螞蟻金服、深度賦智等業界團隊,以及國立臺灣大學、東南大學、上海交大、中山大學和清華大學等學術界團隊斬獲了所有賽道的冠亞軍。
這次挑戰賽的主辦方大部分來自中國,包括阿里巴巴達摩院、清華大學、BienData、第四範式、滴滴出行等。
此外,湯繼良、盛勝利、唐傑等華人學者在本屆SIGKDD大會上也獲得了多項大獎。
最佳論文獎
今年最佳論文獎由來自谷歌研究院的Walid Krichene和Steffen Rendle獲得。
這篇論文對樣本指標進行了調查,並給出了在度量標準計算中應該避免抽樣的建議。
這是因為,為了加快度量標準的計算,通常會採用抽樣的模式進行度量,只對較小的一組隨機項和相關項進行排名。但調查發現,樣本指標與精確的度量不一致,因為這些指標不會保留相關項的陳述。
而且,樣本越小,指標之間的差異也會越小,對於非常小的樣本,所有指標都會變成AUC指標。所以,可以通過最小化不同的標準(偏差或均方誤差),來提高樣本指標的性能。
此外,今年KDD的最佳學生論文獎,則由來自杜克大學陳怡然團隊、以及北航的研究人員摘得。
最佳學生論文獎
最佳學生論文獎由來自北京航空航天大學的段逸驍、楊建磊,以及杜克大學的陳怡然、Ang Li和Huanrui Yang獲得。
據悉,論文一作Ang Li目前是阿里巴巴達摩院的實習生。
為了解決深度學習數據集涉及侵犯用戶隱私的問題,這篇論文提出了一個名為TIPRDC的框架,目的在於學習一個特徵提取器,可以從中間特徵中隱藏隱私信息,同時也最大限度地保留嵌入在原始數據中的原始信息。
為了達成這個目標,團隊設計了一種混合訓練方法,用於學習中間特徵,包括用於從特徵中隱藏隱私信息的對抗訓練過程,以及使用基於神經網絡的交互信息估計器、用於最大程度地保留原始信息。
從評估效果來看,TIPRDC明顯優於其他現有方法。
華人獲新星獎、時間檢驗獎
此外,KDD首屆新星獎(旨在表彰KDD社區裡在博士畢業五年內便獲得卓越科研成就的年輕學者),頒給了兩位學者,其中一位就是華人學者湯繼良。
這位在特徵學習領域作出傑出貢獻的學者,目前在密西根州立大學數據科學與工程實驗室進行研究。
而KDD的第一屆應用科學時間檢驗獎則頒給了清華大學計算機科學與技術系長聘教授唐傑,這篇獲獎的論文名為《ArnetMiner: Extraction and Mining of Academic Social Networks》。
據悉,唐傑教授目前任清華大學計算機系副主任,曾入選國家「傑出青年」名單,目前發表論文 200餘篇,被引用10000餘次(個人h-指數59)。
至於KDD的時間檢驗研究獎(表彰10年前傑出的KDD論文),則頒給了來自美國阿肯色中央大學計算機科學系教授和數據分析實驗室的主任盛勝利。
不僅在KDD 2020上,能看見各位來自中國的學者一展風採,在素有「大數據領域世界盃」之稱的KDD Cup 2020上,也能感受到來自中國團隊的力量。
中國包攬「大數據領域世界盃」冠亞軍
除了在KDD這樣的全球AI頂會,SIGKDD每年還會舉行KDD Cup挑戰賽,同時面向學術界和業界。
今年的挑戰賽各賽道的主辦方,大部分來自中國,包括阿里巴巴達摩院、清華大學、BienData、第四範式以及滴滴出行等。
而在今年的機器學習、AutoML機器學習、強化學習這3大賽道中,中國團隊包攬了所有的冠亞軍。
一起來看看這次比賽的獎項結果。
常規機器學習賽道
在KDD CUP 2020上,常規機器學習被分成了兩個賽道。
機器學習賽道一由阿里巴巴達摩院主辦,其中阿里、杜克大學、清華大學和UIUC也參與了此次贊助,兩項任務分別各有一千多個小組參加了比賽。
賽道一的有兩個任務,一個是多模態召回(Multimodalities Recall ),另一個則是去偏差(Debiasing)。
在任務一中,國立臺灣大學(WinnieTheBest)和美團點評(MTDP_CVA)的團隊分別獲得了冠亞軍,而季軍的團隊也同樣來自美團(aister)。
在任務二中,來自美團點評(aister)與深度賦智(DeepWisdom)的團隊獲得了冠亞軍,而季軍團隊則來自北京航空航天大學。
而機器學習賽道二隻有一個任務,即學術圖譜上的對抗攻擊和防禦,涉及到生成對抗網絡(GAN)的知識。
在賽道二中,最終的冠亞軍分別由上海交通大學(SPEIT-卓工)和中山大學、杭州電子科大的(ADVERSARIES)團隊獲得,其中季軍團隊(DaftStone)來自中國科學技術大學。
此次機器學習賽道二的主辦方是BienData,共有544名選手參與了此次比賽。
AutoML機器學習賽道
至於AutoML機器學習賽道,則聚焦於圖表示學習技術,核心任務是基於圖的拓撲結構,學習節點或者全圖的向量表達,更好地用於下遊機器學習任務(商品推薦、知識圖譜補全、交通流量預測等)中。
這個賽道的主辦方為第四範式,其中ChaLearn、史丹福大學和谷歌共同協辦。
最終冠軍由來自美團點評、中國科學院大學和清華大學(aister)的團隊獲得,亞軍為南京大學(PASA_NJU)的團隊,至於季軍團隊,則來自螞蟻金服(qqerret)。
值得一提的是,這項比賽的所有代碼都在GitHub上放出了公開連結,感興趣的小夥伴們可以自行學習(文末附公開連結)。
強化學習賽道
這次的強化學習賽道由滴滴舉辦,共設計了訂單分配和車輛調度兩個任務,參賽團隊需設計開發算法來指定在派單窗口內的訂單和司機的匹配,並指引一批空閒司機開往指定目的地。
這次一共有1195位參賽選手、共1007支隊伍參加了這項比賽,比賽結果於昨日在KDD大會上公布。
其中,第一個任務的冠亞軍分別由來自第四範式和北航(Polar Bear)和來自中山大學(EM)的團隊獲得,而季軍則是來自Lyft的團隊。
至於第二項任務,則由來自東南大學、普渡大學(TLab)的團隊、以及南京大學(wait a minute)的團隊獲得冠亞軍,季軍由日本的NTTdocomo實驗室摘得。