KDD CUP 2020 大獎出爐,中國團隊包攬全部冠亞軍!

2020-12-25 AI 科技評論

作者 | 陳大鑫、青暮

經過上千個國際頂級團隊幾個月的激烈角逐,KDD CUP 2020 大賽結果終於在其官網上公布,其中,來自中國的團隊如國立臺灣大學、美團點評、北航、第四範式、東南大學、上海交大、國科大、清華大學包攬全部獎項的冠亞軍!

ACM SIGKDD,被中國計算機學會(CCF)推薦為A類國際學術會議,至今已舉辦26屆。其中KDD CUP是由ACM知識發現和數據挖掘特別興趣小組(領先的數據科學家專業組織)組織的年度國際數據挖掘和知識發現競賽。素有「大數據領域世界盃」之譽,是目前數據挖掘領域最高水平、最具影響力、規模最大的國際頂級賽事。

由於各種數據科學競賽類型的日益普及,KDD CUP今年一共開設三個項目共四個賽道的比賽,分別是:

1、常規機器學習競賽軌道(ML賽道1) 「現代化電子商務平臺挑戰」(Challenges for Modern E-Commerce Platform)

2、常規機器學習競賽軌道(ML賽道2) 「學術圖上的對抗性攻擊和防禦」(Adversarial Attacks and Defense on Academic Graph)

3、AutoML機器學習競賽軌道(AutoML賽道) 「用於圖表徵學習的AutoML」(AutoML for Graph Representation Learning)

4、強化學習競賽賽道(RL賽道) 「在移動點播平臺上學習調度和重定位」(Learning to Dispatch and Reposition on a Mobility-on-Demand Platform)

1

常規機器學習賽道一

機器學習賽道一「現代化電子商務平臺挑戰」由阿里巴巴、阿里巴巴達摩院、杜克大學、清華大學和UIUC贊助,競賽選手需要通過考慮不同類型的複雜信息來學習高質量的跨模態表示,以及模態之間的緊密關係。然後,所學習的表示可以用於計算表示之間的相似度得分,並選擇與文本相關的圖像/視頻。最後,將在測試數據集上評估每個提交的解決方案,該數據集將評估檢索到的產品與真實值之間的對應關係。

該賽道有兩個任務:

任務1:現代化電子商務平臺挑戰:多模態召回(Multimodalities Recall )

任務2:現代化電子商務平臺挑戰:去偏差(Debiasing)

關鍵字:學習表示,遷移學習,圖像,視頻和文本處理

主辦單位: 阿里巴巴達摩院

平臺:天池

總獎金:40,000美元

任務1獲獎團隊

冠軍團隊:WinnieTheBest(國立臺灣大學)

亞軍團隊:MTDP_CVA(美團點評 )

季軍團隊:aister(美團點評)

冠軍思路

冠軍思路包含三個步驟:預處理、訓練模型架構和後處理。其中,預處理構建了用於模型訓練的特徵,後處理對模型進行集成,模型應用了兩種類型的架構,分別是MCAN和VisualBERT。MCAN全稱Deep Modular Co-Attention Networks,模型由幾個級聯MCA層構成。在VisualBERT中,圖像塊和查詢中的單詞被組合作為Transformer的輸入。

任務2獲獎團隊

冠軍團隊:aister(美團點評)

亞軍團隊:DeepWisdom(深度賦智 )

季軍團隊:TheAvengers(北京航空航天大學)

2

常規機器學習賽道二

機器學習賽道二「學術圖上的對抗攻擊和防禦」由BienData贊助。該賽道要求參賽者提交原始數據集的修改版本,以作為一種攻擊形式,其外觀應與原始圖相似,但在基準模型上分類準確性較低。參賽者應準備好數據及並保存在比賽系統的後端。然後,所有團隊都必須提交攻擊和防禦的解決方案。組織者將與所有團隊的所有進攻方案和防禦方案進行比賽,並得出排行榜。

關鍵詞:生成對抗網絡(GAN),圖結構化數據,圖嵌入

贊助商:Biendata.com

平臺:Biendata

總獎金:19,000美元

獲獎團隊

冠軍團隊:SPEIT-卓工 (上海交通大學、上海交大-巴黎高科卓越工程師學院)

亞軍團隊:ADVERSAIRES (中山大學、杭州電子科技大學 )

季軍團隊:DaftStone ( 中國科學技術大學)

冠軍思路

攻擊方案包含兩個步驟,第一步是對抗鄰接矩陣生成,第二步是增強特徵梯度攻擊。其中,第一步基於圖數據的拓撲性質,從而可以實現更加一般的攻擊,並且僅需要一次生成,在大規模圖的攻擊上更加高效;第二步會訓練一個替代模型作為目標,這裡利用了攻擊可遷移性,使用的訓練方法是對對抗損失進行反向傳播,並使用Adadelta優化器。

防禦方案包含三個步驟,第一步是特徵去噪,第二步是特徵轉換,第三步是訓練拓撲適應GCN。在第二步中,會改變特徵空間以減輕遷移攻擊;在第三步中,GCN實現了很高的分類準確率,並且對於其它模型生成的對抗圖具有魯棒性。

3

AutoML機器學習賽道

AutoML機器學習賽道 「用於圖表徵學習的AutoML」由第四範式、ChaLearn、史丹福大學和Google共同協辦,該賽道邀請參賽者部署用於圖表示學習的AutoML解決方案,其中節點分類作為評估學習的表示形式的質量的任務。

每個團隊都有五個公共數據集來開發AutoML解決方案。組織方提供了五個反饋數據集,以使參與者能夠評估他們的解決方案。這些解決方案將在沒有人為幹預的情況下使用五個新的數據集進行評估,優勝者將根據表現的最終排名進行選擇。

關鍵字:圖表示學習,圖結構化數據,圖嵌入,AutoML

贊助商:第四範式

平臺: CodaLab

總獎金:33,500美元

獲獎團隊

冠軍團隊:aister(美團點評、中國科學院大學、清華大學 )

亞軍團隊:PASA_NJU(南京大學)

季軍團隊:qqerret(螞蟻金服)

冠軍方案整體框架圖示:

方案採用了多級魯棒集成方法:

4

強化學習賽道

強化學習賽道 「在移動點播平臺上學習調度和重定位」由滴滴出行與DiDi AI Labs合作贊助,該賽道要求參與者應用機器學習工具來確定新穎的解決方案,用於在移動點播(MoD)平臺上的訂單分派(訂單匹配)和車輛重新定位(車隊管理)。具體地說,競賽著眼於如何應用機器學習解決方案來提高MoD平臺的效率。

關鍵字:強化學習,按需機動性,車輛重定位

贊助商: 滴滴出行

平臺:Biendata

總獎金:30,000美元

今年 ,KDD Cup 2020 強化學習挑戰賽(RL Track)難度陡增,與去年KDD Cup強化學習挑戰賽的分類問題以及過往多應用在體育競技類比賽性質不同,此次挑戰賽聚焦於更加真實且問題極為複雜的業務場景,以解決共享出行領域優化難題——智能化按需共享出行平臺。主辦方希望參賽團隊嘗試應用強化學習解決方案提出智能算法策略,在確保用戶體驗的基礎上,進一步提高出行效率和司機收入,將強化學習的價值進一步放大。

此次比賽主辦方共設計了訂單分配和車輛調度兩個任務,參賽團隊需設計開發算法來指定在派單窗口內的訂單和司機的匹配,並指引一批空閒司機開往指定目的地。最終結果排名以所有司機的平均日均收入為評判標準。

此次挑戰賽邀請了全球上千支參賽團隊,其中不乏國際頂尖高等院校以及科技巨頭的身影。最終,北京航空航天大學童詠昕教授研究組與第四範式聯合團隊以巨大的分數優勢斬獲KDD Cup 2020強化學習挑戰賽Dispatch冠軍,這也是國內AI公司首次染指該項賽事的冠軍。

Dispatch任務獲獎團隊

冠軍:Polar Bear(北京航空航天大學、第四範式)

亞軍:EM(中山大學)

季軍:Team Hail Mary ( Lyft )

冠軍思路

為了最大化平臺上所有司機日均收入,在計算每個訂單的收益時,北航聯合第四範式團隊採用基於強化學習的方法,不僅能考慮當前時刻的收入,還能兼顧未來可能的收益。同時,結合剪枝與C++實現的高效二分圖匹配算法,能夠在2秒的規定時限內,及時找到合適的訂單分配方案,保證乘客的用戶體驗。最終團隊以2359108.54的高分在Dispatch任務上奪冠。

方案圖示

Repopsition任務獲獎團隊

冠軍團隊:TLab(普渡大學、東南大學)

亞軍團隊:wait a minute(南京大學LAMDA組)

季軍團隊:NTTDOCOMO LABS(日本NTTdocomo實驗室)

冠軍思路:

參賽者需要解決網約車平臺的訂單匹配與車輛調度問題,其中訂單匹配任務需要每兩秒鐘進行一次匹配,車輛調度任務則需要在成都8000餘個六邊形網格內進行運力調度。相關算法可將乘客潛在出行需求與合適的司機相匹配,從而更高效地利用空置車輛,提高車輛周轉率,提升用戶體驗與司機收入水平,優化系統運營效率。

現有的多智能體強化學習方法將每一輛車看作是一個智能體,在進行仿真時,車輛按照調度算法前往目的地或者進行有偏隨機遊走,並沒有考慮司機的偏好。針對現有方法的不足,劉志遠指導的TLab團隊(成員包括劉洋博士、吳凡優博士、呂呈碩士))對現有方法進行了系統、全面的優化,進一步設計了一種更符合邏輯的單智能體深度強化學習方法。

例如,該方法 將單智能體作為智能「調度中心」 ,車輛發出調度請求後,「調度中心」進行全局運力調度。結合此前在大規模時空預測中的經驗,進一步對研究區域進行篩選並自定義了一個N×N的網格,將全局信息(整個城市訂單、車輛、價值的時空分布)和局部信息(車輛當前位置等)作為state。採用了一個經過剪枝的全局action space, 防止車輛陷入局部最優 。(本段內容來自東南大學官網&公眾號)

參考連結:

https://www.kdd.org/kdd2020/kdd-cup

https://kddvirtual2020.vfairs.com/

https://www.kdd.org/kdd2020/files/KDD_Cup_Day_Program.pdf

https://mp.weixin.qq.com/s/vqLw9Wj7qqAa19x8y2BAfA

https://www.seu.edu.cn/2020/0803/c17406a341189/page.htm

[博文視點贈書福利]

AI科技評論聯合博文視點贈送周志華教授「森林樹」十五本,在「周志華教授與他的森林書」一文留言區留言,談一談你和集成學習有關的學習、競賽等經歷。

AI 科技評論將會在留言區選出15名讀者,每人送出《集成學習:基礎與算法》一本。

活動規則:

1. 在「周志華教授與他的森林書」一文留言區留言,留言點讚最高的前 15 位讀者將獲得贈書。獲得贈書的讀者請聯繫 AI 科技評論客服(aitechreview)。

2. 留言內容會有篩選,例如「選我上去」等內容將不會被篩選,亦不會中獎。

3. 本活動時間為2020年8月23日 - 2020年8月30日(23:00),活動推送內僅允許中獎一次。

相關焦點

  • 祝賀東南大學交通學院劉志遠教授團隊劉洋博士、呂呈碩士喜獲KDD CUP兩項大獎
    東南大學交通學院劉志遠教授團隊博士生劉洋、碩士生呂呈於2019年7月獲得人工智慧領域頂級國際會議的兩項競賽大獎,分別是KDD CUP Regular Machine Learning Competition Track-Task2亞軍,以及Task 1第4名[1]。
  • 中國企業包攬主辦權,獎金池 12 萬美金,KDD Cup 2020 開賽
    近日,ACM SIGKDD 公布了 KDD Cup 2020( 國際知識發現和數據挖掘競賽)的賽事安排。UTC 2020 年 4 月 27 日晚上 11:59 將關閉報名入口,並禁止換隊。ML 賽項 2 詳情地址:https://biendata.com/competition/kddcup_2020/自動化機器學習賽道(AutoML 賽道)賽項關鍵字:圖表示學習,圖結構化數據,圖嵌入,AutoML
  • [KDD Cup 2020(共6道題)]KDD Cup 2020(賽題更新)
    給定一個自然語言形式的搜索查詢,參與的團隊需要實現一個模型,根據它們的圖像特徵對候選產品集合進行排序。這些查詢大部分是名詞短語,用於搜索具有特定特徵的產品。候選產品的圖片由展示產品特徵的賣家提供。與查詢最相關的候選產品被視為查詢的ground truth,參與模型期望查詢的ground truth排在最前面。
  • 【乾貨】2010-2017最全KDD CUP賽題回顧及數據集下載
    >>> 大賽官網介紹http://www.kdd.org/kdd-cup/view/kdd-cup-2010-student-performance-evaluation/Intro>>>> 大賽數據集http://www.kdd.org/kdd-cup/view/kdd-cup-2010-student-performance-evaluation/Data
  • KDD 2020 全部大獎出爐!杜克大學陳怡然組獲最佳學生論文獎
    此外,湯繼良、盛勝利、唐傑等華人學者在本屆 SIGKDD 大會上也榮獲了包含新星獎、時間檢驗研究獎、時間檢驗應用科學獎在內的三項大獎。/kdd2020/accepted-papers/view/on-sampled-metrics-for-item-recommendation論文摘要:項目推薦的任務需要在給定上下文的情況下對大量的項目進行排序。
  • 2020泰晤士亞洲大學排名公布 中國大陸高校首次包攬該榜前冠亞軍
    2020泰晤士亞洲大學排名公布 中國大陸高校首次包攬該榜前冠亞軍時間:2020-06-04 13:57   來源:今日頭條   責任編輯:沫朵 川北在線核心提示:原標題:2020泰晤士亞洲大學排名公布 中國大陸高校首次包攬該榜前冠亞軍 6月3日,第8屆泰晤士高等教育(THE)亞洲大學排名發布,中國大陸高校表現搶眼
  • 工學院研究生蔡恆興率領隊伍「一個師的兵力」在KDD Cup 2017國際競賽中取得優異成績
    級研究生蔡恆興(領隊)、教師鍾任新副教授(隊員)、2015級研究生羅佳晨(隊員),與來自北航、西南交大、中科院、國防科大、北大等其它高校及機構的隊員組隊「一個師的兵力」,參加了KDD Cup 2017賽題《Highway Tollgates TrafficFlow Prediction: Travel Time & Traffic Volume Prediction》中兩個任務的角逐,憑藉參賽團隊的精誠協作
  • 包攬男女冠亞軍!10萬美元怎麼花,林昀儒沒想好樊振東這麼說
    目前決賽席位已經出爐,中國臺北小將林昀儒4:0橫掃中國香港名將黃鎮廷,率先晉級男單決賽。小胖樊振東狀態回歸,大比分4:0淘汰隊友許昕,成功晉級男單決賽。女單方面,朱雨玲4:0橫掃日本獨苗加藤美柚,晉級女單決賽。王曼昱則是與奧運冠軍丁寧經歷七局苦戰,4:3驚險淘汰丁寧成功晉級女單決賽。樊振東此前一直狀態低迷,連續輸給梁靖崑,馬龍,許昕,雨果,弗朗西斯卡等選手。
  • 包攬冠亞軍!山東省實驗中學學子在2020年世界機器人大賽中獲佳績
    中國山東網-感知山東12月8日訊 (通訊員 高婕) 12月4日-7日,2020年世界機器人大賽在廣東省佛山市成功舉行,山東省實驗中學20名學生參加了本次大賽中VEX、AI探索科技挑戰賽兩項比賽。經過激烈角逐,省實驗學子包攬AI探索科技挑戰賽冠亞軍及VEX大賽三等獎。
  • 印尼大師賽超級100賽:國羽衝擊四項金牌,東道主包攬女雙冠亞軍
    東道主印度尼西亞在女子雙打完成會師,提前包攬冠亞軍;中國羽毛球隊則在其餘四個單項都有運動員闖入決賽。21歲的孫飛翔取得四連勝,繼上個月的越南公開賽後再度殺出超級100賽決賽。作為8號種子,他在半決賽中以21比18、21比19兩局戰勝馬來西亞選手宋浚洋。孫飛翔將在決賽中與5號種子泰國選手達農沙·森頌汶素爭奪金牌。
  • 韓國明知大學包攬A組冠亞軍
    韓國明知大學裴成俊、白雲起包攬冠亞軍。  本屆世界大學生圍棋賽A組比賽爭奪激烈。經過兩天6輪預賽,明知大學白雲起和裴成俊、上海財大魏笑林、上外賀桑蓬獲得前四名,晉級半決賽。昨天上午半決賽,白雲起、裴成俊表現出色,他們分別戰勝賀桑蓬、魏笑林,會師決賽。  昨天下午,A組決賽在兩位明知大學選手之間進行,由去年第五屆冠軍白雲起對裴成俊。
  • KDD 2020阿里巴巴論文一分鐘秒讀
    好消息是,近日,清華大學AMiner團隊和同濟大學iDVX實驗室與智譜AI聯合發布了一款 AI 視頻神器 ——「秒讀論文」,一鍵生成論文解讀短視頻,能助力科研人員快速掌握中英文文獻核心要義。這裡我們精選了12篇來自阿里巴巴的論文,並利用AMiner的秒讀技術生成了相應的視頻,歡迎大家體驗。
  • A妹包攬英國單曲榜冠亞軍,創多項新記錄
    這樣A妹不僅包攬了冠亞軍,也成為了繼1985年8月麥當娜《Into The Groove》與《Holiday》之後的第一個包攬單曲榜冠亞軍的女歌手。在不到100天的時間裡收穫了3首冠軍單曲,A妹是歷史上首位達成此成績的女歌手。
  • 中國軍團稱霸KDD:華人博士獲最佳論文,清華北大華為等榜上有名
    KDD,數據挖掘領域國際最高級別會議,今年在美國阿拉斯加州舉行,最佳論文及三大競賽等主要獎項,剛剛已全部揭曉。今年,中國面孔星光璀璨。康奈爾大學華人博士Dong Kun以一作身份斬獲研究賽道最佳論文,初創公司獎項、KDD CUP三大賽事,也基本被中國公司包攬。
  • KDD 2020最佳論文揭曉!杜克大學陳怡然組獲最佳學生論文獎
    【新智元導讀】KDD 2020最佳論文新鮮出爐!最佳學生論文、最佳論文亞軍均被華人學生(一作)摘得,來看看這些論文出自誰之手吧!KDD Best Paper 終於來了!受疫情影響,今年第26屆國際數據挖掘頂會 ACM SIGKDD 於8月23日-27日以虛擬線上方式召開。
  • 2020年VMA音樂大獎:Lady Gaga包攬五項大獎
    據美聯社當地時間8月31日報導,Lady Gaga在2020年MTV音樂錄影帶大獎上橫掃全場,包攬五項大獎,「盆栽」The Weeknd斬獲年度MV。兩位流行歌星都向觀眾發出了關於世界現狀的重要信息:「戴上口罩」和「為雅各布·布萊克(Jacob Blake)和布雷娜·泰勒(Breonna Taylor)伸張正義」。
  • 亞運會戰報:劉湘破50米仰泳世界紀錄 中國隊包攬多項目冠亞軍
    新東方網>英語>英語學習>語法詞彙>分類詞彙>正文亞運會戰報:劉湘破50米仰泳世界紀錄 中國隊包攬多項目冠亞軍 2018-08-23 14:02 來源:中國日報網 作者:
  • 他做出兩個關鍵決定,幫助國乒包攬冠亞軍
    而國乒包攬了這幾項重啟後的賽事的所有冠軍,也展現出了我們的超強實力。而事實上,其他隊伍連爭奪亞軍的機會都沒有,每次決賽都是在國乒隊員之間進行的。在前段時間進行的WTT澳門站比賽中,國乒隊員馬龍、王楚欽也是包攬了男單的冠亞軍。日前,國際乒聯在官方社交平臺讓球迷評選澳門站表現最搶眼的男選手。正是劉國梁做出的兩個關鍵決定,幫助國乒包攬了冠亞軍,這回大家終於理解劉國梁的苦心了。
  • 亞運會:劉湘破50米仰泳世界紀錄 中國隊包攬多項目冠亞軍
    當地時間8月21日晚,雅加達亞運會女子50米仰泳決賽中,中國選手劉湘以26秒98奪得金牌,同時也打破了該項目此前27秒06的世界紀錄。
  • VEX機器人亞洲錦標賽中國隊包攬冠亞軍
    來自大陸的六隻隊伍,從 450 餘支參賽隊伍中脫穎而出,包攬了技能賽小學組、初中組、高中組的冠亞軍。機器人亞洲錦標賽對於參賽選手的獨特魅力在於:各個賽項均要求選手充分發揮想像力,在有限的時間內讓設計參賽的機器人完成指定任務,包括輪轂攜帶移動、碟蓋翻轉、旗幟翻轉等一系列動作;既考驗設計者最優路線、策略戰術的智慧,又很好地培養了青少年團隊的協作動手能力