Twitter從Recsys 2020挑戰中學到了什麼

2021-01-11 雷鋒網

譯者:AI研習社(聽風1996)

雙語原文連結:What Twitter learned from the Recsys 2020 Challenge

ecommender系統是現代社交網絡和電子商務平臺的重要組成部分。它們旨在最大限度地提高用戶滿意度以及其他重要的商業目標。與此同時,在以根據用戶興趣定製內容為目的來建立新模型基準測試時,缺乏供學界研究使用的大規模的公共社交網絡數據集。而在過去的一年裡,我們努力解決了這個問題。 

Twitter與RecSys會議展開合作以支持2020挑戰賽。在兩周的時間裡,我們發布了一個包含推文和用戶參與度組成的數據集,其中有1.6億條公開推文用於訓練,4000萬條公開推文用於驗證和測試。    

在這篇文章中,我們描述了數據集以及Nvidia、Learner和Wantely團隊提交的三個獲獎作品。我們試圖對幫助獲獎者取得成績的選擇做出一般性的結論,特別是:

以最快的實驗速度用於特徵選擇和模型訓練

有利於泛化的對抗驗證[1]

上下文特徵的使用

在神經網絡上使用決策樹

我們希望這些研究結果對更廣泛的研究界有用,並啟發推薦系統的未來研究方向。

挑戰賽的參與者被要求預測用戶參與四種互動中任何一種互動的可能性:贊、回復、轉發和引用tweet。我們根據以下兩個指標對提交的作品進行評估:相對於我們所提供的簡單基準方法的相對交叉熵(RCE),以及Precision-Recall曲線下的面積(PR-AUC)。

隨時間的變化的訓練、測試和驗證數據集的表示

我們要特別注意(我們所使用的)維持數據集需與Twitter平臺同步。數據集反映了平臺上的變化,例如,當其中的一條推文被刪除,有用戶將其個人資料變為私有或完全刪除。所以提交的數據就會被重新評估,排行榜也會根據重新計算的指標進行更新[2]。

數據集的特徵表示。它們分為用戶特徵(針對作者和讀者)、推文特徵和參與度特徵。

今年的挑戰賽競爭尤為激烈,註冊用戶超過1000人。在整個挑戰過程中,參賽者積極提交解決方案,並在挑戰的第一階段(根據提交指南)修改了他們的團隊組成。最後階段有20個競爭者,平均團隊規模為4名成員。此外,各隊總計設計了127種不同的方法,來嘗試贏得挑戰比賽。在整個挑戰過程中,參賽者的活躍度很高,在最後幾天,參賽者對提交的作品進行了改進,達到了做最優性能。最終的結果出現在排行榜上。

與之相伴的RecSys Challenge 2020研討會收到了12篇論文,程序委員會對這些論文進行了審閱。其中9篇論文被接受。

數據集的特徵表示。它們分為用戶特徵(針對作者和讀者)、推文特徵和參與度特徵。

今年的挑戰賽競爭尤為激烈,註冊用戶超過1000人。在整個挑戰過程中,參賽者積極提交解決方案,並在挑戰的第一階段(根據提交指南)修改了他們的團隊組成。最後階段有20個競爭者,平均團隊規模為4名成員。此外,各隊總計設計了127種不同的方法,來嘗試贏得挑戰比賽。在整個挑戰過程中,參賽者的活躍度很高,在最後幾天,參賽者對提交的作品進行了改進,達到了做最優性能。最終的結果出現在排行榜上。

與之相伴的RecSys Challenge 2020研討會收到了12篇論文,程序委員會對這些論文進行了審閱。其中9篇論文被接受。

第一名:英偉達

GPU Accelerated Feature Engineering and Training for Recommender Systems.

Nvidia的論文[3]描述了訓練xgboost模型來預測每個交互事件。總體的關注點在於為該模型生成有用的特徵。文章強調快速提取特徵和模型訓練是該方法成功的關鍵。本文在附錄中提供了4種模型中每種模型的15個最有用的特徵列表。

從數據集中快速提取特徵並進行再訓練是冠軍和亞軍的關鍵區別。特徵工程流程和訓練流程的運行時間都不到一分鐘。除此之外,對不同的分類特徵和特徵組合採用目標編碼(均值編碼+加法平滑),包括這些組合的目標均值。作者還從推文的內容中創建了分類特徵(如最受歡迎的兩個詞和最不受歡迎的兩個詞)。用於特徵重要性評估和選擇的對抗性驗證 通過選擇更通用的特徵來防止過擬合。 採用基於樹模型的集成方法用於生成最終模型。  

第二名:Learner

Predicting Twitter Engagement With Deep Language Models.

Learner[4]融合了深度學習與梯度提升決策樹(GBDT),並專注於不同特徵的創建。作者使用啟發式方法設計了467個特徵,並使用BERT和XLM-R生成了推文的文本表示(同時使用了目標Twitter文本以及最近參與的Twitter文本)。

該條目與其他條目的關鍵區別在於使用了預訓練的自然語言處理(NLP)模型BERT和XLM-R,並進行了微調。第一層的微調是以無監督的方式進行的。接下來,將語言模型與其他特徵結合以有監督的方式進行微調。。該模型是一個多層感知機(MLP),有四個頭,每個頭代表一種參與類。本文還引入注意力機制生成了用戶過去十次互動的嵌入向量。以目標推文為關鍵,利用注意力機制對每個的嵌入向量進行組合。此外,還使用了啟發式特徵,如參與用戶、推文創建者、推文特徵和用戶與創建者交互特徵的不同表示。與其他條目一樣,本文使用xgboost進行特徵工程和選擇,並將Yeo-Johnson transformation應用於分類特徵和非標準化連續特徵。  

第三名:Wantely

A Stacking Ensemble Model for Prediction of Multi-type Tweet Engagements. 

Wantely的投稿[5]提出了一種預測tweet參與度的兩階段方法。第一階段的分類器是輕量級的,只使用在不同目標(Like、Retweet等)中通用的特徵,並且具有相似的訓練/測試精度。第二階段分類器將輕量級分類器的輸出與特定於目標的特徵一起用作特徵。  

上遊的通用模型生成下遊模型所需的特徵。作者認為,通過這樣的方式,每種參與類型的下遊模型都可以從所有其他參與的數據中受益。除此之外,除此之外,如Nvidia條目所示,本文通過對抗性驗證直接評估訓練和測試數據集之間的特徵分布差異,從而確定了哪些特徵是可通用的。    

在所有提交的論文中,有許多相同的見解。我們重點介紹以下主題:

勝出模型中使用的有用特徵—目標編碼是王道。首先,目標編碼(用目標變量的平均值替換分類變量)使問題變得更簡單。它同時用於用戶和作者id,因此編碼了用戶的平均參與率。其次,使用了大量特徵交叉[6]。  

快速實驗進行特徵選擇。快速檢驗許多假設的能力一直是數據科學競賽中不可或缺的一部分,並再次證明在這一挑戰中具有決定性作用。Nvidia團隊能夠在GPU上運行整個流程。這讓他們只需2分18秒就能訓練出一個模型(包括特徵工程),而在CPU上則需花費數小時。

通過對抗性驗證來應對過度擬合。比賽選手常用的一種技術是建立一個判別器來預測訓練和測試/驗證集之間的差異。根據模型選擇特徵時使用的重要性分數,通過去除最重要的特徵,可以幫助模型更好地泛化。此技術有助於避免訓練數據過擬合。

上下文特徵的使用。今年的數據集和之前的數據集的一個重要區別是我們提供的上下文特徵。在三篇獲獎論文中,有兩篇對基於上下文特徵的BERT進行了複雜的使用。NLP中的深度學習方法已經證明了它對推薦系統的有用性,儘管我們認為在這個領域還有更多的改進空間。

決策樹與深度學習。梯度增強決策樹(GBDT)的一個顯著優勢是,無需對單個特徵的尺度進行歸一化和計算。這使得所有勝出論文的迭代速度更快。

在計算機視覺和NLP等領域,深度學習模型已經通過利用CNNs和transfomer展示了令人印象深刻的進展。基於這一挑戰的結果,我們仍然不明白在推薦系統中什麼構成良好的深度學習架構。我們呼籲研究界共同尋找推薦器系統的最佳深度學習架構。

我們也注意到,雖然我們只對提交的模型的性能進行了評估,但在生產系統中還有許多其他限制。對我們來說,延遲是一個大問題:模型需要在毫秒內對推文進行評分。在這種情況下,需要仔細檢查集成方法的使用。集成中每一步的附加延遲都可能會導致它們對我們的目標來說太慢。

我們感謝所有參與者和我們的同事使這得一挑戰成為可能。我們相信,發布大規模數據集將有助於解鎖推薦系統領域的新進展。Twitter現在比以往任何時候都致力於幫助外部研究,並且最近為學術研究人員發布了新的API埠,以幫助促進進一步的探索和合作。  

[1] J. Pan et al. Adversarial validation approach to concept drift problem in user targeting automation systems at Uber (2020) arXiv:2004.03045. Introduces adversarial validation, a powerful technique used by several participants.

[2] L. Belli et al. Privacy-Aware Recommender Systems Challenge on Twitter’s Home Timeline (2020) arXiv:2004.13715 provides the details about the challenge and the dataset.

[3] B. Schifferer et al., GPU Accelerated Feature Engineering and Training for Recommender Systems (2020). Proc. Recommender Systems Challenge 2020. Nvidia’s submission, also described in their blog post.

[4] M. Volkovs et al., Predicting Twitter Engagement With Deep Language Models (2020). Proc. Recommender Systems Challenge 2020. Learner’s submission.

[5] S. Goda et al., A Stacking Ensemble Model for Prediction of Multi-Type Tweet Engagements (2020). Proc. Recommender Systems Challenge 2020. Wantely’s submission.

[6] The full list of features with importance for different objectives like Retweet/Reply is available in the appendix of the Nvidia paper.

AI研習社是AI學術青年和AI開發者技術交流的在線社區。我們與高校、學術機構和產業界合作,通過提供學習、實戰和求職服務,為AI學術青年和開發者的交流互助和職業發展打造一站式平臺,致力成為中國最大的科技創新人才聚集地。

如果,你也是位熱愛分享的AI愛好者。歡迎與譯站一起,學習新知,分享成長。

雷鋒網版權文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 推薦系統頂會RecSys2020大獎出爐!騰訊摘獲最佳長論文獎
    作者 | 陳大鑫近日,RecSys 2020官網公布了本屆最佳長短文論文獎。官網地址:https://recsys.acm.org/best-papers/RecSys 2020這次也公布了五位最佳審稿人(Best Reviewer):Bart Goethals、Peter Knees、Scott Sanner、Steffen Rendle、Toine Bogers。
  • innocent推出了新飲料,但是twitter上卻在爭論他的顏色?
    有位twitter用戶將「bolt from the blue」的顏色和找來的pantone3282色卡進行了比較,他說:「事實上,它看起來更像綠色,而不是藍色。」圖片來源:innocent/twitter甚至有人建議它是藍綠色的,但是twitter的用戶們都沒有妥協。最後,innocent的飲料在twitter上被轉發了2500多萬次,最終也沒有得到一個屬於它的顏色。
  • 只在概念裡,就把周邊小戶型房價帶到破15萬,這是深圳什麼中學?
    深圳羅湖區是深圳老牌商業地帶,有著名的螺嶺外國語實驗學校和深圳小學,有深圳排名第一的高中,深圳中學。2020年12月,一個原先掛牌260多萬的23平米小單間突然以單價13萬、總價300萬成交。據中介介紹,這套原先掛賣很久沒有售出。為什麼突然漲價成交了呢?
  • 科學能從宗教中學到什麼,新一代無神論者試圖挑戰人類信仰
    在第二次世界大戰期間,各種確定性受到挑戰,導致科學與宗教的邊界特別有彈性,但是在第二次世界大戰之後,邊界開始變硬。宗教逐漸淪為私人領域-與科學家的日常工作分開-並且出現了新的變化,即宗教隨著科學的發展而失去了合法性。這種變化不可避免地將我們引向了現在。
  • 2020年象賢中學招生政策問答
    2020招生政策問答 是否有戶籍限制 2020象賢中學招生政策問答第二期,為您答疑解惑! 分數線及錄取要求 學校有對部分中考生有加分政策嗎?政策是如何要求?
  • 湖南師大附中、長沙市一中、長郡中學、雅禮中學面向全省招生
    湖南四大名校指的是湖南師大附中、長沙市一中、長郡中學、雅禮中學。也很難進入到四大名校讀書。而在今年2020年6月底,湖南教育廳發布了最新的政策變更!根據最新6.29日公布的《關於批准部分公辦普通高中面向全省招生的通知》,明確了2020年起湖南師大附中、長沙市一中、長郡中學、雅禮中學可面向全省分別下放100個招生計劃!
  • 長沙四大名校入學篇|熱血青春,不負韶華—雅禮中學2020年軍訓開營
    為鍛造學生吃苦耐勞的意志品質和培養愛國主義、集體主義精神,幫助學生養成良好的生活作風和學習習慣,我校如期舉行2020級新生軍訓開營儀式。每年的新生軍訓,是唯上學子的必修課程。2020級高一新生軍訓開營儀式在雅禮洋湖實驗中學田徑場隆重舉行。
  • Bubbly:語音Twitter
    Bubblemotion相關圖片(圖片來源:Techweb.com.cn)【TechWeb報導】6月2日消息,新酷網站:語音twitter註冊和發布信息均為免費,用戶將錄製的聲音更新到手機,然後所有粉絲將收到一條簡訊通知,這時可以選擇是否收聽,如果選擇收聽則要根據內容時間的長短收費。這麼說來,Bubble也沒啥特別之處。
  • ...長沙市一中、長郡中學、雅禮中學……2020年湖南8所高中可面向...
    為加強高素質軍事飛行人才、拔尖創新人才、藝術特長人才的選拔培養,近日,湖南省教育廳批准了包括↓長沙市一中湖南師大附中長沙市長郡中學雅禮中學在內的8所公辦高中,將面向全省少量招生。四所現代教育實驗學校面向全省招生據介紹,為推進普通高中育人方式改革,加強拔尖創新人才早期培養,今年,省教育廳決定適當擴大現代教育實驗學校建設規模,在長沙市一中、湖南師大附中的基礎上,同意長郡中學、雅禮中學也列為湖南省現代教育實驗學校。今年將以」四校」為基地,面向高潛質學生,實施拔尖創新人才早期培養計劃。
  • 「視頻」薛城舜耕中學舉行2019-2020學年度教學工作總結表彰會
    2019-2020學年度教學工作總結表彰會在棗礦接待中心舉行。副校長褚衍偉宣讀《關於表彰2019-2020學年度教學工作先進集體、先進個人的決定》並進行頒獎,獲獎教師身披紅色綬帶上臺領獎,接受學校領導和同事們的掌聲與祝福。
  • Twitter
    第一步:先打開Twitter的帳號註冊界面第二步:填寫好郵箱,名稱,密碼這些信息,點擊註冊第三步:任意關注5個推特帳號,下一步上傳頭像,填寫簡介第四步:到剛才填寫的郵箱中激活twitter官方發的郵件就完成註冊了最好是利用你的真實姓名或常用ID來註冊,否則你的朋友無法容易的找到你,另外上傳一個照片同樣對你有所幫助。
  • 毛坦廠中學分校—葉集皖西當代中學 2020年高考復讀班招生簡章
    毛坦廠中學分校—葉集皖西當代中學 2020年高考復讀班招生簡章 2020-07-15 17:44 來源:澎湃新聞·澎湃號·媒體
  • 時光倒流,挑戰慶聲】是什麼挑戰呢 一起來看看吧
    時光倒流,挑戰慶聲】是什麼挑戰呢 一起來看看吧時間:2020-09-26 20:16   來源:格雷   責任編輯:凌君 川北在線核心提示:原標題:【時光倒流,挑戰慶聲】是什麼挑戰呢 一起來看看吧 【時光倒流,挑戰慶聲】是什麼挑戰呢?
  • 大埔縣虎山中學舉行2020屆成人典禮
    虎山中學舉行「感恩•擔當•奮鬥」為主題的2020屆成人典禮。  活動中,虎山中學2020屆高三學子在家長的陪同下,走過紅地毯,穿過成人門陸續進入到主會場。成人典禮在莊嚴的升旗儀式中拉開帷幕。家長為學生們授戴徽章和絲帶並贈予禮物,全體學生進行了成人宣誓,並向老師和家長行感恩禮。同時,活動還為優秀學生進行了頒獎。  虎山中學校長黃廣華、家長代表和學生代表分別作了發言。
  • 青島國家海洋科學研究中心副主任黨安濤到高密市第一中學開展科普...
    為深入貫徹落實習近平總書記關於「科技創新、科學普及是實現創新發展的兩翼,要把科學普及放在與科技創新同等重要的位置」的重要指示精神,11月27日上午,青島國家海洋科學研究中心副主任黨安濤到高密市第一中學開展了題目為「認識海洋,經略海洋——走進深海世界」的科普講座。
  • 再現2020年西南大學附屬中學創新發展的十二個瞬間
    疫情防控期間,一邊備課一邊照顧孩子的西大附中教師西大附中2020年度熱詞之「集團化辦學」2020年9月,西南大學附屬中學本部(東區)、重慶兩江新區西南大學附屬中學重慶兩江新區西南大學附屬中學是一所由兩江新區全額撥款的優質公辦學校,位於重慶兩江新區核心腹地大竹林片區和照母山片區。
  • 2020重慶市南開中學校教師招聘33名公告
    2020重慶市南開中學校教師招聘33名公告 http://chongqing.hteacher.net 2020-09-16 11:27 重慶教師招聘 [您的教師考試網]
  • 元氣騎士挑戰因子圖標大全2020 挑戰因子圖鑑最新版
    在元氣騎士遊戲中,我們時會看到各種帶著挑戰因子的怪物,各類挑戰因子分別是什麼意思呢?為了幫助玩家們輕鬆區分,這裡就為大家送上元氣騎士挑戰因子圖標大全2020最新圖鑑。挑戰因子圖標大全 2020最新版關於挑戰因子的常見問題介紹:
  • 土耳其封Twitter與YouTube 法院裁定政府違法
    而技術嫻熟的土耳其人,甚至包括土耳其總統居爾,則利用各種途徑照舊使用Twitter,而且還推出了「Twit-te r在 土 耳 其 被 封 了 」(#twitterisblockedinTurkey)這個Twit-ter標籤,此標籤在出現後的24小時內就被轉發了超過50萬次。  一些土耳其技術精英還總結出了繞過網絡封殺的各種攻略等等,教普通民眾如何「翻牆」。
  • 2020社交媒體Twitter上最有影響的法國學校排名
    > Twitter上最有影響力的法國10所藝術類院校 最後是工程師學校在twitter