IJCAI 2018廣告算法大賽落下帷幕,Top 3 方案出爐

2021-01-10 雷鋒網

雷鋒網 AI 研習社消息,IJCAI-18 阿里媽媽搜索廣告轉化預測比賽近日落下帷幕,本次比賽為阿里媽媽與 IJCAI2018、天池平臺聯合舉辦,總獎池 37000 美元,共吸引到 5204 支隊伍參賽。

此次比賽提供了廣告點擊相關的用戶(user)、廣告商品(ad)、檢索詞(query)、上下文內容(context)、商店(shop)等信息,參賽選手需要在這些條件下預測廣告產生購買行為的概率(pCVR),形式化定義為:

pCVR=P(conversion=1 | query, user, ad, context, shop)

主辦方希望在考慮到用戶行為偏好、商品長尾分布、熱點事件營銷等一系列因素的前提下,利用海量交易數據準確高效地預測用戶購買意向。此次比賽設置了如下兩類挑戰:

日常的轉化率預估特殊日期的轉化率預估

目前,比賽結果已經出爐。雷鋒網看到,來自京東尚科,天池代號為「plants」的選手獲得冠軍,IJCAI-17 冠軍團隊獲得者周耀、郭鵬博以及李智獲得季軍,浙江工業大學陳波成、中南大學羅賓理和天津大學吳昊組成的「躺分隊」獲得第三名,作為前三名中唯一一支學生團隊,他們的比賽方案也已經出爐。

在方案中,他們主要討論了異常日期處理問題,主要思路如下:

難點與挑戰

這次比賽的難點有二,一是如何在正常流量數據中,找到適合表達促銷/突變的特徵;二是如何在模型選擇上,找到儘快落地於工業界的輕量級框架。

分析數據

訓練數據為 8 月 31 日- 9 月 7 日上午,需要預測 9 月 7 日下午的用戶點擊率,8 月 31 日-9 月 5 日轉化率穩定,但 6 日下降,7 日猛增,推測 7 日為大促節日。

對於異常日期處理而言,僅僅考慮前六天的轉化率和第七天的高轉化率是不太適合的,如何處理第七天的轉化率異常是這道題需要解決的一大痛點。

四種訓練集劃分

針對此問題,他們根據對數據的分析、特徵的構建、以及對實際場景的思考,提出了四種訓練集劃分:

1. 全量統計特徵提取第七天特徵——all-to-7 2. 全量數據的抽樣統計——sample 3. 單獨第七天的特徵提取——only7 4. 全量數據——all

構造四種訓練集劃分的目的如下:

1)構造出訓練集中的差異性,方便模型融合

2)在每組訓練集中,對高維特徵進行選擇,選擇後進行特徵分組

特徵工程:

首先執行如下三步操作:

上述基礎特徵分列去掉取值變化小的列去掉缺失值過多的列

分析過程如下:

特徵工程總覽如下:

特徵選擇

特徵選擇的方法有如下2點:

1)羅賓理同學在GitHub的開原始碼,參照糖尿病精準醫療大賽的特徵選擇,地址如下:

https://github.com/luoda888/tianchi-diabetes-top12/blob/master/README.md

以及利用貪心、模擬退火算法,構造出多組特徵,適用於組內模型融合。

2)利用 Std/Mean 訓練集測試集分布一致的思想,進行特徵選擇,保證線上線下特徵的一致性。

模型選擇及融合

分組後對不同的模型進行訓練,構造組內特徵的差異性,模型的差異性 。

他們選擇的方法有 Xgboost/Lightgbm/GBDT+LR/Catboost/NN 模型

在 NN 模型裡,使用對多個模型求 Average 的方法,使用的模型如下:

DeepFM/DeepFFM (原始 ID 特徵放入交叉層) 與 Lightgbm 線下差距 0.0001 (千分點) AFFM/AFM (對原始 ID 特徵加入 Attention) 與 Lightgbm 線下差距 0.00001 (萬分點) FNN/FFNN/NFM (將特徵工程後放入網絡結構) 與 Lightgbm 線下差距 0.0001 (千分點)

將上述模型按對該組訓練集的數據敏感性訓練後加權,得到該組 NN 的結果 Ans_nn。每組特徵都可以放入上述五個模型中,即組內選擇出的特徵數 n 乘以組內模型數 m 即為該組模型的數量 = n*m。根據模型間的相關性,分配不同的權重進行加權融合,得到該組的答案 Ans_k。

接下來,在組間訓練集中,對每組的 Ans_k 進行加權融合得到 Ans_final,然後利用前六天的上下午,每小時均值的變化趨勢,線下預測出線上可能的均值,為 0.036287135,最後對 Ans_final 做 Logit 逆變換。

模型融合框架如下:

對比賽的總結有如下三點:

1)對促銷時期應考慮變化特徵

2)合理的特徵提取框架是致勝之道

3)多模型的融合提升精度較多

方案詳情:https://github.com/luoda888/2018-IJCAI-top3

比賽官網:https://tianchi.aliyun.com/competition/introduction.htm?spm=5176.11163580.0.0.4f5564f0sOZqnA&raceId=231647

雷鋒網 AI 研習社編輯整理。

相關焦點

  • 全國職業技能大賽教學能力大賽在湖南化工職業技術學院落下帷幕
    圖片均由實習記者 黎蕾 顏美/攝)  星辰在線12月13日訊(星辰全媒體記者 湯佛 實習記者 黎蕾 顏美)12月12日,全國職業院校技能大賽教學能力大賽閉賽式在位於株洲的湖南化工職業技術學院大禮堂落下帷幕。
  • 2018年度「精藝求菁-神經外科青年醫生手術技能大賽」成功落下帷幕!
    年度「精藝求菁-神經外科青年醫生手術技能大賽」。趙繼宗院士發表致辭時指出:「這是中華醫學會神經外科學分會第4次舉辦神經外科青年醫生手術技能大賽,希望以此為契機,為年輕的神經外科醫師提供交流、分享、學習、提高的平臺,推動我國神經外科的發展」。
  • 《主持人大賽》落下帷幕,「鄒韻好穩」上熱搜!董卿如何評價?
    歷時半年激烈角逐,《中央廣播電視總臺主持人大賽》昨晚正式落下帷幕,記者型主持人鄒韻眾望所歸,以98.312的高分成為本屆主持人大賽新聞類的冠軍。在前晚播出的另一場總決賽中,蔡紫獲得文藝類冠軍。昨晚節目中,晉級新聞類總決賽的6位選手是鄒韻、馮碩、田靖華、白影、王嘉寧和姚軼濱。
  • 《主持人大賽》落下帷幕,文藝組冠軍蔡紫背景遭起底,老公可是大有...
    不久之前,萬眾矚目的《主持人大賽》終於落下帷幕,蔡紫獲得了文藝組的冠軍,蔡紫在總決賽的比賽中的發揮也讓董卿讚嘆不已。 臨場發揮,光彩奪目 總決賽的第一場比賽中蔡紫與李七月抽到了一組,她們兩個可是觀眾是最為看好的兩個人,水平就在伯仲之間。
  • 為流浪乞討人員構築「溫暖之家」 合肥救助站專項救助行動落下帷幕
    3月15日,合肥市救助管理站「寒冬送溫暖」專項救助工作圓滿落下帷幕。2018年11月至今年3月,在為期4個多月的專項救助行動中,合肥市救助管理站共救助流浪乞討人員1297人次,發放棉被152床,棉大衣352件,棉衣棉褲152套,棉鞋268雙。
  • 解約風波裡逆風而行,鄧紫棋世界巡迴演唱會高雄站落下帷幕!
    解約風波裡逆風而行,鄧紫棋世界巡迴演唱會高雄站落下帷幕!27日晚,鄧紫棋2019年世界巡迴演唱會倒數第二站——高雄站落下帷幕!這是鄧紫棋與前經紀公司蜂鳥解約糾紛前安排的日程,為不讓粉絲們失望,履行好自己最後的義務,鄧紫棋也是拼盡全力在演唱會上呈現最棒的自己。
  • 2018飛馬之翼虹口區國際創業大賽總決賽成功舉辦
    點擊上方△藍字可關注我11月8日,2018飛馬之翼虹口區國際創業大賽總決賽,在虹口區白玉蘭黨建服務站正式拉開帷幕
  • 2018滾石原創大賽落幕 九連真人樂隊奪冠
    參賽選手鳳凰網娛樂訊(採寫/二萌攝影/卡卡西)11月10日,2018蝦米×滾石原創樂隊大賽在京落下帷幕。經過六小時激烈角逐,九連真人樂隊、猴子軍團樂隊以及薄荷綠樂隊從決賽十組競演樂隊中拔得頭籌,分獲冠亞季軍。
  • 深圳世界之窗「冰雪電音嘉年華」落下帷幕
    南方網訊 (記者/楊智明)風格獨特的電音大咖、中西交融的音樂曲風、魅力十足的電音現場……近日,由深圳世界之窗和SPACE PLUS聯手打造的「冰雪電音嘉年華」圓滿落下帷幕,為世界之窗遊客帶來更豐富、個性化的歡樂體驗。
  • 2015首屆「全國編唱大賽」落下帷幕
    近日,2015首屆」全國編唱大賽」獲獎名單正式公布,這場以網際網路為主陣地、著眼於對優秀編唱人才的挖掘,並以特邀評委點評、大眾票選為主要形式的線上音樂選秀,自開賽以來,就獲得了廣泛的關注與參與。歷時3個月的比賽中,選手們以原創歌曲《親愛的你》為藍本,在不改變歌詞的基礎上,通過重新改編與演繹,在充分表達自身音樂風格的同時,將這首好歌的深刻內涵全方位地挖掘呈現出來。
  • 「儘管如此世界依然美麗」漫畫完結 八年連載落下帷幕
    「儘管如此世界依然美麗」漫畫完結 八年連載落下帷幕 動漫 178動漫整編 ▪ 2020-08-23 09:55:59
  • 2018「小小外交之星」廈門市青少年英語能力大賽圓滿收官
    5月27日, 2018「小小外交之星」廈門市青少年英語能力大賽在領事館區大樓落下帷幕。
  • 信報廚藝大賽落下帷幕 金勺子大獎被老爺們摘走
      選手在臺上做菜   觀眾爭相試吃選手們做的美味   宋天一在臺上唱歌為孫樹偉加油   3場預賽,決出的6名選手,在比賽現場一決高下……8月12日下午4點,在李滄寶龍城市廣場寶萊百貨門前,一場本年度社區廚藝高手的決賽在眾多好奇圍觀者的注視下正式開比。
  • 巴南區第六屆「助你啟航」創業創新大賽10強項目火爆出爐
    戳現場考察經過緊張的複賽之後,創業大賽迎來了專家現場考察環節,2019年9月23日-25日,評委團隊深入本屆創業大賽前20強創業項目現場,詳細了解創業項目運行情況,並為創業者現場問診,最終將評定前10強創業項目進入總決賽。
  • 昂西動畫節落下帷幕 法國動畫摘取最佳長片獎
    Film Festival)落下帷幕,安東尼·德勒斯瓦和尤安·史法拍攝的從一隻貓的角度反思猶太宗教和猶太文化的動畫片《猶太長老的靈貓》摘得了最高獎項水晶獎,日本動畫導演原惠一執導的長片《意外的幸運籤》摘得了觀眾獎。中日合拍參賽片《藏獒多吉》沒有任何收穫,但影片將於近日與國內觀眾見面。
  • 滾石原創樂隊大賽落幕 九連真人獲與滾石籤約機會
    滾石原創樂隊大賽落幕 九連真人獲與滾石籤約機會 時間:2018.11.12 來源:新浪娛樂 分享到:
  • 話題:CIPS2020第24屆中國國際寵物水族展覽會在廣州落下帷幕
    話題:CIPS2020第24屆中國國際寵物水族展覽會在廣州落下帷幕   2020年11月15日在廣州中國進出口商品交易會展覽館CIPS2020第24屆中國國際寵物水族展覽會落下帷幕,本屆國際寵物水族展覽會為期4天,從11月12日到11月15日閉幕。
  • 2018粵港澳中學生廣府話大賽在廣州啟幕
    2018粵港澳中學生廣府話大賽在廣州啟幕 陳驥旻 攝中新網廣州9月13日電 (記者 索有為)「超粵未來」—2018粵港澳中學生廣府話大賽(以下簡稱「大賽」)9月13日在廣州粵劇藝術博物館劇場舉行新聞發布會,標誌此次大賽正式拉開帷幕。
  • 【車雲報告】ADAS視覺方案盤點上篇:攝像頭、晶片和算法
    這些創業公司可以統稱為視覺方案提供商。他們掌握核心的視覺傳感器算法,向下遊客戶提供車載攝像頭模組,晶片以及軟體算法在內的整套方案。前裝模式下,視覺方案提供商扮演二級供應商的角色,與Tier1配合為OEM定義產品。後裝模式裡,除了提供整套設備,也存在售賣算法的模式。
  • 葡萄牙寵物展落下帷幕 喜感羊駝最受矚目
    一年一度、為期3天的葡萄牙寵物展1日在葡首都裡斯本會展中心落下帷幕。本屆寵物展上共展出2500多隻寵物,除大多數常見的家庭寵物,還包括蜥蜴、變色龍、蟒蛇和貓頭鷹等罕有種類。其中,兩隻充滿喜感的羊駝吸引了眾多參觀者,人們紛紛與它們合影留念。