京東DNN Lab新品用戶營銷的兩種技術方案

2020-12-15 CSDN技術社區

當電商網站發布一款新產品的時候,怎樣找到一群最有可能購買該新品的用戶進行營銷是一種提高產品銷量的重要手段。當然全網營銷手段肯定能覆蓋所有用戶,但這樣做一方面浪費資源,增加營銷成本;另一方面用戶收到過多不感興趣的信息,會讓用戶反感,降低用戶的體驗度。

電商數位化營銷成為了營銷過程中必不可少的手段。為了篩選出最有可能轉化的用戶,京東DNN實驗室結合大數據進行了相關研究。本文以新品手機為例,使用商品相似度和基於分類的手段進行用戶群篩選。

餘弦相似度的篩選方式

在實際應用中,我們為了找出相似的文章或者相似新聞,需要用到「餘弦相似性」,下面我們舉例說明什麼是餘弦相似性。為了簡單起見,我們來看兩個簡單的句子。

句子A:我喜歡吃中餐,不喜歡吃西餐。

句子B:我不喜歡吃中餐,也不喜歡吃西餐。

我們怎樣才能計算A,B句子的相似度呢?

基本思路是:如果這兩句話的用詞越相似,它們的內容就應該越相似。因此,可以從詞頻入手,計算它們的相似程度。下面是具體的實施步驟:

1. 分詞

句子A:我/喜歡/吃/中餐,不/喜歡/吃/西餐。

句子B:我/不/喜歡/吃/中餐,也/不/喜歡/吃/西餐。

2. 列出所有的詞

我,喜歡,中餐,西餐,吃,不,也

3. 計算詞頻

句子A:我 1,喜歡 2,中餐 1,西餐 1,吃 2,不 1,也 0

句子B:我 1,喜歡 2,中餐 1,西餐 1,吃 2,不 2,也 1

4. 構造詞頻向量

句子A:[1, 2, 1,1, 2, 1, 0]

句子B:[1, 2, 1,1, 2, 2, 1]

通過上面的步驟,問題就變成了如何計算兩個向量的相似度。我們可以把它們想像成空間中的兩條線段,都是從原點([0, 0, ...])出發,指向不同的方向。兩條線段之間形成一個夾角,如果夾角為0度,意味著方向相同、線段重合;如果夾角為90度,意味著形成直角,方向完全不相似;如果夾角為180度,意味著方向正好相反。因此,我們可以通過夾角的大小,來判斷向量的相似程度。夾角越小,就代表越相似。


以二維空間為例,圖1中的a,b是兩個向量,我們要計算它的夾角θ,餘弦定理表明可以用以下公式求得:

    (公式1)

假定a是向量[x1,y1],b是向量[x2, y2],那麼可以將餘弦定理改寫成如下形式:

    (公式2)

已經證明餘弦定理對n維向量也成立。一般的,A,B是兩個n維向量,A是 [A1, A2, ..., An] ,B是 [B1, B2, ..., Bn] ,則A與B的夾角θ的餘弦等於:

(公式3)

使用公式3,可以計算出句子A和句子B夾角的餘弦:


餘弦值越接近1,就表明夾角越接近0度,也就是兩個向量越相似,這就叫"餘弦相似性"。所以,上面的句子A和句子B是很相似的,事實上它們的夾角大約為20.3度。

基於以上,我們可以得出文本相似性的一種算法。

  1. 使用關鍵詞提取算法(例如:TF-IDF),找出兩篇文章的關鍵詞。
  2. 每篇文章各取出若干個關鍵詞(比如50個),合併成一個集合,計算每篇文章對應集合中的詞頻(為了避免文章長度的差異,可以使用相對詞頻)。
  3. 生成兩篇文章各自的詞頻向量。
  4. 計算兩個向量的餘弦相似度,值越大就表示越相似。

基於餘弦相似度的商品相似度模型

得出了餘弦相似度的數值之後,如何利用它進行新品推薦呢?首先在餘弦相似度計算中,我們需要構造兩個向量進行相似度計算,在新品推薦中我們如何構造這兩個向量呢?

結合大數據分析技術,基於用戶的歷史購買記錄刻畫出用戶對於手機這個品類各特徵的偏好程度,如品牌、價格、顏色、作業系統等偏好。經過計算之後每一個用戶對手機這個品類都有一個特徵偏好向量,這樣將新品手機各個特徵轉換為一個向量即可進行餘弦相似度計算,最後執行排序篩選出靠前的用戶即可。下面是具體的實施方案。

1. 提取用戶手機歷史購買數據,基於統計計算出品牌特徵,顏色特徵等的偏好,計算公式如下:


例如,計算華為品牌的偏好為:


2. 將用戶每一個特徵偏好組合表示為特徵偏好向量:


3. 將新品手機特徵表示為向量:

新品的特徵向量維度值取值為0或者1,例如新品品牌為華為,則華為這個特徵為1,其他品牌特徵值為0。

4. 計算餘弦相似度:


其中simi值越大表示越相似。

5. 執行排序:根據simi值進行排序,取最相似的一部分用戶進行營銷。

基於權重的餘弦相似度

在前文中提到的算法,特徵維度沒有考慮特徵的權重,所有特徵的權重都是相同的。對於購買手機來說,價格、品牌和網絡制式等特徵權重設置為相同可能不合理,所以需要對用戶購買手機的行為進行分析,分析主要特徵,形成權重特徵向量:


特徵加權之後相似度計算公式如下:


優化與改進

基於餘弦相似度的新品用戶營銷有以下缺點:

用戶之前必須購買過同品類商品,這樣才能計算商品相關的偏好。對於沒有購買過該品類的用戶不會參與運算。可以考慮從用戶瀏覽,關注數據統計出用戶該品類的商品偏好。計算用戶偏好沒有考慮時間屬性,只是基於統計概率。有可能用戶最近購買了蘋果手機,之前購買了幾個華為手機,按照偏好計算公式,華為的偏好值高於蘋果的偏好值,但是用戶最近在手機上真實的偏好卻是蘋果。偏好計算可以考慮把時間因素加入,應該隨時間增加而衰減。

用餘弦相似度進行新品營銷是基於這樣一個假設:即用戶通常會購買與之前商品相近或者說同類型的商品。然而有時候這樣的假設是不合理的,所以需要針對具體的品類,提前做品類下哪些因素是決定用戶購買的因素,用戶對什麼因素粘性度比較高。

基於SVM新品營銷

下面我們換一種方式進行新品營銷,我們採用分類算法。使用SVM進行分類預測,下面介紹SVM的具體流程。

特徵篩選與特徵表示

說到分類算法,首先我們需要解決的問題是特徵怎麼提取和表示。下面將介紹我們使用到的具體流程:

1. 提取行為數據。按照商品品類維度,時間維度以月為單位提取用戶的品類PV,購物車和訂單等行為數據。

2. 清洗數據,提取轉換特徵。將時間維度分為多個區間,每個區間內每一個維度的數據劃分為多個區間。比如PV這個維度在品類category1下會形成以下特徵。


3. 特徵向量化。根據步驟2提取的特徵與特徵的索引,將每一個用戶用特徵向量表示為: 


其中fi取值為0或則1,向量的維度表示特徵的索引。

樣本選取

樣本選擇有以下方式:

  1. 選擇之前購買過和新品相似商品部分用戶作為正樣本,沒有購買過的部分用戶作為負樣本。
  2. 選擇新品發布後購買的用戶作為正樣本,沒有購買過的部分用戶作為負樣本。

以上兩種方案各有優缺點:方案1的難點在於尋找相似的商品A,且提取轉換特徵的時候需要注意時間維度,時間必須卡在A商品銷售之前。方案2需要新品銷售一段時間後才會有正樣本數據。方案2適合於二次營銷,方案1適合於首次營銷。

模型訓練

可以選用java版本的liblinear進行模型訓練。

用戶提取

根據模型訓練得出的結果,再根據預測概率進行排序,取靠前的用戶進行營銷。

實驗結果

A/B test 實驗中,分別應用以上方法篩選的用戶集和基於經驗(規則)方法篩選的用戶集進行營銷效果對比。最後實驗結果表明:基於以上兩種方法在訂單轉化率,促成總金額方面都比基於經驗的方法效果好。可以廣泛應用於數位化營銷中,帶來比較高的轉化率。

展望與未來

這兩種技術方案,可以很好的用於數位化的營銷當中。對於數位化營銷來說,精準的數據量可以很好的控制營銷成本。因為一個熱門商品和一個冷門商品需要的營銷人員在數量上是存在差距的,造成的營銷成本也有差異。對於這兩種技術方案,仍然需要進一步優化以得到更為精準的數據量,在未來首先要優化並結合先進的DNN模型,提升模型效果;其次結合商品銷量預測,確定最終需要營銷的人數。

作者簡介:李雲彬,京東算法工程師。於2012年7月加入京東。曾負責京東廣告相關業務開發工作,目前致力於京東用戶圖譜相關工作。主要研究方向有大數據分析技術,數據挖掘技術等。


(責編/周建丁)


【預告】

首屆中國人工智慧大會(CCAI 2015)

將於7月26-27日在北京友誼賓館召開。機器學習與模式識別、大數據的機遇與挑戰、人工智慧與認知科學、智慧機器人四個主題專家雲集。人工智慧產品庫將同步上線,預約諮詢:QQ:1192936057。歡迎關注。

本文為CSDN原創文章,未經允許不得轉載,如需轉載請聯繫market#csdn.net(#換成@)

相關焦點

  • 京東618發布「超級新計劃」,「京東小魔方」引爆新品狂歡潮
    一般來說,產品要經歷從上市之初被消費者初步認知,到消費者購買,再到購買熱度提升或消退的生命周期,京東超級新計劃的解決方案就從產品的這一生命周期入手。對應生命周期每個階段,京東為新品打造從「種草(上市預熱)—拔草(上市&首發)—養草(持續&轉化)」的全生命周期解決方案。
  • 京東618最佳內容營銷!看汽車技術領軍品牌博世如何詮釋電商時代的...
    在5月21日舉行的「2019京東618全球品牌峰會」上,德國製造的「金字招牌」、全球第一大汽車技術供應商——博世憑藉與京東合作多年來極具創意的線上活動和內容營銷,被授予「2019京東零售最佳內容營銷獎」。
  • 京東發布「超級新計劃」,新品狂潮強力助威618
    「三步走」打造超級新品  京東推出「京東超級新計劃」,希望通過整合平臺優質資源,為品牌打造新品全生命周期的運營解決方案,助力品牌提升新品運營能力。  對應生命周期每個階段,京東為新品打造從「種草(上市預熱)—拔草(上市&首發)—養草(持續&轉化)」的全生命周期解決方案。
  • 京東OPPO聯手打造「京晚8點」內容營銷,手機新品助力OPPO Reno上市...
    近日,京東手機將此洞察進行了深度放大,從情感角度出發,將營銷場景聚焦於#90後的夜半場#,在京東手機4月新品季之際,聯合「京晚8點」頭部內容整合營銷IP,結合OPPO Reno新品上市及夜拍功能,以內容營銷為發力點,為品牌量身打造了新品營銷整合陣地。
  • 文章頻道 - 未來已至,京東無界營銷開創營銷黑科技新玩法
    在不久前,京東舉辦了以「新趨勢 新格局 新時代」為主題的2018無界營銷行業峰會,探討無界營銷,並首次對外發布了無界營銷時代的解決方案—— JD BrandEco 品牌營銷生態,要求營銷價值鏈各方開放、賦能、共創。
  • 京東家電618排行榜:超級品牌日當天營銷王飛利浦幹翻了新品王戴森
    去年11月1日11.11全球好物節開門紅0時上線僅僅15秒鐘,首批上千臺就被京東的用戶一搶而空,實在讓人瞠目結舌。可是,或許你不知道的是,11.11期,全網有60%的戴森捲髮棒是由京東售出的,而在11.11之後一直到現在,這款產品始終處於上架即秒光的熱銷狀態。這也直接推動了戴森在5月21日的2019京東618全球品牌峰會上榮獲最佳新品營銷獎。
  • 新品如何火速出圈?京東營銷360引爆雀巢金牌掛耳咖啡「開掛」式增長
    雀巢金牌"手衝大師"咖啡在上市期基於京東營銷360旗下京東數坊的數據能力,高精度鎖定目標人群,制定精準廣告投放與內容營銷策略,用最貼切的場景溝通打動目標消費者,有效促成了站外拉新,站內轉化,讓雀巢掛耳咖啡新品上市首月就取得了"開掛"般的銷售成績,成為一匹黑馬躋身品類排名TOP1。
  • 京東營銷360首發JD GOAL方法論 助品牌全鏈路用戶增長
    京東營銷360從4A消費者資產管理體系開始沉澱用戶資產,利用自身數據優勢和平臺資源,融入用戶生命周期理論進行精細化運營,近日京東營銷360又進一步迭代打造了業內第一個以大數據驅動的品牌用戶增長方法論——JD GOAL。
  • 【清華x-lab Today】清華x-lab DemoDay給創業團隊對接豐富資源
    ;通過自主開發的雲平臺數據分析和自動化流程,為用戶提供健康評估和個性化幹預方案,實現閉環,幫助服務方提高效率和質量。通過「員工健康寶」方案切入千億級別的企業體檢市場,平臺上線半年已經為近30家機構採用;公司產品和服務在保險公司、醫院、健康管理機構、園區、藥店以及養老等領域有廣闊市場空間。核心團隊包括前IBM、Intel技術骨幹、營銷專家及資深醫生。
  • 大中華區艾菲對話京東顏偉鵬博士:深度解讀京東營銷體系
    京東早已不再只是單一的電商平臺,依託於平臺的海量用戶,對購物者行為進行深入洞察,形成具有獨特價值的理論體系,進一步促進品牌用戶增長,刺激銷售轉化。 2020年大中華區艾菲戰略升級,攜手京東零售,設立了購物者營銷專項賽道。面向傳統零售行業和電子商務領域,立足企業品牌核心,針對市場新環境下的趨勢與機遇,共同挖掘優秀的購物者營銷案例,共同賦能品牌實效價值和更多元發展。
  • 禧天龍抗菌新品京東首發 開啟全民「抗菌大作戰」
    京東時尚居家事業群家居日用部總監張銅城與禧天龍營銷中心總經理潘富望共同籤署了全球首發戰略協議,本次發布會中亮相的禧天龍抗菌新品將同步在京東全網首發,為京東用戶帶來高品質的抗菌家居產品,有助於保障用戶居家生活健康。
  • 【清華x-lab iBoard】清華x-lab項目融資路演會誠請校友投資人來參加
    是目前接入設備最多、用戶體驗好、性價比優的開放平臺;通過自主開發的雲平臺數據分析和自動化流程,為用戶提供健康評估和個性化幹預方案,實現閉環,幫助服務方提高效率和質量。通過 「員工健康寶」方案切入千億級別的企業體檢市場,平臺上線半年已經為近30家機構採用;公司產品和服務在保險公司、醫院、健康管理機構、園區、藥店以及養老等領域有廣闊市場空間。核心團隊包括前IBM、Intel技術骨幹、營銷專家及資深醫生。
  • 炫邁新品S架無糖薄荷糖京東掌柜寶首發
    北京2018年7月27日電 /美通社/ -- 近日,億滋旗下炫邁品牌代言人王大陸在京東掌柜寶平臺開展億滋大牌日直播活動,並在掌柜寶平臺首發炫邁新品S架無糖薄荷糖。本次直播首次以京東便利店作為直播地點,並通過京東掌柜寶的平臺資源進行線上直播,拉近了品牌與小店店主的距離。
  • 京東國際多維扶持POP商家入倉,共享全球供應鏈「技術惠捷」福
    2020年,京東國際將圍繞「用戶增長」、「雙模驅動」、「生態建設」三大必贏之戰,推動平臺和商家的高速發展,離目標實現更近一步。用戶增長始終是平臺、商家可持續發展的關鍵。2019年,京東國際的用戶數保持高速增長,高淨值用戶增長超過50%,京東PLUS用戶的增速是整體用戶增速的3倍,四線及以下城市用戶增長超過整體大盤數據。
  • 聚合平臺五大能力啟動"造新計劃" 京東小魔方重新定義新品行業遊戲...
    面對消費者日益旺盛的新品需求,京東針對新品業務傾注了大量資源,在2019年發布了"京東超級新計劃",並針對性推出新品首發平臺"京東小魔方",為新品打造了貫穿"種草(上市預熱)—拔草(上市&首發)—養草(持續&轉化)"的全生命周期解決方案。新品卓著的市場引領能力讓京東看到了巨大的發展潛力,倒逼京東小魔方不斷完善新品運營能力,加強內容生態資源投入。
  • 松下洗衣機攜手京東發布2020滾筒新品
    5月28日,主題為「守護健康,煥新生活」的京東&松下洗衣機戰略合作暨2020滾筒新品上市首發儀式在北京松下紀念館正式召開。不管陰天雨天,還是霧霾天,都能讓用戶告別傳統晾曬,享受「一洗即幹」的便捷體驗,讓陽臺變花園不再是夢想。聚焦痛點,健康洗衣進入2020年以來,健康成為全社會關注的焦點問題。京東家電數據顯示,具有健康除菌功能的冰箱和洗衣機,3月份相關詞條搜索流量同比增長高達55%。
  • Apple授權經銷商門店獨家上線京東到家 iPhone 12新品開售後1小時...
    讀創/深圳商報記者 陳姝北京時間10月14日凌晨1點,Apple年度旗艦iPhone 12系列新品正式發布,點燃了眾多用戶和數碼愛好者的消費熱情。目前,用戶登錄京東到家APP、小程序等官方渠道即可了解新品信息和購買信息。10月23日新品發售後,消費者就可以在京東到家平臺上選擇附近Apple授權經銷商門店、京東專賣店等手機數碼品牌門店下單,達達集團旗下本地即時配送平臺達達快送信用騎士會第一時間將新機送達,讓用戶享受到手機數碼產品1小時達的便捷服務。
  • Apple授權經銷商門店獨家上線京東到家iPhone12新品開售後1小時送達
    北京時間10月14日凌晨1點,Apple年度旗艦iPhone 12系列新品正式發布,點燃了眾多用戶和數碼愛好者的消費熱情。目前,用戶登錄京東到家APP、小程序等官方渠道即可了解新品信息和購買信息。10月23日新品發售後,消費者就可以在京東到家平臺上選擇附近Apple授權經銷商門店、京東專賣店等手機數碼品牌門店下單,達達集團旗下本地即時配送平臺達達快送信用騎士會第一時間將新機送達,讓用戶享受到手機數碼產品1小時達的便捷服務。
  • 京東「京享無憂」強勢助力 讓你放心購iPhone新品
    作為Apple長期的合作夥伴和Apple新品首發平臺之一,京東將於北京時間9月21日同步上線全新iPhone,值得一提的是,此次還有全面升級的「京享無憂」服務,讓你放心購iPhone新品。  此次針對Apple新品進行的「京享無憂」服務升級,主要是為購買Apple產品的用戶推出了獨家定製的從購買到售後全方位的一站式無憂服務,其中包括有換修無憂、上手無憂、京享VIP、京準達、京東維修和以舊換新。值得一提的是,京東作為Apple長期合作夥伴,是國內首家提供換修無憂和上手無憂服務的電商平臺。
  • 京東到家上線約500家Apple授權經銷商門店 iPhone 12新品開售後1...
    【TechWeb】10月14日消息,iPhone 12系列新品今天正式發布,隨後,京東到家也與Apple授權經銷商、京東專賣店等手機數碼品牌門店開啟新機預熱和購買活動。目前,用戶登錄京東到家APP、小程序等官方渠道即可了解新品信息和購買信息。