AI的本質,就是解決複雜場景的效率問題。
分享嘉賓:京東產品總監@朱文偉
本文為1月7日人人都是產品經理與騰訊大學聯合主辦的2017中國產品經理大會·上海站嘉賓分享內容整理總結,由人人都是產品經理合作夥伴@筆記俠 整理,部分內容有修改:
今天我會結合AI和營銷上的想法以及落地實踐的經驗,分享我們的一些思考。
數據很重要。我們稱現在是人工智慧的第三次浪潮。有兩個決定因素比較能論證這件事情是可以成功的:
第一是計算力。舉例來看:英偉達最近兩年的股票價格增長是600%,從一家市值一百多億美金的公司,到現在已經突破了一千兩百億,這是一個巨大的飛躍,得益於人工智慧的興起。
第二是數據。網際網路在經歷了這十幾二十年之後,已經把用戶的習慣和數據慢慢從線下引到線上。現在網際網路時代整體收集數據和清洗數據成本比以往要低得多,我們可以看一下數據的重要性。
這裡涉及到兩部分,第一部分是數據的收集,第二部分是數據清洗。
數據收集的來源:
京東擁有我認為幾乎是網際網路上最完整、最精準、最高、最長完整鏈條的數據。
第一方面,京東商城一年有大幾千億的銷售額,十幾萬的商家,10億以上的商品每天沉澱在平臺上,有大量的數據可以為整體的後續營銷和人工智慧建設服務。
第二方面,我不知道大家有沒有用過京東白條?實際上像京東白條,包括理財產品,對用戶來講是有非常高價值的數據。
第三方面,是物流。今年4月份,京東宣布整個物流子集團成立,意味著京東物流從一個供給自身商城業務,擴展到社會化物流。我們現在也開始給大量的品牌方服務,可能這個商家在天貓開店,但它是用京東的倉庫,用京東的整個物流體系。各個地區行業的數據獲取可以更高,當然數據是永遠沒有止境的。
第四方面,東哥(劉強東在開年大會上)也提了無界零售。我們現有八家京X計劃,包括騰訊,今日頭條,都是行業裡最大的媒體和流量端。通過整個的數據清洗,讓我們的數據更完整。
數據收集的原則
網際網路真正地採集了大量的數據,這是人工智慧的第一戰場。在數據整個收集過程裡有幾個點,是我想強調的:
第一個,數據並非越多越好
如果有些數據是無效的,也不用刻意地生產很多畫像。
第二個,沒有應用場景的畫像沒有任何價值
舉個例子,比如你喜歡吃核桃,你又打王者榮耀,你覺得王者榮耀知道你喜歡吃核桃這件事情有任何價值嗎?他可能給你出個核桃的裝備嗎?聽上去好像沒有什麼商業意義。
第三個,大部分畫像都是一種概率
大部分數據,包括用戶畫像,你可以認為它是一種概率。比如,在我們家大部分電商的消費都是我來完成的,也會幫我老婆買一些女性用品,由於我其他行為也不多,可能我就會被定義為一個女性用戶。但實際上我在其他方面的行為並不是一個女性用戶,所以它會存在偏差。
第四個,不要過度關心用戶避免用戶焦慮
這個在網際網路早期比較多,總讓用戶填一些個人信息問卷;其實很少有人會認真地去填,所以儘量不要去打攪用戶。
再舉個例子,比如說杜蕾斯很火,我可能算出來了,你兩周肯定會買一次。那到點了,我就在APP首頁全部推送杜蕾斯,被別人看見,你是會覺得隱私被侵犯的,所以儘量地避免過度去關心。
有了完整數據之後,還是要落地到商品的數據、內容的數據、店鋪品牌的數據,以及最重要的用戶畫像上。
我們在有一套標準的體系收集用戶整體鏈路之後,基於畫像的過濾和清洗形成了幾個維度:
第一,人口屬性
比如你是哪裡人? 現在我們在網際網路上都要實名認證,通過你的身份證號可以得到你的性別、出生地,這些信息都是比較完整的(但我們絕對是保密的,我自己也都查不到每個用戶的信息)。當然有很多數據是來自於金融,得益於我們的這些強關聯。
第二,用戶的屬性偏好
你在京東的很多行為,我們會定義你的品類偏好,品牌偏好,包括商品的偏好,更細分的會在品類上。
以購買力舉例,你是買一千塊錢的手機,還是買一萬塊錢的手機,這裡會存在一個價格歧視的問題;但這個價格不是說一千塊錢的手機賣給你是一千,賣給他是一千五。而是說由於品牌的影響,兩個商品的差異非常小;但由於我覺得你的溢價能力是比較強的,那可能就會把更貴的商品推給你。
第三,垂直標籤
舉個例子,母嬰人群。很多人知道備孕的時候要吃葉酸,一旦你在京東買葉酸了,我就知道你可能離懷孕不久了。我們基於這個用戶的行為,可以推算出她在整個母嬰過程裡面的狀態:是在懷孕周期,還是baby剛出生。從懷孕到兩歲的過程,我們都定義為母嬰人群。我可以在你的周期裡給你推一段奶粉、二段奶粉、三段奶粉,這是一個非常強的應用場景。
第四,外部標籤
我們會有很多外部廣告投放,可以獲取到外部的一些用戶的標籤,這是電商所不具備的。
AI可以結合營銷場景,做很多在營銷上的實際應用。
在實際應用中我們定義,AI是解決複雜場景的效率問題。社會主義是提高生產力的很好的法寶,我覺得AI也是。
AI不僅僅是一個用戶產品,其實對內部提升運營效率也特別有幫助。
舉一個不是那麼複雜的場景:
案例:京東秒殺
我們在2016年年初才開始推秒殺的智能化,最早期是這樣做的:每天有十幾個秒殺場次,每個場次有50個商品,每個事業部不同的GMV目標,之前是靠運營同事把這些坑位一個個分給事業部,現在通過AI來處理:第一個資源位和第五十個資源位產生的價值是完全不同的,如果是最後一個和第一個來比,可能GMV貢獻度只有10%。這會導致資源管理的成本非常高,因為要精確到每一個資源位來看它的效率。
從前端運營的角度,必然想把更好的商品放到更好的位置。
比如,三隻松鼠本來賣五折,基於歷史銷售來看,五折其實不是一個很有競爭力的價格,我希望賣到三折。
現在是很難去要求的,因為你給他的資源曝光已經非常固化了。放在第十個坑位就是那麼多曝光,只是三折的轉化率稍微高一點。
如果通過AI技術決定商家商品的坑位,商家能夠通過加強折扣力度提升排序,那麼就能夠激勵商家給出更有競爭力的價格。
這個例子是跟用戶相關性更高的,特別典型。
現在是冬天,大部分同學從深圳來,他可能要帶很多衣服,因為深圳現在氣候不是很寒冷;但是在北京,大家可能都穿著波司登(某羽絨服品牌)。所以不同區域,用戶其實有很大的差異,但不僅在於區域,可能在很多行為上會存在很大的差別。
基於單一頻道,我們有很多通用的模型,並且基於同一個頻道做了一些差異化建設。
第一個,考慮資源撬動的問題。不僅考慮打幾折,還要考慮這個折扣和歷史最低價、歷史銷售的對比;不僅考慮它自身的銷售怎麼樣,還會考慮它在品類裡排行如何。針對秒殺這種強促銷的頻道,我們會更多地考慮它的銷售庫存——一件賣一百塊錢的商品,賣一賣一百件和賣一萬件,對頻道的價值差異是非常大的。
第二個,看商品的實時效果。除了正常的數據以外,引入兩個基於這個頻道特性的數據:
第三個,最重要的用戶的偏好。除了正常的品類、品牌偏好之外,我們會加上品類協同。可能這個用戶在A品類沒有什麼行為,但我們發現用戶在A品類和B品類上,是有一些銷售關聯度的,以及在某些品類上可能會有復購的問題。比如你買個手機,一般人應該不會在六個月到半年之內再去買第二臺,這樣的商品我們往往會給它做降權。
基於這些模型,我們去做整體點擊率和訂單轉化的優化,看哪些效率高,哪些效率不高。基於一個運營場景,比如針對618、雙11、優惠券等這樣強促銷的頻道,我們會給出不同的解決方案。
因為大促期間用戶的行為差異很大,我們會基於去年618或者去年雙11的數據,做專門的模型訓練,讓用戶在這個周期裡面的行為表現,更趨向於我們預測的現實結果。
可能有人覺得秒殺或者像淘寶、聚划算、淘搶購,它的促銷信息太強了,好像AI在裡面也起不了什麼效果,但從我們實際結果上來看,整體提升率能到30%。秒殺在雙11周期裡面,11月1號我們的銷售額突破了一百億。通過AI這個模型的優化,提升30%是一個非常大的量級。
哪些場景可以藉助AI解決?
第一個,從運營端來看,人的數量永遠是有限的。秒殺頻道有接近100號員工,這是一個非常大的量級。 京東內部的活動,每天線上有5000個,如果一個人負責一個活動,也要需要5000個人,這個規模是不能再去擴充的。
第二個,在京東這樣平臺(包括阿里),很多資源和流量都是按品類來管理的,每個品類都有銷售KPI,當它做活動的時候,比如生鮮做活動,是不太可能賣家電的。
結合這樣兩個場景,我們去看有沒有辦法提供一種更場景化的鏈路,來完成AI賦能。
案例:準備婚禮
在操辦婚禮的時候,有很多事情要做:要買家電,要裝修房子,要買喜糖,都是一些跨品類的長鏈路的行為。那麼,有沒有辦法把很多場景通過一個機器挖掘出來,再通過自動化的方式有效組織,以非常簡化的結構推薦給用戶?
在這個過程裡,有一些問題是必須要解決的。
第一個問題,場景怎麼來?很多場景很細分,而且幾乎很少有一個運營懂全局。
第二個問題,內容怎麼來?場景裡面有很多商品,有很多內容,總要有一個地方來確定這個規則去選品。
第三個問題,頭圖怎麼來?頁面裡會有個頭圖,它是一個氛圍圖。怎麼生成? 以及整體頁面結構,頁面樣式怎麼確定?
考慮到這個場景確實非常大,我們最後的結論是讓機器來完成所有的事情。
如果場景數量是一個非常可控的量級,比如說50個,可能有幾個運營同事就可以搞定了;但當整個數量達到5000甚至更大的時候,人的力量是非常有限的,不可能為了這個頻道去招一千個人,從公司整體效率上來講也是不可行的。
同時所有的場景都在動態變化。舉個例子,比如叮咚音箱,包括小雅音箱,它也是一個場景,但這個場景可能在最近兩年才起來,明年可能有另外的場景方向,這是需要一個動態調整過程的,我們希望整體過程都是可以機器化生產的。
第一個:場景怎麼來?
我們把這件事情真正地交給機器。我們清洗了大量底層的數據,把所有的商品、內容、店鋪、商家、達人標籤化。然後去看所有用戶的行為:搜索行為、訪問行為以及去扒全網的,比如百度上熱搜,今天發生了什麼變化,以及去看不同的人群。總會有那麼一群人,他的行為是領先的,我們稱他為達人。他可能先穿著這件衣服,由於他穿著這件衣服就引領時尚了。這些人在京東的行為是怎麼樣的,我們希望可以把它聚類出來,形成一個場景挖掘。
我們挖了至少上千的頻道、場景出來。
但是頻道、場景挖出來之後,至少要輸出到前端給用戶,純粹的後臺數據是無法完成這個事情的。所以我們又設計了一個機制叫場景生成器——機器挖掘結果出來之後,提交給人,這個人負責總結頻道的名字和副標題。
我們知道,百度、京東、阿里可能都在做AI寫作,我們在內容生產上也做過很多這樣的嘗試,發現效果確實不太好。它寫出來的東西(特別是這種短標題),往往是人無法理解的,或者它可能是一個純粹的品類詞,場景感非常弱;所以現在我們這部分是人在做的。確定名字之後,內容質量是人可以理解的場景下,我們會調用整個的場景頻道服務。
場景生成器的作用
第一,判斷品類特徵,找到適應它結構。比如我買快消品,你買可樂,幾乎沒有人會去看商品詳情頁,大部分人是在列表加購,但是你去看3C商品,買手機的時候不太可能搜iPhone直接加購,這個決策成本是不太可能在這麼短的鏈路裡完成的,我們基於這種不同場景會生成不同的頁面結構。
第二,抓去場景下內容自動生成頭圖。京東內容生態已經生產了大量的內容,在這裡面,我們抓取合適這個場景的圖片,結合標題生成頭圖。
第三,基於機器學習方法召回排序。基於前面挖掘的結果,通過一系列召回策略,生成一個頻道,並且把它投到線上。
案例:怕熱星人
我們頻道4月份剛剛上線,在6月底的時候發現一個特別有意思的特徵:運動飲料、家電(主要是空調、冰箱)這些商品的銷量,有非常一致性的提升,結合機器的推薦生成了這個頻道。
最好的時候,7月份和8月份這個單一頻道,佔整體頻道銷售額的20%到30%。
案例:東家小院
這是一個名字特別有京東特徵的頻道,東家小院是我們第一次通過整個大數據挖掘、機器學習和圖像智能的方法,去嘗試一個「準無人」運營的頻道。這個「準」就是因為前面我們人工來定標題,隨著技術進步,理論上可以讓它變成一個完全無人運營的頻道,大家可以在京東APP的首頁入口非常靠上的位置找到它。
我們從500個頻道池裡面選了6個露出在首頁,所有的入口都是基於用戶行為的個性化的,而且這個個性化是非常實時的,基本上你點了之後再刷一下就變了。同時,我們也做了整體到內頁的入口圖的聯動,內頁也會基於所有用戶的行為做相關聯推薦,以及商品和內容的個性化召回——這是我們第一次嘗試的一個完整的AI鏈路。
這是整體上線之後的一些數據表現:藍色是UV(Unique Visitor,網站獨立訪客),黃色線是GMV(Gross Merchandise Volume,成交總額)。
可以看到:從4月份開始到12月份,GMV的增長比UV還要大。
在這個過程裡,我們做了非常多的模型優化,並且最早的頻道從一百增長到現在五百多,整體的效率在雙11周期達到了最高峰。
其實UV在12月份還在增長,但為什麼11月份對應的GMV是高點?因為在11月份京東的用戶購物熱情上漲,看到東西就買,導致我們頻道整體的銷售也出現峰值的情況(幽默)。這個UV數據現在差不多是幾百萬的量級。
AI不是一蹴而就的。
從前面的增長數據來看:
第一,需要經過大流量的驗證
AI除了數據以外,就是計算。通過流量的驗證,可以收集到大量的用戶行為數據。
這個和Alpha Go是不太一樣的:Alpha Go的規則相對簡單,只要告訴它怎麼下是合法的,怎麼樣算贏就可以了。10月份DeepMind團隊宣布了Alpha Zero通過40天的自我學習,沒有接受其他任何在網絡上收集的棋譜數據,就打敗了原來的Alpha Go。給它數量只有兩個:第一個,下棋的規則。第二個,怎麼算贏?讓它不斷地自己和自己下。
我所說的很多人都無法想像的一些策略,但是在電商的領域,或者大家面對很多To C用戶的時候,用戶的數據才是價值,這是需要強輸入的。
第二,基於用戶體驗
還是舉前面的例子,幾乎不太會有用戶希望自己被推薦出來杜蕾斯:當別人看見的時候,發現你跟我用的是一個牌子——很尷尬是不是?
有些場景機器是不了解的,但是人了解,這個體驗需要人來設定規則去做控制。
第三,業務的平衡
大家都知道京東的強項是3C,是家電。如果任由機器去做,導致的結果可能是你看到的永遠都是3C,都是家電——因為從GMV產出來講,這樣的品類效率是最高的。
比如,買一臺iPhoneX,現在是一萬塊錢,但買生鮮的客單價可能就是一百多,這是無法相比的。所以在這裡面我們要考慮更多的業務場景,包括品類的均衡。
在用戶看到的時候,不僅是體驗,也是業務因素,要給他更豐富的品類;以及當一些品類新出來的時候,比如京東的7 FRESH剛開張,像這樣的新品類,如果不靠一些戰略扶持,冷啟動是非常難的。因為沒有任何的用戶偏好,用戶沒有任何的行為,更談不上品類協同,這就需要一些人為的加權來做幹預。
整體上,如果我們只是做單點的研究去推薦,那麼AI這件事情其實就失去了價值。因為這樣的話需要基於所有的場景做獨立化訓練,實際上並不用——可以把它建成一個平臺化的能力,讓它可以應用到更多的場景,我們建設的平臺叫京東營銷投放平臺。
它集成了基礎的個性化推薦、精準投放、業務補充和自動化運營能力。
簡單的以精準投放能力為例,對於7 FRESH,在APP裡,只有當你在那家店周邊三公裡它的可配送範圍內,我們才會把入口開放給你。
以及有很多很複雜、很繁瑣的事情,包括一些業務信息的補充、異常過濾、算法的分流、數據的清洗,這是一個持續優化的過程。以及我們通過這個平臺建設,賦能到更多的業務場景。
現在通過京東營銷投放平臺覆蓋到的APP、PC的首頁、618大促活動(包括一些三超的品牌活動)、通天塔、優惠券頻道等,這些場景可以非常快速地接收,包括前端的埋點、數據清洗的整個過程。
當然很多時候我們提供的是一些比較通用的模型和方案。當一個大流量的業務需要做深度優化的時候,我們也會基於這個場景去做完整的深度鏈路的優化。
我們在做AI建設去影響營銷過程的時候,到底發生了什麼?
我用三個關鍵詞來總結:
第一個,規則化
傳統的營銷模式,是基於人對流量和資源位的管理;但是類似於東家小院這樣的頻道,它是形成一個規則,人是不需要參與的,或者說人在裡面起到的是監督的作用:我知道什麼樣的商品能進來,什麼樣玩法的內容可以參與。
第二個,開放化
由於自動化引入,人的效率大大提升,或者說人可以釋放出來了,營銷曝光的資源更多了。在原始的運營模式裡面能參與的商家只有頭部,而現在京東16萬的商家,大量商家可以參與。
在這個規模裡,最多20%的商家可以在整個京東營銷資源流量裡去玩,剩下怎麼弄?自己去做搜索。
通過規則化的實施,更多商家可以參與進來。
第三個,個性化
前端流量效率的提升,伴隨而來的是銷售越來越長尾。
京東從最早的標品賣手機、賣家電這種標準化的東西開始向生鮮、向時尚這樣的品類去做,核心的因素就是:在大流量下用戶的需求差異化非常大,而京東自身特別是做自營,其實做不過來。
京東自營現在的SKU種類也就一百多萬,加上圖書可能有200到300萬。但是用戶的需求是永無止境的,要讓這十幾億的商品真正地滿足,可能這個量還不夠;淘寶上有因為有C店,量級可能會更高。
基於不同用戶個性化需求,可以讓很多細分領域的商家存活下來,在這個平臺更茁壯地成長。
以上為嘉賓演講內容。
如果覺得知識「貴」,那你試試無知的代價|2017中國產品經理大會官方回顧(附PPT下載)
金融科技的產品使命(附大會PPT下載)
知識付費,下半場怎麼走(附大會PPT下載)
6個步驟,打造讓用戶痴迷的產品(附大會PPT下載)
嘉賓PPT:關注 人人都是產品經理微信(ID:woshipm)公眾號,在後臺回復關鍵詞「大會」即可獲取下載地址。
本文為2017中國產品經理大會北京站嘉賓分享整理總結,未經許可,禁止轉載。謝謝合作