電商商品搜索權重模型

2020-12-16 人人都是產品經理

編輯導語:我們在網上搜索商品時,它會根據季節、銷量等一些數據進行排列;比如我們在夏天的時候搜索長袖,只會出現比較薄款的類型,厚重的長袖都在後面;本文作者對電商商品搜索權重模型進行分析,我們一起來看一下。

商品搜索權重設計做為各大電商的商業機密,網上很少有資料涉及這方面的知識;之前因為項目需要,自己整理過一些權重設計資料,這裡和大家分享一個簡單的權重計算模型,有興趣的朋友可以自己再根據需求進行優化。

一、權重概念

權重是反應參數指標在整體評價系統中的重要程度,權重越高,表明該指標越重要。

舉個列子,一個學校招生考試,共三個科目:語文(100分)、數學(100分)、英語(100分),最終根據語文30%,數學40%,英語30%的比例進行累計得一個總得分,得分高者優先錄取。

其中的百分比就是各科的權重,數學佔比40%,則說明學校對學生的數學更加重視。

權重的計算方法有很多中,如:加權計算法、加權平均數法、AHP層次法、優序圖法等等,今天我們通過最簡單的加權計算法來實現一個商品的權重模型,對其它權重算法感興趣的朋友可以自己搜索學習。

二、加權法

什麼是加權法呢?

還是上面的例子,如果有個考生的成績如下:語文(85)、數學(90)、英語(80),那麼他的加權計算過程為:85*30% + 90*40% + 80*30% = 85.5——就是簡單的【成績 * 比例】 再累加的過程。

把上面的科目映射到商品中,則有如下關係:

  • 科目 = 商品屬性
  • 分值 = 屬性分值
  • 成績 = 屬性得分
  • 佔比 = 屬性的權

這都是什麼意思呢?下面我們來一一說明。

1. 確定權重指標【科目=商品屬性】

權重指標這個比較好理解,前面我們講的標題、品類、品牌等等都屬於商品屬性。

需要注意的是在權重模型中,並不是商品的所有屬性都會參與權重計算的,影響用戶搜索習慣、以及銷量的屬性才會參與計算。

如:品牌、價格、總銷量、月銷量、瀏覽量、收藏量、商品評分等;對於不同的品類,部分特有屬性也會參與計算,如:服飾品類的材質、適應季節等,手機品類的內存大小、存儲大小等。

2. 定義指標滿分值【分值=屬性分值】

指標滿分值就好比給科目定義的滿分值一樣,只有設置了上限,數據才有對比性,我們才能判斷出一個具體的分值所代表的好壞程度。

在商品屬性中,部分屬性在系統設計之初就已經有分值的定義,如評分,通常都設置為10分制或者5顆星的記分方式。

但是在這裡依然需要給他們再重新定義一套權重中的滿分值,而不能使用原始的10分制或5顆星來計算,因為後面涉及到了自定義權重的高低,需要動態進行調整。

還有一個需要注意的地方,滿分值的定義需要根據屬性值的多少來作為依據;如平臺有500個獨立的品牌,那麼品牌的滿分值就不應該定義為100,而是1000;否則就會出現扎堆現象,某個分值會出現多個品牌的情況,應該儘量避免這種情況發生。

3. 劃分指標分值【成績=屬性得分】

對於科目來說,卷面分已經規定好了,具體能考出多少成績,這個就得看各位同學自己的發揮了。

商品也一樣,屬性的滿分定義好後,某個具體屬性能得多少分值就需要根據統計數據和評分標準進行打分。

首先需要定製評分標準,標準的規定有兩種方式:

  1. 人工經驗定義:根據後臺的銷售數據人為的決定分值,搜索比較多的,銷售量高的可以得分高點,反之亦然;如手機品類中的品牌,通常比較火熱的就是華為、蘋果、小米,其次vivo、oppo、三星等等,人為的依次可以為它們設置得分值:華為(500)、蘋果(450)、小米(400)、vivo(380)、oppo(350)、三星(320)。
  2. 有明確數據參考:根據系統反饋的統計數據,通過計算獲得分值;如月銷量,默認滿分定義為1000分,如果月銷量超過5000單,則得1000分,未超過的根據比例計算動態獲得的分值。

4. 確定指標的權【佔比 = 屬性權】

與各科的佔比一樣,權重模型需要為每個參與計算的屬性設置相應的權,這裡之所以沒有叫佔比,是因為通常我們理解的佔比是以百分制來計算的,所有參與因素佔比最終加起來需要等於百分百。

但是商品模型參數屬性比較多,採用百分制會試最終的權重值很聚集,搜索效果並不好。

所以通常採用權的設計方法。什麼是權呢?

舉個實例,如:數字8692 = 8* 1000 + 6*100 + 9*10 + 2*1,其中千分位的權是1000,百分位的權是100,十分位的權是10,個位的權是1。

我們採用類似的方式給參與權重的商品屬性定義權,如比較重要的屬性:品牌(100000)、價格(100000)、總銷量(10000)、月銷量(10000);重要的屬性:瀏覽量(1000)、收藏量(1000);一般的屬性:庫存(10)、材質(10);其中不同的屬性是可以定義相同權的。

理解了以上幾點,權重模型的基本框架就設計好了,最終權重值通過累加分值乘以權就可以得到。

三、優化

1. 品類影響

在上述的權重模型中,受品類的影響比較嚴重。

比如小米品牌下有多款不同品類的商品,假如有手機和電視兩個品類,大家對他的手機認可度比較高,所以手機品類下品牌的得分和權相對就會設置的比較高一些;而電視是剛進入市場,大家對他的接受度與老牌廠商比就略顯遜色,所以電視品類下品牌的得分和權就應該設置的低一些。

再有一個原因就是如果有品類的特殊屬性要參與權重,不同品類的特殊屬性是不同的。所以在維護權重模型的基本配置時,應該是以品類為單位去維護,這樣才能做到個性化的權重設計。

2. 人工幹預

上面通過設置好權重配置後,內部都是通過代碼邏輯計算獲得的權重值。

但是如果平臺需要推廣新品,由於新品沒有銷售數據,所以它的排名默認肯定都靠後;這時就需要設計一個維護入口,通過人工單獨為商品增加權重數值,將新品排名提到前面已達到推廣目的。

3. 外界因素影響

對於部分商品的個別屬性,它的權重值會受一些外部因素的影響。

如服飾和鞋類,它們材質屬性受季節的影響;如材質分別為棉絨和滌綸的登山鞋,夏天搜索【登山鞋】這個關鍵字時,滌綸材質的應該被排在前面,棉絨材質的應該被排在後面;冬天搜索【登山鞋】時,棉絨材質的應該在前,滌綸材質的應該在後,這個在做計算時應該是有依賴條件的。

以上就是加權權重模型的設計方案,希望對你有幫助。

這裡再多說一下,為了能夠保證商品權重的及時性,生產環境下通常每天晚上都會對商品重新做權重值計算。

最後給出一個商品的模擬示例,有需要的同學根據自己的場景優化一下。

 

作者:JackLiu;個人微信公眾號: 揚帆去遠航(ID:Jackai_liu)

本文由 @Jack 原創發布於人人都是產品經理,未經作者許可,禁止轉載。

題圖來自Unsplash,基於CC0協議。

相關焦點

  • 做好電商搜索推薦,還能提升用戶體驗?
    而在電商平臺的購物過程中,搜索和推薦可以說佔據了至關重要的地位,並且涵蓋了PC端、APP端、微信、手機QQ、定向營銷、廣告等各種渠道、各個平臺。由於普通消費者對自己想購買的商品不可能個個都達到專家水準,所以在搜索與推薦上普遍都有較重的依賴習慣。
  • 4個方面聊聊:電商搜索算法技術的演進
    搜索與推薦算法經過多年的發展,從最初簡單的統計模型,機器學習到形成完整的離線在線與實時的深度學習與智能決策體系,每年都有新的算法突破,幫助搜索與推薦的體驗與效果取得大幅提升,成為驅動電商商業創新與發展的新引擎。站在今天總結過去的算法演進,同時看未來電商搜索推薦算法的發展,期待從機器智能到結合人類智能做到真正地認知智能,實現搜索推薦新的交互新體驗。
  • 論淘寶搜索推薦算法排序機制及2021年搜索的方向
    在此重點論述推薦搜索算法,前面有提到2017、2018、2019、是推薦搜索算法真正意義發展的三年,三年三個系統版本一年一換,以至於很多電商人摸不清頭腦了。,類目預測信息進行召回,粗排,精排最終將把權重分數最高的TOP N的商品搜索排序呈現此搜索用戶依據分詞、類目召回,根據用戶行為數據信息進行個性化精準排序是推薦搜索算法的最大特點。
  • 醫療搜索中的query詞權重算法探索
    候選短語的PPR分數是關鍵字的PPR分數之和。並將另外兩個短語特徵(短語頻數和第一次出現位置)與短語PPR評分相結合,得到最終的短語得分,並選擇排名前K的短語作為關鍵短語。使用KePhEx樹進行關鍵短語提取的優點有三個:可以從候選關鍵短語中提取高質量關鍵詞;關鍵短語提取過程靈活性更高;通過計算關鍵字中單詞相對於根的凝聚力值來輔助排名。在不同種類的樹型數據結構中,KePhEx樹屬於二叉樹。同樣,儘管二叉樹存在多種變體,但它與其他變體不同,因為樹中每個節點的位置和級別都是固定的。同樣,與其他變體不同,上層節點(包括根節點)的所有前置節點也都是固定的。
  • 通過層次分析法(AHP),建立電商用戶綜合評分模型
    文章主要介紹了如何利用層次分析法建立電商用戶綜合評分模型,希望能夠對你有所幫助。關於層次分析法的具體解釋大家可以使用搜尋引擎搜索,篇幅有限,我們暫不展開。一. 用戶綜合評分模型建立1.從短期和中長期兩個角度考慮用戶綜合評分模型現實場景:一個用戶經常光顧你的網站,有時只是來看看,有時候順便買點東西,在計算這個用戶的價值的時候,應該怎麼做?
  • 研二的法學女生在寢室出庭告了國內知名電商平臺,這是全國首例「搜索服務」違約案
    錢江晚報·小時新聞首席記者 肖菁 通訊員 杭互法不知道你有沒有想過,自己在電商平臺購物搜索時,搜索結論和自己設想的不大一樣,這是為什麼。通俗地來說,原告女生要表達的意思大致上就是,我搜索的是國美冰箱,為什麼出來的不全是國美冰箱。你平臺特定的一種算法和權重的調整而導致呈現的搜索結果不那麼合理,而這種不合理「辜負」了消費者的信賴,應該認定為是一種用戶服務上的違約。
  • 搜索「國美冰箱」詞條後,排名前三位的商品卻不是國美冰箱,法學研究生狀告淘寶並索賠1元
    今年2月26日,趙小姐想買一臺國美牌冰箱,在淘寶網頁上輸入「國美冰箱」詞條搜索後,發現排名前三位的商品都不是國美冰箱,在排名前八的檢索結果中,也只佔一半。她又換成手機端搜索,發現排名前十的產品中,也只有四件是國美冰箱。她不死心,又重新搜索了一次,沒想到這次排名前十的產品中只剩下三件國美冰箱。這下,趙小姐不高興。她覺得雖然電子商務平臺可以根據經營經驗優化算法、調整權重,但最重要的還是向用戶提供所需要的有用信息。
  • 商品資料庫設計 電商系統專題及常見問題 - CSDN
    在電商系統中,商品模型至關重要,是整個電商的核心,下面通過一個簡單的分析,設計一個基礎的商品模型。商品模型的演化在以前,那時 CMS 很流行,最常見的模型是欄目 – 文章模型。於是做電商的時候,自然就繼承了這種一對多的關係。只是欄目變成了分類,文章變成了商品。商品也具備了獨特的業務屬性。
  • 提高淘寶店鋪權重的重要因素!
    商家們都希望自己的寶貝能在能搜索頁面裡面有高的排名,只要你店鋪和產品權重高那麼排名自然就靠前。整體權重我們可分為店鋪權重、商品權重、關鍵詞權重,那麼影響我們店鋪權重的因素包括店鋪的一些灰色行為和扣分、DSR動態評分、轉化率、銷量、產品的搜索熱度、點擊率、收藏加購、標題關鍵詞等這些主要原因。
  • 搜索結果「答非所問」95後女生狀告網購平臺 全國首例「電商平臺關鍵詞搜索案」在杭開庭
    搜索結果不盡人意,她認為平臺違約「2月26日,我想在淘寶上購買冰箱。在搜索欄輸入某品牌冰箱後,網頁版上顯示排序前三的都不是該品牌冰箱,而APP端排序前十的冰箱中,只有4件是該品牌。」小趙說,相反地,其他大品牌的冰箱被推到了前面。 與此同時,小趙在其他多個電商平臺上進行了搜索。
  • 電商類APP系列2:商品卡片競品分析
    從14年穀歌這一設計概念推出之後,卡片化設計逐漸風靡,也被引入IOS設計之中,如今已經成為各類APP表現層的常態,電商APP商品卡片化就是其中一種。卡片功能入口電商類商品卡片形式豐富,常見於APP首頁瀑布流、品類頁、搜索結果頁、為你推薦等等,此類卡片通常為豎版,基本結構為圖片+商品信息。當然除了常規商品卡片之外,還有秒殺、拼團、導購類商品卡片,第二類卡片不在此次分析範圍內。2.
  • 谷歌搜索的靈魂!BERT模型的崛起與榮耀
    那我們得先看看模型是怎樣「學語言」的。模型和人一樣,在會說話能閱讀之前,它也需要背單詞、學語法,只是它不是通過語境去理解詞義,而是將單詞轉化為可以計算的向量或者矩陣,再通過神經網絡計算特徵權重學會「語法」,從而「理解」人類語言。
  • 谷歌搜索的靈魂:BERT模型的崛起與榮耀
    那我們得先看看模型是怎樣「學語言」的。模型和人一樣,在會說話能閱讀之前,它也需要背單詞、學語法,只是它不是通過語境去理解詞義,而是將單詞轉化為可以計算的向量或者矩陣,再通過神經網絡計算特徵權重學會「語法」,從而「理解」人類語言。
  • 4個權重深度解析:淘寶搜索排名機制!不怕沒流量沒銷量!
    1、店鋪權重店鋪&寶貝權重是影響搜索排名的間接因素,優化相對也比較簡單,首先要保證店鋪沒有出現違規行為;之後要做好服務,避免有過多的售後和糾紛;還要維護好寶貝的好評及店鋪DSR評分;最後提升動銷率和上新率,就差不多了。
  • 弘遼科技:淘寶雙十二攻略之打好商品基礎權重
    原標題《弘遼科技:淘寶雙十二攻略之打好商品基礎權重》雙十一已經結束快半個月了,雙十二又要來啦,這是淘寶2020年的最後一個大型活動,雙十二一過,離過春節也就不遠了。這也是淘寶商家們最後一次衝刺的機會了,不知道商家們都做好準備沒有。
  • 淘寶權重你知道多少?全方位解析淘寶權重
    很多賣家或多或少都知道權重,但什麼是權重?如何提升權重?還是處於一個模糊的概念。所謂權重,就像一個隱形的判官,會根據你店鋪的各個因素來衡量店鋪或寶貝的「好壞」。雖然他不直接決定排名,但對排名的影響卻很大。
  • 淺談電商搜索推薦中ID類特徵的統一建模:Hema Embedding解讀
    該論文主要研究了如何將電商搜索推薦中所有ID類特徵放在相同的向量空間下建模。」作者:力學渣,任富士通NLP算法研究員,從事知識圖譜相關工作,曾任美團搜索算法工程師。以電商領域為例,其中的數據不管是從維度還是數量級上來說都是巨大的,包括商品信息、店鋪信息、品類信息和評論信息等等,其中存在大量ID類特徵,比如userID, item ID, product ID, store ID, brand ID和category ID等。
  • 社交電商模式與平臺電商社交化的差異?
    除此之外平臺電商每一個商品詳情基本都會有一個分享功能可以分享給好友,推薦到社群,這個也是給予用戶的社交關係鏈分享傳播裂變的流量場景,但平臺電商主要還是以搜索流量為主。同時自媒體平臺也可以通過內容頁掛載平臺電商的商品連結,通過內容信息流的價值互動分享,帶動平臺電商的流量。如商家通過頭條商品功能掛載的商品,通過在公域流量智能推薦和私域流量的粉絲互動(評論、收藏、轉發、點讚)打通關係鏈,這種模式從流量場景來看是比較精準的,因為有大數據的支撐。
  • 商業銀行在跨境電商領域的信用評價體系構建
    電子商務中,有別於傳統的交易方式,傳統的企業評價指標已經不再完全適用,買家會從商品描述相符情況、賣家的歷史信用情況來判斷賣家的信用。   2.3 跨境電子商務業務流程   跨境電子商務交易流程如下:   一、國內的出口賣家在符合平臺準入條件的前提下,與跨境電商網站籤訂合作協議。   二、國內出口賣家將商品上傳至跨境電子商務平臺,並根據要求開通上線展示。   三、海外買家在線通過關鍵詞搜索路徑選購商品,並完成支付。
  • 一千個人就有一千種搜索結果?電商Zappos讓算法讀懂你的「言外之意」
    它的搜索欄也不例外:在過去兩年裡,該公司一直在使用機器學習徹底改革其搜索算法。Zappos是一家美國賣鞋的B2C網站,於1999年開站。尼克·斯威姆(Nick Swinmurn) 和謝家華是創始人。 目前,Zappos上售賣的商品不止是鞋子,還包括衣服、首飾等。