編輯導語:我們在網上搜索商品時,它會根據季節、銷量等一些數據進行排列;比如我們在夏天的時候搜索長袖,只會出現比較薄款的類型,厚重的長袖都在後面;本文作者對電商商品搜索權重模型進行分析,我們一起來看一下。
商品搜索權重設計做為各大電商的商業機密,網上很少有資料涉及這方面的知識;之前因為項目需要,自己整理過一些權重設計資料,這裡和大家分享一個簡單的權重計算模型,有興趣的朋友可以自己再根據需求進行優化。
權重是反應參數指標在整體評價系統中的重要程度,權重越高,表明該指標越重要。
舉個列子,一個學校招生考試,共三個科目:語文(100分)、數學(100分)、英語(100分),最終根據語文30%,數學40%,英語30%的比例進行累計得一個總得分,得分高者優先錄取。
其中的百分比就是各科的權重,數學佔比40%,則說明學校對學生的數學更加重視。
權重的計算方法有很多中,如:加權計算法、加權平均數法、AHP層次法、優序圖法等等,今天我們通過最簡單的加權計算法來實現一個商品的權重模型,對其它權重算法感興趣的朋友可以自己搜索學習。
什麼是加權法呢?
還是上面的例子,如果有個考生的成績如下:語文(85)、數學(90)、英語(80),那麼他的加權計算過程為:85*30% + 90*40% + 80*30% = 85.5——就是簡單的【成績 * 比例】 再累加的過程。
把上面的科目映射到商品中,則有如下關係:
這都是什麼意思呢?下面我們來一一說明。
權重指標這個比較好理解,前面我們講的標題、品類、品牌等等都屬於商品屬性。
需要注意的是在權重模型中,並不是商品的所有屬性都會參與權重計算的,影響用戶搜索習慣、以及銷量的屬性才會參與計算。
如:品牌、價格、總銷量、月銷量、瀏覽量、收藏量、商品評分等;對於不同的品類,部分特有屬性也會參與計算,如:服飾品類的材質、適應季節等,手機品類的內存大小、存儲大小等。
指標滿分值就好比給科目定義的滿分值一樣,只有設置了上限,數據才有對比性,我們才能判斷出一個具體的分值所代表的好壞程度。
在商品屬性中,部分屬性在系統設計之初就已經有分值的定義,如評分,通常都設置為10分制或者5顆星的記分方式。
但是在這裡依然需要給他們再重新定義一套權重中的滿分值,而不能使用原始的10分制或5顆星來計算,因為後面涉及到了自定義權重的高低,需要動態進行調整。
還有一個需要注意的地方,滿分值的定義需要根據屬性值的多少來作為依據;如平臺有500個獨立的品牌,那麼品牌的滿分值就不應該定義為100,而是1000;否則就會出現扎堆現象,某個分值會出現多個品牌的情況,應該儘量避免這種情況發生。
對於科目來說,卷面分已經規定好了,具體能考出多少成績,這個就得看各位同學自己的發揮了。
商品也一樣,屬性的滿分定義好後,某個具體屬性能得多少分值就需要根據統計數據和評分標準進行打分。
首先需要定製評分標準,標準的規定有兩種方式:
與各科的佔比一樣,權重模型需要為每個參與計算的屬性設置相應的權,這裡之所以沒有叫佔比,是因為通常我們理解的佔比是以百分制來計算的,所有參與因素佔比最終加起來需要等於百分百。
但是商品模型參數屬性比較多,採用百分制會試最終的權重值很聚集,搜索效果並不好。
所以通常採用權的設計方法。什麼是權呢?
舉個實例,如:數字8692 = 8* 1000 + 6*100 + 9*10 + 2*1,其中千分位的權是1000,百分位的權是100,十分位的權是10,個位的權是1。
我們採用類似的方式給參與權重的商品屬性定義權,如比較重要的屬性:品牌(100000)、價格(100000)、總銷量(10000)、月銷量(10000);重要的屬性:瀏覽量(1000)、收藏量(1000);一般的屬性:庫存(10)、材質(10);其中不同的屬性是可以定義相同權的。
理解了以上幾點,權重模型的基本框架就設計好了,最終權重值通過累加分值乘以權就可以得到。
在上述的權重模型中,受品類的影響比較嚴重。
比如小米品牌下有多款不同品類的商品,假如有手機和電視兩個品類,大家對他的手機認可度比較高,所以手機品類下品牌的得分和權相對就會設置的比較高一些;而電視是剛進入市場,大家對他的接受度與老牌廠商比就略顯遜色,所以電視品類下品牌的得分和權就應該設置的低一些。
再有一個原因就是如果有品類的特殊屬性要參與權重,不同品類的特殊屬性是不同的。所以在維護權重模型的基本配置時,應該是以品類為單位去維護,這樣才能做到個性化的權重設計。
上面通過設置好權重配置後,內部都是通過代碼邏輯計算獲得的權重值。
但是如果平臺需要推廣新品,由於新品沒有銷售數據,所以它的排名默認肯定都靠後;這時就需要設計一個維護入口,通過人工單獨為商品增加權重數值,將新品排名提到前面已達到推廣目的。
對於部分商品的個別屬性,它的權重值會受一些外部因素的影響。
如服飾和鞋類,它們材質屬性受季節的影響;如材質分別為棉絨和滌綸的登山鞋,夏天搜索【登山鞋】這個關鍵字時,滌綸材質的應該被排在前面,棉絨材質的應該被排在後面;冬天搜索【登山鞋】時,棉絨材質的應該在前,滌綸材質的應該在後,這個在做計算時應該是有依賴條件的。
以上就是加權權重模型的設計方案,希望對你有幫助。
這裡再多說一下,為了能夠保證商品權重的及時性,生產環境下通常每天晚上都會對商品重新做權重值計算。
最後給出一個商品的模擬示例,有需要的同學根據自己的場景優化一下。
作者:JackLiu;個人微信公眾號: 揚帆去遠航(ID:Jackai_liu)
本文由 @Jack 原創發布於人人都是產品經理,未經作者許可,禁止轉載。
題圖來自Unsplash,基於CC0協議。