深度丨從零搭建推薦體系:概述及標籤體系搭建(上)

2021-01-08 人人都是產品經理

本文闡述整個推薦體系從0搭建的全流程,也是最近以來一直深入研究的成果展現。因原文太長,故此切分成3部分發送,每天發送1篇。全文結構為:上篇:第零章概述,第一章標籤體系搭建;中篇:第三章用戶體系,第四章項目體系,下篇:第五章推薦體系,第六章評估體系,第七章全文總結,第八章參考資料。

內容相對全而深入,希望有推薦體系搭建意願的平臺或者產品經理,能夠給予一定的幫助就好。另,求工作。

0. 概述

隨著信息技術的迅速發展和信息內容的日益增長,「信息過載」問題愈來愈嚴重,愈髮帶來很大的信息負擔。推薦系統可以有效緩解此難題,從而得到推崇並加以廣泛應用。

簡單來說:推薦系統是通過挖掘用戶與項目之間的二元關係,幫助用戶從大量數據中發現其可能感興趣的項目如網頁、服務、商品、人等,並生成個性化推薦以滿足個性化需求。目前市場上對於電子商務的推薦系統有亞馬遜、阿里巴巴、豆瓣網、當當網等,信息檢索的有谷歌、雅虎、百度等,以及在其它周邊領域廣泛運用如移動應用、電子旅遊、網際網路廣告等。本文只闡述網頁內容,特製新聞方面的項目體系搭建。

研究者認為根據施拉姆信息選擇公式,人們對媒體的注意或選擇的可能性(然率)與它能夠提供的報償(價值)程度成正比,與人們獲得它的代價(費力)程度成反比。也就是說:人們願意用最小的代價獲取價值最大的新聞信息。由此,媒體要從認知接收方面,減輕受眾的「費力」程度,提升信息或傳媒的價值,樹立品牌意識,形成規模效應;擁有與眾不同的品味和特色,將自己在受眾眼中的「可讀」形象轉變成「必讀」形象,從而使用戶對媒介產品形成強烈的信賴感和依賴感,在受眾心中形成穩定的獨特風格。

下圖是一般情況下的推薦系統基本框架(圖片取自網絡):

從最初的數據收集,到最末端的展示階段,中間還經過數據處理以及生成環節,處理大多數所指提取特徵初處理,生成一般是指利用特徵來選取相應算法進行匹配計算。數據的整個生命周期如下:

也就是從數據獲取,一直到最後的加工輸出,經歷的整個環節,最終給我們提供相應的有效信息,採取相應的有效手段,才是數據價值的最終體現。

在正式開始前,對於數據收集的要求也是很高,如果數據不準確或有偏差,很可能之後做的都是徒勞無功,下表為目前常見的數據收集時常見的問題:

對於新聞內容的推薦系統,讓人們最順暢獲取到人們想看到的內容,從而形成核心競爭力。推薦系統的常規推薦系統,一共分為兩條線,第一條線是用戶,第二條線是項目,計算兩者間的相關近似值,從而完成推薦。計算近似值一定有所媒介,這個媒介就是標籤(Tag)系統,所以在建設整個體系之前,最優先需要建設的就是標籤系統,其次是用戶體系,也就是用戶模型,我們在感知用戶唯一的途徑就是通過用戶操作,換言之既用戶行為,所以相對用戶行為微妙的變化,要求我們的用戶體系是十分敏感的,而最後是項目體系,這裡特指新聞內容。

下面將從產品層面儘量描述如何搭建推薦體系相關流程及細節,整體搭建思路流程如下:

整體相對比較複雜,下面將逐一闡述其中細節。

1. 標籤體系1.1 搭建流程

要做標籤體系,我們要先確定的就是系統結構,常規來看一般都是講標籤隨內容或用戶建設(但是我覺得那樣是不完整的,在之後獲取不到更加有效有幫助的信息,這也就是為什麼我認為一定要將標籤體系一定要單獨拎出來的原因)。

在確定系統結構之後,我們要進行相關的算法選擇,並且大致選定學習的範圍和地點,以供機器學習,至此整個標籤體系的搭建流程就此完畢。隨著不斷的內容填充進來,要有相應的標籤不斷補充進來。這是一個長期的過程,並且也需要及時依據用戶反饋修正算法,實時調整,並非一日之功。

1.2 二維化結構

常規網絡的標籤是隨用戶和內容添加的,但是會有局限性,也就是標籤體系較難或無法透徹追查其它相關聯內容。實際上標籤體系的核心價值,體現在相應建立起信息和人、人與人之間的關聯。所以我在思考:如何能夠進行最深入的追查最深處的關聯?有一個常規方案就是單獨建立標籤體系,將標籤平鋪於系統中,也就是二維化。通過機器學習,建立標籤的基本聯繫網絡,之後貼合於用戶與內容中即可。無立體結構的上下層級展示,好處是可以避免了一維化的後果。換句話說如果有層級,那麼不可避免的就會變成一級、二級。

簡單來說:與某標籤周遭相關聯的一切標籤均展示;那周遭的標籤還會又有標籤,再展示;也就變成無窮盡的立體結構化的標籤網絡,也就是價值基礎。最終價值的輸出還要結合其它的相關行為、操作、用戶物理屬性、內容載體以及效果評定等因素綜合考量。

1.3 機器學習

常規機器訓練流程是:先確定方法→訓練集→特徵選取→訓練→分類器;分類:新樣本→特徵選取→分類→判決。

所以最開始我們就要確定機器學習的方法。方法有許多種,需要具體根據情況來具體確定。下面僅以產品角度羅列常見經典的機器學習方法、特點、利弊等。以供數據工程師進行選擇、對比,輔助做出最優選擇,以供參考。

方法當中,首先分為兩個大類別:監督學習和非監督學習。監督學習又稱為分類或者歸納學習。幾乎適用於所有領域,包括內容處理。常見算法有決策樹、貝葉斯模型、KNN、SVM等。

與這一方式相對的是非監督學習,在這種方式中,所有的類屬性都是未知的,從零開始摸索,算法需要根據數據集的特徵自動產生類屬性。其中算法中用於進行學習的數據集叫做訓練數據集:當使用學習算法用訓練數據集學習得到一個模型以後,我們使用測試數據集來評測這個模型的精準度。常見的有聚類、特徵矩陣。下表為常規推薦算法的分類,一共是三類:分類算法、關聯規則和聚類,依據不同場景選擇不同算法進行調整即可。表格後面列出最常用算法的利弊以及用人話描述的算法原理,以供產品同事參考。

樸素貝葉斯:

對於給出的待分類項,求解在此項出現的條件下各個類別出現的概率;哪個最大,就認為此待分類項屬於哪個類別。非常好理解,單純的概率問題。

優點:算法十分穩定,並且對數據參數無要求;運用較為簡單。

缺點:在屬性個數比較多或者屬性之間相關性較大時效率不理想,並且重前期數據格式,需要知道先驗概率,存在一定錯誤率。但是結合聚類算法,可以一定程度解決屬性個數問題。

使用場景:常見於垃圾郵件分類場景。

決策樹:

哈利波特中的分院帽應用的是個非常典型的決策樹模型:帽子往學生頭上一扣,讀取學生的顯著特徵,然後分到某個類別裡。所以你看,哈利波特一開始表現出來的特徵都是格蘭芬多的特徵,分院帽讀取數據時候發現這個人有兩類顯著特徵,於是猶豫不決,最後還是波特自己提出了要求,這就證明應用模型時的人工幹預必不可少。

優點:決策樹較為通俗易懂,並且對數據格式不敏感,較為聰明;易於通過靜態測試測量模型可信度,善於短時間處理大量數據源,對屬性數量兼容性好,有很好的擴展性。

缺點:對樣本數量不一致的數據,結果有偏向,處理缺失數據時候會有困難,並且有過度擬合現象,容易忽略數據集中屬性之間的相關性。

使用場景:可結合隨機森林算法,減少相應過度擬合現象。常見於用戶行為分析場景。

KNN:

說白了就是我們要尋找鄰居,但是為什麼要尋找鄰居?如何選取鄰居,選取多少鄰居?怎麼樣去尋找我們想要的鄰居,以及如何利用鄰居來解決分類問題這是KNN算法需要解決的幾大問題。

為什麼我們要尋找鄰居?古話說的好:人以類聚,物以群分。要想知道一個人怎麼樣,去看看他的朋友就知道了。我們如果要判斷一個樣本點的類別,去看看和它相似的樣本點的類別就行了。

優點:該算法簡單有效,重新訓練代價較低,對於類域有較差或重疊較多的樣本較為適合。同樣適用於樣本量較大的情況。

缺點:樣本量較小時反而有誤差。而且該算法是懶散學習方法,不主動,類別評分不規格且輸出可解釋性不高。當樣本量不平衡時,有可能導致當輸入一個新樣本時,該樣本的K個鄰居中大容量類的樣本佔多數,並且計算量較大。可以採用權值的方法,和該樣本距離小的鄰居權值大,來改進問題,對於計算量較大,可以事先對已知樣本點進行剪輯,去除對分類作用不大的樣本來優化。

使用場景:常見於預測價格場景。

SVM:

說到這個算法之前,先得配一張圖:

這圖啥意思呢?不用管。但是這兩種分法哪種更好呢?從直觀上來說,顯然右側好。也就是分割的間隙越大越好,把兩個類別的點分得越開越好。就像我們平時判斷一個人是男還是女,就是很難出現分錯的情況,這就是男、女兩個類別之間的間隙非常的大導致的,讓我們可以更準確的進行分類。從實踐的角度來說,這樣的效果非常好,錯誤率低。

優點:該算法適用於樣本量較小的情況,可提高泛化性能,可解決高維度問題。並且對線性和非線性問題均可解決,可避免神經網絡結構選擇和局部極小點問題。

缺點:對缺失數據較敏感,對非線性問題沒有通用解決方案,需要選擇核函數來處理,算法使用並且極其複雜。

使用場景:常見於社交網站用戶分類場景。

Ad boosting:

這個算法說實話我也解釋不清,沒真正運用過,憑自己查資料的理解試著說一下。這個算法核心的思想是整合多個弱分類器,成為一個強大的分類器。這時候,集合分類器出現了。用人話說就是三個臭皮匠賽過諸葛亮,好理解了吧?識別一組條件特徵概念判斷的正確率比隨機猜測略好,但是還不夠,這就是弱分類器;多個弱分類器的效果疊加起來,就變成一個強分類器,識別率就會很高了。

優點:該算法精度較高,可用任意方法構建子分類器;使用簡單分類器時結果容易理解,且弱分類器構造極其簡單,而且不用做特徵篩選,不用擔心過度擬合情況。

缺點:對離群值比較敏感。

使用場景:常見於人臉檢測、目標識別場景。

K-means:

給你一萬個人,分成四群,需要能夠解釋每一群人的突出特徵,如果有兩群人的特徵很相似,那就要重新分群了;或者有一群人的特徵不明顯,那就要增加分群了。好處在於樣本量大的時候,可以快速分群,但需要在分群後注意每個群體的可解釋性。

優點:這個算法屬於經典算法,簡單快速,對處理大數據集可伸縮,高效。並且在簇密集度高、球狀或團狀時,且有明顯於其他簇區別時,聚類效果好。

缺點:但是只有簇平均值被定義情況下才能使用,且對分類屬性數據不適用,並且要求用戶必須事先給出要生成的簇的數目。對初始值敏感,不適合發現非凸面形狀的簇,或者大小差別很大的簇。對噪聲和孤立數據敏感,少量該類數據能直接影響平均值。

使用場景:常見於CRM篩選目標客戶場景。

神經網絡:

這個算法不想解釋啥,就想放張圖,覺得不放可惜了。

以上摘要從產品角度來說只要大概心裡有數即可,一般情況下從產品數據、應用場景等決定。

一般來看,冷啟動期間應選擇非監督學習,如聚類;等數據豐富之後,轉換為監督學習,擇優選擇算法方可;但仍需具體問題具體分析。更多的還是配合技術、算法人員來選擇和實現,詳細算法和原理、公式等可以到後面附錄1進行查看,給予參考。

1.4 學習地點

這裡我建議從百科類產品進行機器學習,國內最大的百科就是百度百科了,在國際上自然還有維基百科。

查了一些相關方法,發現從百度百科利用機器學習標籤,已經有相應的案例並且成本相對不是很大,具體的方法也放在後文中的附錄2中。

文中探究的是微博標籤相關的項目,與本文無關,但整體思路可借鑑。大致流程為先抓取頁面下相關標籤內容,要注意特殊情況,會有歧義頁面;將標籤抓取存儲之後通過算法計算之間的關聯性、權重分數,而後輸出驗證。整體的過程非常簡單快捷,能在前期非常快速的補充相關數據,但是要注意數據量的問題,很可能導致無窮,所以收集哪些主要領域,收集多少,是需要我們最開始定義好的,及時踩剎車。

1.5 輸出展示

這裡的展示更多指的還是相應的後臺頁面,要滿足幾個條件:其中最基本的一定要滿足可視化的要求,點擊標籤以後相應的關聯標籤可形成關聯展示;可以選擇展示兩級或者三級,清晰直觀的看到關聯情況。更進一步的是點擊後,每個標籤裡面的詳細情況也會展示出來。比如說標籤的歷史類型情況、載體情況、分別的打開情況、受眾用戶群體,所以這也是需要依託於用戶體系的相關標籤結合之後的產出物。

結合基本數據維度比如昨日新增多少標籤、文章類型走向是什麼樣的受眾是什麼樣的走向,都是屬於基礎數據範疇,達到實時監控,定位報警的作用。

1.6 小結總結

本節總體來說闡述了搭建標籤體系的整體流程和相關經典算法的展示與利弊分析,並且提供了標籤學習機制的思路。下面,將進行用戶模型的體系搭建,詳見明日發布的中篇。

附錄1 常見機器學習方法算法

附錄2 提取百度百科標籤建立關聯性思路

百度百科介紹

構成百度百科的基礎內容是詞條。一個詞條頁面大致可以分為百科名片、詞條正文、開放分類、相關詞條、參考資料和擴展閱讀這個幾個部分,根據每個詞條的具體情況,某些部分可以沒有。

其中,百科名片是詞條的概括性描述;詞條正文是可以由多個段落組成的對詞條的詳細描述;開放分類提供詞條的屬性標籤,最多有5個,通常這種標籤具有一定的類別信息;相關詞條是與當前詞條聯繫比較緊密的相關條目,而一般這種聯繫必須是橫向的,例如「喬峰」的相關詞條可以是「段譽」、「阿朱」、「虛竹」等,但不可以是「天龍八部」。

儘管在百科的詞條頁面上,我們只能看到該詞條的開放分類標籤;但實際上在百科內部,有一個具有層次的三層分類體系。第一層具有十二個大類;每個大類下面又包含若干個中類,這就是第二層分類;每個中類下面又可細分為若干個小類。

生成方法

我們將百度百科三層分類體系第三層的小類別作為查詢,在百度百科中將搜索得到該類別下的詞條頁面。但是通過這種方式,對於每一個小類別,我們最多只能獲取760個相關的詞條頁面,而更多的實際上可以被劃分為該類別的詞條頁面,我們獲取不到。

我們搜索「技術_網際網路_電子商務」類別下的頁面,結果顯示共有詞條3469個,但是,我們遍歷搜索結果頁面,最多只能查看到760個詞條頁面。在該方法中,我們需要使用百度百科的三層分類體系例如「技術_網際網路_編程」、「生活_娛樂_影視」作為用戶的標籤候選集合。因此,我們可利用的資源便是能夠獲取到的每個小類別下的最多760個詞條頁面。

我們通過分析用戶發布的微博,將其最感興趣的百科三層類別作為他的標籤。方法的主要思想是:將用戶發布的每一條微博映射到最相關的百科詞條頁面,獲取其類別,通過一定的投票策略決策出用戶的標籤。

下面,具體介紹一下方法中涉及的關鍵步驟。

百科頁面獲取與處理

我們按照百度百科提供的開放分類瀏覽頁面,爬取到所有第三層小類別的查詢URL,形如http://baike.baidu.com/taglist?tag=****,該URL指向的就是該類別標籤的搜索頁面。我們通過解析該搜索頁面,下載得到百科開放的760 個相關的詞條頁面。獲取頁面後,並且按照第三層小類別分類存儲後,我們進行正文的提取。詞條頁面一共有兩種,一種是歧義頁面,即一個詞條包含多種義項,下圖所示:

一種是非歧義頁面。我們需要分別對其做處理:對於歧義頁面,將每一個義項單獨作為一個頁面提取出來。我們提取百科頁面的標題、百科名片、正文、類別,進行分詞等處理後,建立索引,待後續使用。

搜索與微博相關的詞條頁面

給定一條微博,我們需要找到與其相似或者說相關的百科頁面,以獲取其類別。我們將這個問題轉換成為搜索問題。從微博中提煉出查詢,從索引過的百科頁面中搜索出最相關的。我們使用Indri 對詞條頁面建立索引。Indri 源自Lemur系統,是CMU和UMass 聯合推出的一個用於語言模型和信息檢索研究的系統。在這之上可以實現基於語言模型和傳統的向量空間模型等的檢索。Indri早已經受到了學術界的廣泛歡迎。

我們將分別抽取微博中的名詞、名詞及形容詞的組合構成帶有權重的查詢,其權重採用TFIDF 計算得到,構造的查詢形如「#weight(0.45巨蟹座0.35性格0.20特點)」。用構建的查詢,我們搜尋到與該查詢最相關的詞條頁面,並獲取其對應的類別。

用戶標籤生成

假定有m種具有三層分類的類別標籤,我們將其作為用戶的候選標籤集合,表示為C={}。

給定某個用戶u,抽取其發布的微博文本集合W={},文本數目為n。我們分別對其構造查詢,得到查詢集合Q={}。對每一個查詢q,我們獲取Top N個結果,作為該查詢相關的詞條頁面。因為每個詞條可能屬於若干個類別,因此我們得到的與該查詢(或者說其對應的微博)關聯的類別可能不止N個。對關聯的類別中的每一個類別c,我們計算其分數,如公式。其中, freq(c)指c在該次查詢中出現的頻數,而d是我們設置的一個常數,例如,我們將其設置為1,則c的分數就是在該次查詢中出現的次數;若將d設置為該類別關聯的詞條頁面出現在Top N結果中的具體位置,則說明c的分數受到搜索結果排序的影響,排序越靠前的,對分數的貢獻越大。

整個查詢過程停止後,我們將對候選標籤集合中的每一個標籤c計算一個排序分數,可以利用這個算法,其中n 就是指查詢的次數。我們取排序前10 的作為為用戶自動生成的標籤。

上篇,完。

相關閱讀:

深度丨從零搭建推薦體系:概述及標籤體系搭建(上)

深度丨從零搭建推薦體系:用戶體系、項目體系和推薦體系(中)

深度丨從零搭建推薦體系: 推薦體系和評估體系(下)

個性化推薦技術|產品經理和產品運營的必修課

在談推薦系統之前,請先避免這4個問題

#專欄作家#

吳邢一夫(微信號mystic326531548),人人都是產品經理專欄作家。3年產品經理工作經驗,需求、用戶、數據有深入研究。歡迎交流想法,拒絕無意義添加好友。

本文獨家發布於人人都是產品經理。未經許可,禁止轉載。

相關焦點

  • 利用馬斯洛需求,搭建用戶生態體系
    而用戶生態體系也是一樣,每個產品中的健康用戶生態體系,如同金字塔一般具有階梯型,同時隨著階梯的不同,需求與行 為有著巨大的差異。了解用戶生態體系金字塔,洞察需求本質,最終搭建好產品的用戶生態體系。一、完整的用戶生態體系是什麼樣的?
  • 產品經理的進階之路(2):如何搭建產品經理的知識體系?
    在上一期發布搭建屬於自己的知識體系之後,後臺收到了很多朋友的問題,今天我們就詳細來說說產品經理的知識體系有哪些內容。每一個產品經理,應該都需要根據自己的職業生涯規划去收集資料搭建自己的知識體系。明確自己職業規劃我們需要在搭建知識體系之前明確自己職業規劃,才能夠去建立知識體系的框架,還記得剛進入產品經理這個行業時,看到的一張產品經理成長方向的圖,他分為了4條線:產品經理到產品專家(技術線),在這條線上,產品經理需要側重產品側知識體系,包括用戶本質訴求的洞察能力
  • 數字經濟時代 中國移動如何搭建數智化客戶服務體系
    原標題:數字經濟時代,中國移動如何搭建數智化客戶服務體系   服務是客戶與
  • 標籤管理體系之業務應用
    一、評估標籤質量1、業務背景基於標籤對業務進行精準分析,從而影響運營思路和產品迭代的節奏,進而帶來非常高的商業價值,但是這裡需要對標籤的質量進行評估,假設標籤的覆蓋場景非常低,而且準確度低,同樣也會反向影響業務。
  • 用戶增長框架的搭建拆解
    編輯導語:用戶運營最重要的一個環節就是用戶增長,有足夠的用戶才能保證後續運營起來的順利,用戶增長有很多種方式,選用最符合的進行操作;本文作者分享了關於用戶增長框架的搭建拆解,我們一起來看一下。用戶增長框架,是用戶運營的第一步;依靠增長框架獲取用戶,才能有後續用戶運營的環節,形成健康的用戶運營體系,促使業務向前發展。那麼如何搭建用戶增長框架呢?
  • 平臺型生態體系解析(上)
    1)平臺模式平臺模式描述的是由企業搭建的,以自身為核心的開放式協同體系。搭建平臺的企業為平臺主體,負責平臺的整體支撐與運營。企業內、外部相關角色,如資本、員工、合作企業、用戶等,在滿足一定準入條件時均可自發的通過平臺,作為參與者與企業發起實時協作。
  • PTA、甲醇期權今日鄭商所上市 首批能化期權搭建多層次避險體系
    鄭商所理事長熊軍在上市儀式上表示,作為「價格保險」工具,PTA、甲醇期權上市後,能夠與相關期貨品種優勢互補,有利於形成更加合理的期貨價格,推動完善鄭商所市場結構,提升市場服務能力,更好滿足實體企業個性化、多樣性的風險管理需求。
  • 嵌入式Linux開發環境的搭建之:嵌入式開發環境的搭建
    本文引用地址:http://www.eepw.com.cn/article/257141.htm5.1嵌入式開發環境的搭建5.1.1嵌入式交叉編譯環境的搭建linux作業系統文章專題:搭建交叉編譯環境的方法很多,不同的體系結構、不同的操作內容甚至是不同版本的內核,都會用到不同的交叉編譯器,而且,有些交叉編譯器經常會有部分的bug,這都會導致最後的代碼無法正常地運行。因此,選擇合適的交叉編譯器對於嵌入式開發是非常重要的。
  • 深度學習筆記8:利用Tensorflow搭建神經網絡
    作者:魯偉 一個數據科學踐行者的學習日記。
  • 煙臺出臺市區生活垃圾分類管理《辦法》 搭建全程分類體系
    中國山東網-感知山東11月20日訊 (記者 盧偉霞) 記者從煙臺市政府新聞辦公室召開的市區生活垃圾分類管理新聞發布會上獲悉對煙臺市生活垃圾源頭減量、全程分類管理、無害化處置和資源化利用進行規範,重點強化全程分類體系建設,為提升本市生活垃圾管理水平和實效提供堅實的法治保障。
  • 機器學習零基礎?手把手教你用TensorFlow搭建圖像識別系統(一)|...
    這只是一篇詳細描述如何開始搭建一個機器學習系統,並讓它可以識別所看到圖像的文章。作者Wolfgang Beyer目前現在正在學習人工智慧和機器學習的內容。他認為最好的學習方式不是僅僅閱讀各類材料,而是要真正地去動手搭建一個系統。這就是雷鋒網翻譯本文的目的,也是作者要向你介紹的。
  • 自建GPU伺服器:搭建自己的深度學習PC - CIO頻道 - 企業網D1Net...
    搭建自己的GPU伺服器並不困難,這樣做還可以輕鬆地降低在雲中訓練深度學習模型的成本。 很多深度學習的實踐者們渴望在有生之年搭建自己的深度學習機器,擺脫雲的魔掌,這樣的時代就到來了。雲計算是開展深度學習的理想選擇,它往往是訓練大規模深度學習模型的最佳答案。
  • 搭建影院需要多少錢?熱門家用投影推薦
    隨著生活水平的提高,人們對娛樂型體驗的需求也進一步提升,搭建家庭影院也成為很多家庭的娛樂新選擇。那麼多少錢能夠搭建一座家庭影院呢?也許只需要一臺高清家用投影機便能夠解決,而本次所要推薦的這幾款適合用來搭建家庭影院的家用投影機,則均價在萬元以內,性能較為優質。
  • 4種知識分類,1個知識體系,教你學會高效學習
    向下挖掘深度,那麼我們可以從表層需求、利益出發點、真正需求三個層面分析,所以【2.1明確提出方的核心需求】這個知識點本身也是一個知識體系(我也專門寫了一篇文章闡述這個知識點,詳見《正確定義問題,比解決問題重要一百倍》)。2. 為什麼要搭建知識體系?1)有利於大腦建立更有效的突觸連接:每個人大腦中突觸數量和連接方式不同,所以加工信息的方法和效率都不一樣。
  • 甘肅大力推進食品生產企業追溯體系建設記
    通過搭建平臺,實現四項溯源:食品經營主體的溯源;網格監管責任的溯源;食品質量信息的溯源;企業信用狀況的溯源。達到四個目標:監控食品流向,鎖定違法主體;明確監管職責,實施責任追溯;識別食品信息,清查違法食品;生成信用記錄,懲戒失信行為。
  • 易靈重金搭建售後服務體系 拓寬經銷渠道
    在為期三天的展會中,易靈贏得了眾多潛在經銷商的關注,此外,在易靈舉辦的「易靈之夜」活動上,200多家微型電動車經銷商已經與易靈達成合作。易靈公司董事長徐桂軍及副董事長張健也在活動現場承諾經銷商,在合作過程中不會出現逼迫經銷商壓貨、進行分網等有損經銷商利益的行為,這也使得易靈新能源新收穫更多的經銷商的信賴。
  • 數位化轉型必備《小新說運營》詳解B端運營體系構建
    傳統企業已經不滿足於引進ERP、CRM、MES等數位化管理系統,而是更加希望產品、運營能夠升級到數位化管理、體系化搭建,為企業與客戶持續賦能。B端企業產品端升級與智能化加速、SaaS平臺搭建、大數據分析系統的引入等都在推動著企業的升級轉型。這是一個充滿變化的時代,根據IDC的研究報告顯示,在全球TOP 2000的企業中,2/3的CEO將數位化轉型作為企業戰略的核心。
  • 產品分析:嗶哩嗶哩,搭建用戶興趣圈子&構建付費用戶生態體系
    筆者認為:這是在內容分發上,沒有很好地引導新用戶找到其感興趣的圈子,以及在社交互動上站內氣氛並沒有吸引到新用戶。因此,筆者認為:B站需要進一步優化其內容分發邏輯,細化其內容社交圈子,還需要更多的手段引導新用戶。使得新用戶能夠更容易找到其興趣相投的群體而在站內搭建上,B站應深化其二次元文化的核心,優待二次元內容的創作者。
  • 奇點攜手G97達成深度遊戲生態戰略合作共同搭建遊戲平臺
    奇點攜手G97達成深度遊戲生態戰略合作共同搭建遊戲平臺,為百萬奇點用戶提供遊戲生態。G97上線後,G97持幣用戶可以在遊戲平臺深度體驗各類遊戲,例如:哈希三國、哈希捕魚、鬥地主等。全品類火爆遊戲、豐富的遊戲幣種、豐厚的活動獎勵、高額的遊戲返利,成為G97平臺的特色標籤。此次與奇點、遊點、G97平臺的戰略合作,也是G97在區塊鏈領域的重要舉措,也是繼去中心化共治遊戲分發、開放合作生態之後,公司在區塊鏈領域又一重點方向。未來G97還將與更多的產業夥伴合作,共同促進產業和區域經濟發展。
  • 如何搭建數據歸因模型?
    業務模式的不同,所搭建的歸因模型也不同,所以數據分析師需要根據實際的業務情況來構建模型。本文作者依據工作實踐的所思所想,結合案例等分享了數據歸因模型搭建的關鍵步驟和思考,供大家一同參考和學習。要深度分析問題原因,不能只統計數字,流於表面!每次寫原因分析類報告,都有領導這麼咆哮道。而聽到這個要求,很多新手同學又是眉頭一皺眼睛一閉:媽耶,咋整啊。今天我們系統講解下。