剛買完手機,下一秒系統就推薦了耳機,為什麼?

2021-02-14 讀芯術

全文共4140字,預計閱讀時長4分鐘

不知道你有沒有這種感覺?

 

為了學習人工智慧,你買了一本《深度學習》,在付款的時候,你會發現頁面下方出現了:購買此書的人還瀏覽了以下書籍——《機器學習實踐》《Python機器學習》,於是本來你只想買一本書卻忍不住買了一本又一本。

 

你今天在網易雲音樂上聽了一首陳奕迅的歌,之後你就會發現,它會反覆給你推薦陳奕迅或者相關類似的歌手的歌;在網上看了一部懸疑片,遇事每當你瀏覽這個視頻網站它會自動給你推薦更多的懸疑片;你在購物網站瀏覽了一雙運動鞋,之後就會收到各種運動鞋秒殺的廣告……

就好像自己早已被看穿。

其實這就是算法的力量,確切的說,是推薦算法在起作用。

推薦系統的「3W」

What is it?

在百度百科上的解釋,是利用電子商務網站向客戶提供商品信息和建議,幫助用戶決定應該購買什麼產品,模擬銷售人員幫助客戶完成購買過程。

就是根據你平日裡購物的行為習慣、興趣特點以及社交關係等信息,去判斷你當前需要或者感興趣的商品。

Why is that?

為什麼我們要用到推薦系統呢?隨著信息技術和網際網路的發展,人類從信息匱乏時代走向了信息過載時代。

鋪天蓋地的信息讓人看得眼花繚亂,很難在短時間之內找到自己感興趣的內容,從而也加大了信息生產者在傳播推廣信息的難度,因為在眾多的信息轟炸中,很難將自己在信息同質化越來越嚴重的信息洪流中脫穎而出。

於是乎,推薦系統應運而生。

它主要是用來幹什麼的呢?

它是信息和個體之間的橋梁。對我們而言,推薦系統通過各種信息收集,能夠在大量的信息中幫助我們找到感興趣的信息,發現我們可能喜歡的新事物;對於商家而言,推薦系統在給用戶提供個性化推薦服務的時候,能夠提高用戶的信任度和粘性,從而提高業績。

我們可以通過一組數據了解推薦系統的價值:

Netflix:2/3被觀看的電影來自推薦

Google新聞:38%的點擊量來自推薦

Amazon:35%的銷量來自推薦

當你看到這些數字,推薦系統的價值就不言而喻了吧?

Where to apply?

我們現在凡是幹什麼總愛強調「個性化」「量身打造」「私人定製」,於是催生了推薦系統在我們日常生活中方方面面的滲透:私人定製推薦歌單、各類視頻網站、個性化閱讀、電子商務……無論你是在看劇、訂外賣、逛淘寶、聽電臺,你都能收到一系列自己感興趣的內容。

和搜尋引擎不同的是,個性化推薦系統需要依賴用戶的行為數據,一般都是作為一個應用存在於不同網站之中。在網際網路的各大網站中都可以看到推薦系統的影子。例如都是逛淘寶,女同胞們和男同胞們看到的網頁界面會有所不同。

以淘寶為例,女生看到的淘寶界面:

男生看到的淘寶界面:

每個人的喜好不同,在頁面上瀏覽的內容就不同,這些信息都會隨著我們每一次的瀏覽點擊進行變換,從而不斷向我們推薦合適的商品,從而提高網站的點擊率和轉化率。

儘管不同的網站使用不同的推薦系統,但是總的來說,幾乎所有的推薦系統的結構都是類似的,都由線上和線下兩部分組成。

線下部分包括後臺的日誌系統和推薦算法系統,線上部分就是我們看到的前臺頁面展示。線下部分通過學習用戶資料和行為日誌建立模型,在新的上下文背景之下,計算相應的推薦內容,呈現於線上頁面中。

下面我們通過近幾年靠人工智慧算法火起來的今日頭條和大家詳細分析一下,怎樣通過推薦算法實現「私人定製」?

詳盡乾貨:揭秘「你關心的,才是頭條」

推薦系統,如果用形式化的方式去描述實際上是擬合一個用戶對內容滿意度的函數,這個函數需要輸入三個維度的變量。

第一個維度是內容。頭條現在已經是一個綜合內容平臺,圖文、視頻、UGC小視頻、問答、微頭條,每種內容有很多自己的特徵,需要考慮怎樣提取不同內容類型的特徵做好推薦。

第二個維度是用戶特徵。包括各種興趣標籤,職業、年齡、性別等,還有很多模型刻劃出的隱式用戶興趣等。

第三個維度是環境特徵。這是移動網際網路時代推薦的特點,用戶隨時隨地移動,在工作場合、通勤、旅遊等不同的場景,信息偏好有所偏移。

結合三方面的維度,模型會給出一個預估,即推測推薦內容在這一場景下對這一用戶是否合適。

 

那如何引入無法直接衡量的目標?

推薦模型中,點擊率、閱讀時間、點讚、評論、轉發包括點讚都是可以量化的目標,能夠用模型直接擬合做預估,看線上提升情況可以知道做的好不好。但一個大體量的推薦系統,服務用戶眾多,不能完全由指標評估,引入數據指標以外的要素也很重要。

比如廣告和特型內容頻控。像問答卡片就是比較特殊的內容形式,其推薦的目標不完全是讓用戶瀏覽,還要考慮吸引用戶回答為社區貢獻內容。這些內容和普通內容如何混排,怎樣控制頻控都需要考慮。

此外,平臺出於內容生態和社會責任的考量,像低俗內容的打壓,標題黨、低質內容的打壓,重要新聞的置頂、加權、強插,低級別帳號內容降權都是算法本身無法完成,需要進一步對內容進行幹預。

以下是幾種典型的推薦算法:

前面提到的公式y = F(Xi ,Xu ,Xc),是一個很經典的監督學習問題。可實現的方法有很多,比如傳統的協同過濾模型,監督學習算法Logistic Regression模型,基於深度學習的模型,FactorizationMachine和GBDT等。

模型之後再看一下典型的推薦特徵,主要有四類特徵會對推薦起到比較重要的作用。

第一類是相關性特徵,就是評估內容的屬性和與用戶是否匹配。顯性的匹配包括關鍵詞匹配、分類匹配、來源匹配、主題匹配等。像FM模型中也有一些隱性匹配,從用戶向量與內容向量的距離可以得出。

 

第二類是環境特徵,包括地理位置、時間。這些既是bias特徵,也能以此構建一些匹配特徵。

第三類是熱度特徵。包括全局熱度、分類熱度,主題熱度,以及關鍵詞熱度等。內容熱度信息在大的推薦系統特別在用戶冷啟動的時候非常有效。

第四類是協同特徵,它可以在部分程度上幫助解決所謂算法越推越窄的問題。協同特徵並非考慮用戶已有歷史。而是通過用戶行為分析不同用戶間相似性,比如點擊相似、興趣分類相似、主題相似、興趣詞相似,甚至向量相似,從而擴展模型的探索能力。

模型的訓練上,頭條系大部分推薦產品採用實時訓練。實時訓練省資源並且反饋快,這對信息流產品非常重要。用戶需要行為信息可以被模型快速捕捉並反饋至下一刷的推薦效果。我們線上目前基於storm集群實時處理樣本數據,包括點擊、展現、收藏、分享等動作類型。

但因為頭條目前的內容量非常大,加上小視頻內容有千萬級別,推薦系統不可能所有內容全部由模型預估。

所以需要設計一些召回策略,每次推薦時從海量內容中篩選出千級別的內容庫。召回策略最重要的要求是性能要極致,一般超時不能超過50毫秒。

召回策略種類有很多,我們主要用的是倒排的思路。離線維護一個倒排,這個倒排的key可以是分類,topic,實體,來源等,排序考慮熱度、新鮮度、動作等。線上召回可以迅速從倒排中根據用戶興趣標籤對內容做截斷,高效的從很大的內容庫中篩選比較靠譜的一小部分內容。

推薦系統之內容分析

內容分析包括文本分析,圖片分析和視頻分析。文本分析在推薦系統中一個很重要的作用是用戶興趣建模。沒有內容及文本標籤,無法得到用戶興趣標籤。舉個例子,只有知道文章標籤是網際網路,用戶看了網際網路標籤的文章,才能知道用戶有網際網路標籤,其他關鍵詞也一樣。

另一方面,文本內容的標籤可以直接幫助推薦特徵,比如魅族的內容可以推薦給關注魅族的用戶,這是用戶標籤的匹配。

如果某段時間推薦主頻道效果不理想,出現推薦窄化,用戶會發現到具體的頻道推薦(如科技、體育、娛樂、軍事等)中閱讀後,再回主feed,推薦效果會更好。

因為整個模型是打通的,子頻道探索空間較小,更容易滿足用戶需求。只通過單一信道反饋提高推薦準確率難度會比較大,子頻道做的好很重要。而這也需要好的內容分析。

上圖是今日頭條的一個實際文本case。可以看到,這篇文章有分類、關鍵詞、topic、實體詞等文本特徵。

當然不是沒有文本特徵,推薦系統就不能工作,推薦系統最早期應用在Amazon,甚至沃爾瑪時代就有,包括Netfilx做視頻推薦也沒有文本特徵直接協同過濾推薦。

但對資訊類產品而言,大部分是消費當天內容,沒有文本特徵新內容冷啟動非常困難,協同類特徵無法解決文章冷啟動問題。

今日頭條推薦系統主要抽取的文本特徵包括以下幾類。首先是語義標籤類特徵,顯式為文章打上語義標籤。這部分標籤是由人定義的特徵,每個標籤有明確的意義,標籤體系是預定義的。此外還有隱式語義特徵,主要是topic特徵和關鍵詞特徵,其中topic特徵是對於詞概率分布的描述,無明確意義;而關鍵詞特徵會基於一些統一特徵描述,無明確集合。

另外文本相似度特徵也非常重要。在頭條,曾經用戶反饋最大的問題之一就是為什麼總推薦重複的內容。這個問題的難點在於,每個人對重複的定義不一樣。

同樣,還有時空特徵,分析內容的發生地點以及時效性。比如武漢限行的事情推給北京用戶可能就沒有意義。最後還要考慮質量相關特徵,判斷內容是否低俗,色情,是否是軟文,雞湯?

今日頭條推薦系統的線上分類採用典型的層次化文本分類算法。最上面Root,下面第一層的分類是像科技、體育、財經、娛樂,體育這樣的大類,再下面細分足球、籃球、桌球、網球、田徑、遊泳等,足球再細分國際足球、中國足球,中國足球又細分中甲、中超、國家隊等,相比單獨的分類器,利用層次化文本分類算法能更好地解決數據傾斜的問題。

還沒聽夠?

來一波小視頻~三分鐘徹底了解推薦系統算法

 

讀芯君開扒

隨著信息技術和網際網路的發展,人們逐漸從信息匱乏的盲區走入了信息過載的時代。網際網路上的信息是海量的:YouTube用戶每分鐘上傳超過400小時的視頻;微信上超過1000萬個公眾帳號每天產生豐富的自媒體內容;Instagram用戶每天貼出超過800萬照片;Snapchat用戶每天生成5億多「故事」(Story),全部看完需要158年……類似的例子數不勝數。

 

以推薦算法為核心技術的推薦系統憑藉其個性化推薦和有效降低信息噪音的特點開始被廣泛使用,比如國外的 Google、Facebook 和國內的今日頭條。

 

時至今日,已經很難想像一個新的網際網路應用沒有利用推薦系統來優化用戶體驗。

 

人工智慧技術對於推薦系統的影響是巨大的。從人工推薦到深度學習模型,在日新月異的技術浪潮中,推薦系統已經成為了諸多網際網路應用的基石。過去十多年的研究和開發,使得這個領域迅猛發展,推動了人工智慧很多方向的前進。

 

從現實來看,推薦系統要成為智能系統,還有很長的路要走。我們需要站在更高的維度來看待和思考推薦系統,提出更加具有挑戰的問題,基於這些問題才能引領我們去革新方法論,創新出一整套能夠大幅度豐富用戶體驗與提高產品價值的推薦系統理論與實踐。

留言 點讚 發個朋友圈

我們一起探討AI落地的最後一公裡

作者:二嶽初

參考文獻連結:

http://geek.csdn.net/news/detail/112318

http://www.sohu.com/a/217314007_297710

如需轉載,請後臺留言,遵守轉載規範


推薦文章閱讀



長按識別二維碼可添加關注

讀芯君愛你


相關焦點

  • 藍牙耳機推薦:200-2000元值得買藍牙耳機
    最近還蠻多人問我2021年有沒有好用的藍牙耳機推薦,其實好用的牌子在2020年就很火爆了,這不下面就為大家總結200-2000元值得買的五大藍牙耳機。    JEET藍牙耳機雖然是這幾年興起的網紅耳機品牌,但背後團隊深耕音視頻領域已經有15年時間了,對藍牙耳機的藍牙性能、舒適度、音質等都很深入的研究,像JEETONE剛上線預約人數就破9萬,售罄後還有人花500買它。
  • 真無線藍牙耳機怎麼買?小白入門高性能藍牙耳機推薦
    從前,花大價錢買一副耳機會被別人說亂花錢,甚至覺得沒有必要,但現在動輒上千買一副真無線耳機已經變成一件平常的事情了。耳機扣的消失或許也標誌這有線耳機的衰落吧!一個時代終將過去的,TWS耳機的時代到來了~但是怎麼選擇才不會踩雷呢?畢竟也不是9.9包郵,要是體驗不好也心疼啊!今天這篇文章就好好跟大家聊聊吧!
  • 雙十二有哪些藍牙耳機值得買?國產藍牙耳機推薦
    耳機在我們的生活中非常常見,而且目前當下耳機的種類特別繁多,例如有線耳機、藍牙耳機、頸掛耳機、骨傳導耳機以及頭戴耳機等。在眾多耳機品類中,藍牙耳機最受歡迎,主要還是因為藍牙耳機小巧玲瓏、佩戴比較方便,而且隨著智慧型手機逐漸取消耳機音頻接口以及藍牙耳技術的不斷提升,藍牙耳機的優勢越發明顯。
  • 網購時代為什麼還有人線下買手機?店老闆:因為這點差別太大了!
    我國現如今已經完完全全的進入了網際網路時代,並且在網際網路時代中我們大部分人都已經不再喜歡進行線下購物,並且大部分實體店也在電子商務的興起和衝擊之下,不得不選擇關門。但是在智慧型手機行業中,這一點極為不同,在網購時代中,線下智慧型手機實體店並沒有倒閉,反而是越開越多。
  • 藍牙耳機怎麼買?每天一個避雷小技巧,高性價比藍牙耳機推薦
    從前,花大價錢買一副耳機會被別人說亂花錢,甚至覺得沒有必要,但現在動輒上千買一副真無線耳機已經變成一件平常的事情了。耳機扣的消失或許也標誌這有線耳機的衰落吧!一個時代終將過去的,TWS耳機的時代到來了~但是怎麼選擇才不會踩雷呢?畢竟也不是9.9包郵,要是體驗不好也心疼啊!今天這篇文章就好好跟大家聊聊吧!
  • 藍牙耳機品牌推薦:配置、實力超強的品牌
    想買藍牙耳機的朋友可就犯了難,各種品牌各種機型糾結來糾結去,如果你不知道怎麼買,建議你先看完這份藍牙耳機品牌榜,了解這五款配置、實力都很高的寶藏品牌後,再考慮買哪款的問題吧!,加上蘋果封閉的生態鏈系統,AirPods可以實現開蓋秒速彈窗,和蘋果設備快速連接等優勢。
  • 藍牙耳機買什麼品牌好,高性價比藍牙耳機推薦
    對很多音樂發燒友來說,戴耳機聽音樂是一件很酷的事,但傳統有線耳機因為線材束縛,在運動時或扭動頭部時,容易夾頭髮或者摩擦脖頸,體驗不是很好。隨著蘋果發布AirPods後,真無線耳機的熱度也在逐漸走高,沒有了傳統耳機線的束縛,運動休閒時暢享無線音樂成了時下熱門的生活方式。
  • 關於耳機 | 買耳機應該留意什麼?買耳機應該注意什麼?耳機應該怎樣選?
    為了解決手機推力不足的問題,也有很多搭配智能型手機的隨身耳放問世,您也可以透過外接這類裝置解決手機推力不足的問題。相反的,如果是在家中定點使用,前端器材(例如播放機、放大機、USB DAC)內含不錯的耳放功能,那麼您可以搭配的耳機範圍就會寬很多,採用大型耳罩產品還能獲得更大動態、更充實低頻或更寬鬆聽感。
  • 雙十一買什麼藍牙耳機最划算,真無線藍牙耳機性價比推薦
    雙十一買什麼藍牙耳機最划算,真無線藍牙耳機性價比推薦 談及真無線藍牙耳機,就不得不說全球首款真無線耳機—AirPods,正是它的出現才帶火了真無線耳機。
  • 蘋果發布收官作:4399買臺iPhone11,還是買個耳機?
    今年已經發布了5款手機,所以這一次是配件,藍牙耳機的大哥大——AirPods Max。 AirPods Max是蘋果有史以來第一款【無線頭戴式藍牙降噪耳機】,因為11月剛開完新一代MacBook的發布會,加上產品就這麼一款,蘋果連發布會也懶得開了,直接在官網上架。
  • 蘋果發布收官作:4399元買臺iPhone11,還是買個耳機?
    今年已經發布了5款手機,所以這一次是配件,藍牙耳機的大哥大——AirPods Max。AirPods Max是蘋果有史以來第一款【無線頭戴式藍牙降噪耳機】,因為11月剛開完新一代MacBook的發布會,加上產品就這麼一款,蘋果連發布會也懶得開了,直接在官網上架。
  • 蘋果無線耳機值得買嗎?性價比最高的五款藍牙耳機推薦
    蘋果無線耳機值得買嗎? 第一款:JEET Air Plus藍牙耳機 推薦理由:花五分之一的價格買大牌體驗 靠技術混飯吃的網紅JEET,官方宣傳花20%的價格買千元大牌,因此火到出圈,被諸多明星推薦種草,剛上線的時期一般正常渠道都買不到,只能通過黃牛購買!在剛剛過去的618,銷量直接翻了十倍(見下圖)。
  • 藍牙耳機推薦:2020年高性價比藍牙耳機!
    元以內的高性價比藍牙耳機,推薦給大家。    超低延遲,兼容283款主流手機    手機兼容性方面,JEETONE可兼容283款主流手機,藍牙連接穩定,吃雞戰力buff暴增200%。另外,JEETONE藍牙耳機的延遲超低,在95ms左右,目前為止還沒有哪款耳機可以做到這樣,要知道蘋果Airpods技術這麼牛逼,低延遲率都在120ms以上。
  • 新手該買什麼耳機?
    誠如每件物品都有存在意義,買好耳機並非奢侈的行為,而是一種嗜好,更是一種學習,學著全新角度鑑賞音樂,習得理解影音產品的設計和內涵。別忘了!購買耳機的初衷是享受音樂樂趣,而非無止盡的升級煩惱。如果願意升級高質量的影音系統,該如何挑選呢?
  • 耳機選購指南:買真無線藍牙耳機需要注意什麼
    運動派,希望有一點音質,主要還是要帶著舒服,然後有一定的防水能力,別跑步的時候掉下來就行了,不過通常我會推薦運動派買項圈耳機。那麼買藍牙耳機的時候,到底應該怎麼選擇呢?正如我上面說的,你得先搞清楚你是哪一派的,然後才能買到合適的耳機。
  • 雙十二值得買的耳機有哪些?藍牙耳機入耳式推薦
    雙十二值得買的耳機有哪些?藍牙耳機入耳式推薦 2020年12月10日 15:20作者:網絡編輯:宏偉   現如今,耳機已經成為我們日常生活中不可缺少的一件手機附品了
  • 耳機|幾款耳塞、耳機推薦,讓木耳朵感受春天的音樂氣息.
    他們家最最出名的就是ER4,在耳塞界也是一個傳奇,插上臺式系統,是可以吊打同等價位的家用耳機,造型也是誇張的深入人心。該款耳塞包含了兩條可以更換覺得耳機線,一條是黑色的普通線,一條是藍色的手機線,手機線有線控,使用起來更方便。
  • 適合手機使用的HIFI耳機推薦
    所有的人聲都在中頻部分,無論你是趙鵬還是瑪麗亞凱莉,在耳機音箱面前都是一回事。所以以後問耳機推薦不要問我喜歡聽高音或者我喜歡低音了。換言之,人類的嗓子絕對無法發出高頻和低頻的聲音,不信你自己可以試試。從耳機的佩戴方式可以分為四類。1.平頭式耳機,就不列舉了,諾基亞賽班時期手機附送的耳機都是平頭。特點是聲場較入耳大一些,佩戴不敢說很舒適,但是絕對不會很難受。缺點是,平頭距離耳道有一定距離,聲音不會直接傳入耳朵裡,部分細節可能會丟失,同時不隔音,帶著運動的話很容易掉。
  • 雙十二該買什麼藍牙耳機?500元藍牙耳機性價比之王
    雙十二該買什麼藍牙耳機?2016年iPhone 7取消了3.5mm的耳機接口,並且發布了發布了第一代AirPods,真無線藍牙耳機就出現在人們的視野之中,隨著時間的推移,各大耳機手機廠商逐步掌握和完善了真無線藍牙耳機技術,價格也是趨向大眾化了,下面就為大家盤點幾款500元以下的無線藍牙耳機,看看哪款最值得入手。
  • 手機耳機推薦 飛朵A33音樂耳機雲南123
    感興趣的朋友可直接前往昆明市五華區圓通北路佰騰數碼廣場A座二樓213號詳詢,關於飛朵A33耳機的促銷信息也可諮詢(聯繫電話:13700693743 )該商家。圖為:飛朵A33高清實拍圖飛朵A33主要參數解讀:佩戴方式入耳式功能用途手機耳機