深度學習技術在美圖個性化推薦的應用實踐

2020-12-15 InfoQ技術實驗室

美圖社區個性化推薦場景與挑戰

1. 業務場景

美圖社區個性化推薦場景大大小小有十多個,其中流量比較大的場景是美圖秀秀 app 的社區內容推薦 tab ( 圖 1 ),這個場景以雙列瀑布流的形態給用戶推薦他最感興趣的內容。

當用戶點擊感興趣的圖片後會進入圖 1-2 的相似推薦 feeds 流場景。在這個場景下, 用戶消費的圖片和視頻,都是和用戶剛剛點擊進來圖片是具有多種相似性的,如視覺、文本、topic 等。而如果用戶是從雙列瀑布流裡點擊視頻,則會進入到圖 1-3 的視頻 feeds 流場景。這個場景主打讓用戶有沉浸式的消費體驗。以上是美圖社區內容推薦的主要業務場景。

美圖個性化推薦業務場景

工作目標個性化推薦的首要目標是理解內容。從內容本身的視覺、文本以及特定場景下用戶的行為來理解社區裡可用於推薦的內容。接下來是理解用戶,通過用戶的基礎畫像 ( 年齡,性別等 )、設備畫像 ( OS,機型等 ),以及用戶的歷史行為來挖掘其興趣偏好。

再理解了社區的內容和用戶之後,才是通過大規模的機器學習算法進行精準推薦,千人千面地連接用戶與內容,從而持續提升用戶體驗,促進社區繁榮。

圖 2 美圖個性化推薦業務目標

3. 挑戰

在實際生產實踐過程當中,主要遇到挑戰如下:

海量

美圖內容社區有月活超過 1 億的用戶,每天有 100 多萬的候選圖片和視頻。在這種數據規模下,只在小數據規模下驗證有效的複雜算法模型無法直接應用到工業界線上系統。

實時

算法需要在端到端小於 300ms 的時延裡,每天處理超過 3 億的個性化排序請求。這要求召回和排序算法不能過於複雜,要能夠進行高效的計算。

長尾

在實際場景中,用戶分布以及 item 行為分布都是長尾的:

用戶分布的長尾性:新用戶佔比超過 27%;

曝光分布的長尾性:關注 << 點擊 << 曝光。

在這樣長尾數據上進行預估要求我們的模型具備穩定的泛化能力。

圖 3 美圖個性化推薦的挑戰

美圖深度學習技術棧——召回端

在上述的應用場景和技術挑戰下,美圖是如何將深度學習應用到個性化推薦中的召回端和排序端的呢?我將會在下面為大家一一介紹。

召回端的 Item embedding 技術和召回模型,用於從百萬級別的候選集裡挑選 TOP 500 個用戶最感興趣的候選集。相對於召回端,排序端的深度排序模型能夠融合多種召回來源並進行統一排序,排序模型能包容規模更大的細粒度特徵,相對召回模型,排序模型能夠實現更加精準的推薦。

美圖目前部署在線上系統的召回技術主要包括 Item2vec,YouTubeNet,以及雙塔 DNN。

1. Item2vec

Item2vec,是一種通過用戶行為來理解內容的方式。

傳統的理解內容方式是基於用戶行為構造 item 側的統計類特徵,例如 item 的點擊率,收藏率等。這些特徵是非常有效的,但是對內容的理解維度比較單一。

另一種方式是從圖片的本身的視覺來提取比如圖片質量、清晰度、圖片物體等等。還可以通過內容本身的文本特徵,比如關鍵詞,實體詞等等,來幫助理解內容。這些維度的特徵在內容冷啟動中是很有效的。但是他們無法表達內容的某些潛在特性,比如某個內容是否給用戶呈現出清新有趣的感覺。這種潛在的特徵藉助用戶的行為來理解比較合適。Item2vec 正是這樣一種技術,它基於短時間內被瀏覽的 item 具有內在相似性的假設來學習 item 的 embedding。

在圖 4 中可以看到 item2vec 在美圖社區圖片上的部分效果。可以看到和查詢圖在訓練數據中高頻共現和中頻共現的 item,在背景和主體人物上和查詢詞是高度相似的。而低頻共現的部分和我們的查詢圖片有些差異,不過主體內容總體上還是比較相似的。

總體而言,item2vec 是一種學習 item embedding 的成熟方案。

Item2vec 可視化效果

Item2vec 學習出來的 item 向量是美圖多種向量檢索式召回策略的底層數據,包括實時興趣,短期興趣等等。比如當用戶點擊了某個 item,系統會實時地通過向量內積運算查詢相似的 item 並插入到召回源頭部,用於下一輪的排序。

使用 item2vec 學習出來的 item 向量作為底層數據的召回策略,在美圖應用非常廣泛,它們在整體曝光中佔了 10% 以上。

實際應用時,我們是基於 skip-gram+negative sampling 來做 item2vec 的。它是一個只有一個隱層的深度學習模型。輸入端是用戶的點擊序列, 輸出端是與輸入端的 target item 鄰近的 64 個 item。64 相對於 NLP 裡取的 5-6 個是比較大的,這是因為用戶的點擊序列不像自然語言那樣具有嚴格的局部空間句法結構。在比較大上下文窗口中,更容易找到和目標 item 相似的上下文 item,模型更容易學習。

圖 5 item2vec 應用實踐

負採樣的個數是正樣本數的兩倍,這是一個效果和性能折中,在我們的應用中正負樣本數 1:2,能夠在天級別模型更新情況下,取得比較好效果。隱層的 embedding size 取 128 可以得到比較好的效果, 這個取值同樣是效果和性能的折中。另外,我們過濾了點擊序列長度小於 5 的樣本,這樣過濾之後,我們的點擊序列能覆蓋 99% 候選圖片和視頻。

Item2vec 是學習 item embedding 向量的一種非常好的方案,它也覆蓋了美圖多個推薦業務。但是它不直接考慮用戶的個性化行為,只考慮了訓練樣本中 item 與 item 之間的局部共現關係。如果要利用上豐富的用戶側特徵,實現個性化的話,那麼我們需要借鑑其他方案,而 YouTubeNet 正是這樣一種業界成熟的方案。

2. YouTubeNet

YouTubeNet 是 Google 於 2016 年提出的。與 item2vec 不同,YouTubeNet 在學習 item 向量的時候考慮了用戶向量。從模型的優化目標上可以看出,是在給定用戶向量的情況下,從候選池中篩選出該用戶最感興趣的 item 列表。

圖 6-1 YouTubeNet 應用實踐

從上圖右側模型架構圖可以看到,模型訓練用的 label 是用戶最近點擊過的 item 列表,特徵包括兩部分,一部分是用戶更早之前點擊過的列表 ( clicked_item_list ),另一部分是用戶的 demographic 統計特徵,如年齡、性別等。引入上述用戶的個性化信息之後,模型通過學習 user embedding 和 item embedding,並離線導出用戶向量和 item 向量。線上使用時利用 FAISS 工具離線計算好每個用戶的 top N 候選 item 集,提供給排序算法使用。不過這種離線存儲候選集的方式,不能實時應對用戶不斷變化的興趣,要捕獲這種變化,需要實時採集用戶不斷變化的點擊 item 數據,實時計算用戶側向量。

實時計算用戶側向量的工作,一共分了兩部分:第一部分是離線部分,為下圖右側的虛線部分,這裡模型一天一更新。離線部分基本流程和上一段所述相同,模型訓練完之後導出 item 向量並在 FAISS 中構建好索引。第二部分是實時部分,這一部分藉助 kafka,實時採集用戶點擊行為數據並構建 clicked_item_list 特徵,接著請求離線訓練好的模型,計算出用戶側向量,最後從 FAISS 中查詢的候選集,輸出給排序服務。

使用 YouTubeNet 模型實現實時計算用戶側向量之後,曝光佔比 22% 的 YouTubeNet 給整體帶來了點擊率 3.67% 的提升,人均時長提升 2.22%。

圖 6-2 YouTubeNet 應用實踐

雙塔 DNN雙塔 DNN 模型,聯合用戶行為和 item 側特徵進行召回。雙塔 DNN 模型構建用戶側 embedding 的方式和 YouTubeNet 是一樣的:先給用戶的點擊行為序列,年齡性別等稀疏的特徵做 embedding,再經過幾個簡單的全連接層,得到用戶側向量。對於 item 側特徵,雙塔 DNN 引入另一個子網絡來學習,學習方式和用戶側特徵是一樣的。

離線訓練完了之後和 YouTubeNet 還是一樣,把 item 向量提前導出並加載到 FAISS。在線上環境使用的時候,實時計算用戶側向量,來快速捕獲用戶興趣。引入 item 側特徵,使得線上用戶點擊率提升 1.05%,人均時長提升 0.76%。

圖 7 雙塔 DNN

總結

Item2vec 學習出來的 item 向量具有很好的相似性,作為底層數據,服務了多個召回策略, 在美圖具有非常廣泛的應用。包括實時興趣,短期興趣等等,覆蓋了 10% 以上的曝光佔比。YouTubeNet 和雙塔 DNN 則分別引入用戶側和 item 側特徵,有監督地學習用戶最感興趣的 item 候選集,在美圖個性化推薦召回層,累計點擊率提升了 4.72%,時長提升了 2.98%。

美圖深度學習技術棧——排序端

1. 重新審視 NFM 模型

美圖的第一代模型主打 LR 為主 + 人工特徵組合。隨著業務發展,大大小小的推薦場景越來越多,做特徵的人力越來越緊張。恰逢深度學習在工業級推薦系統有大規模應用落地實踐,因而逐漸將算法模型轉向深度學習。

圖 8 NFM 模型

2018 年年初,美圖用 NFM 模型首次打敗 LR 並取得穩定效果,NFM 模型創造性的將 FM 和深度模型端到端的聯合訓練,在底層就進行顯示的特徵交叉,NFM 論文的實驗和美圖數據集上的實驗都表明了模型能夠收斂更快也更加穩定。在美圖的實踐中,引入右側多層感知機學習隱式的高階特徵交叉之後,效果進一步提升,好於原始的 NFM 模型。改進後的 NFM 模型在我們的推薦流場景中取得了 5.5% 的點擊率,以及將近 7% 的時長提升。

在 NFM 模型取得穩定的正向效果之後,美圖推薦團隊繼續探索了業界更多的模型。不過都未能落地,主要有以下兩個原因。

第一個是像 Wide&Deep, DeepFM, DCN 等從模型的複雜度上看沒有比 NFM 擁有更強的預估能力,計算效率也沒有明顯優勢。離線評估和線上實驗上都沒有得到正向效果。

第二種情況是,xDeepFM 和 NFFM 離線指標提升了,但是計算複雜度很高。此外 NFFM 模型參數量大,內存是個瓶頸。導致它倆無法大規模落地。

經過一年多的探索,在業界的眾多模型中我們沒有找到合適美圖推薦場景的排序算法。另外,在我們引入行為序列特徵之後,NFM 的計算複雜度已經不能很好的支持線上流量。在這樣的背景下,美圖算法團隊決定自行設計算法。

NFM 模型的優點在於,通過 Bi-Interaction,將 FM 模型端到端引入到深度模型,顯式構建特徵的乘性關係,加強模型預估能力,同時沒有增加時間複雜度。但是在實際生產實踐中,存在 2 個

不足:

(1) NFM 需要足夠的 Embedding layer 寬度來學習特徵。在實際場景下,其寬度取 200 左右,效果最好。但是隨著百萬級別用戶行為序列特徵的加入,NFM 模型的計算量越來越大,越來越不能滿足線上小於 300ms 的時延要求。

(2) 另一個不足是,NFM 模型本身存在 co-training 的問題,即:一個特徵的學習,會不可避免地受到其他特徵的影響。例如,用戶的性別特徵,與用戶的網絡環境特徵是不相關的;但是 NFM 模型無法構建這種情況。

圖 9 NFM 模型的不足

基於以上不足,我們先來看下業界相關經驗:

不管是在傳統淺層模型時代還是在深度學習時代,引入特徵的 field 信息之後,模型幾乎是總能帶來提升的。比如 FFM 仍然一直活躍在 Kaggle 等 CTR 預估比賽中,穩定的取得比不能建模 field 信息的 FM 更好的效果。而深度學習時代,業界很多公司比如 2018 年, 微軟離線驗證 xDeepFM 引入特徵的 field 信息之後,相對不能建模 field 信息的 DCN 同樣取得了很明顯的提升,即便在現在,xDeepFM 仍然是很優秀的模型。但是他們或者計算量太高或者參數量太大,導致無法大規模應用到線上系統。基於上面對 NFM 模型的優點的實驗和分析,美圖算法團隊開始嘗試 NFwFM 模型。

2. NFwFM 模型

2.1 模型整體架構

NFwFM 模型是在 FwFM 模型的基礎上演化出來的:通過 Field-wise Bi-Interaction 組件,將 FwFM 引入到深度模型裡面。

圖 10-1 NFwFM 模型整體架構

上圖是 NFwFM 模型的整體架構,首先,把特徵按照邏輯分為 3 個大模塊:用戶側特徵 ( 包括年齡、性別等 ),item 側特徵 ( 包括 item id,item 標籤等 ) 以及上下文側特徵。

接下來將 FwFM 分解成了 3 個子模塊:第一個模塊是線性加和模塊 ( 上圖中 S 表示 ),不區別 field 學習的特徵;第二個模塊是矩陣分解模塊 ( 上圖中的 MF 部分 ),用來學習 field 粒度下的特徵組合,比如 user field 和 item field 的二階交叉;第三個模塊是 FM 模塊,用來學習 field 內部 feature 粒度的特徵組合。

2.2 FwFM 和 FFM 相比

(1) FwFM 模型尺寸相對 FFM 少 M-1 倍。在美圖實際應用中,特徵量大約可減少 30 倍。

(2) FwFM 模型引入了 Field 相關的權重 ri,j ,解決了 FM 存在的不相關特徵在學習過程中互相干擾的問題。

(3) 離線評估顯示,FwFM 模型的預測性能 ( 例如 AUC 指標 ) 和 FFM 基本一致,而參數規模大大降低。

FwFM 模型由於要建模 field 信息,導致它無法像 FM 那樣具備良好的線性時間複雜度。因此,需要將 FwFM 做矩陣分解 ( 上面架構圖中的 MF 模塊 )。

2.3 MF 模塊

如下圖所示,模型分別從用戶側和 item 側提取特徵向量 v i 和 v j ,在這兩個向量上進行矩陣分解,用來學習 field 粒度的特徵組合。實際應用中,需要分別對用戶側、item 側、context 側進行兩兩矩陣分解,因此共有 3 個矩陣分解子模塊。

通過離線評估顯示,MF 分解前後的 FwFM 模型,其 AUC 等指標持平,但是相同參數規模下計算量降低 M*M 倍,計算效率大大提升。

2.4 FM 模塊

但是,MF 分解也會存在不足,例如:對於用戶側存在的豐富多樣的特徵,沒有辦法使用矩陣分解進行兩兩二階交叉。

因此,在 field 內部引入 FM,用來顯式學習用戶側 feature 粒度的所有特徵的二階交叉組合。具體來講,給 user field 引入一個 FM 模型,對用戶的年齡、性別等特徵的二階交叉,同樣的算法也用於 item field 等。這樣,FwFM 模型就演化成了下圖這樣一個 Field-wise Bi-Interaction 組件。引入 FM 模型後,模型的 AUC 指標提升了約 0.002。

2.5 解決特徵間幹擾問題

但是這樣並沒有解決最一開始提到的問題:FM 模型在學習過程中,特徵存在互相干擾的情況。

回顧一下前文所述的特徵間幹擾問題,即 FM 的 co-training 問題:

模型在對每一個特徵進行學習的時候,都需要和其他特徵進行交叉。例如,用戶性別特徵和網絡環境特徵應該是不相關的,但是模型在學習性別特徵的時候不可避免地受到網絡環境的影響。

為解決這一問題,借鑑 dropout 思路:模型訓練完成 Bi-Interaction 後,按照伯努利分布 ( 期望為 β ) 隨機丟棄部分二階交叉項,以解決部分 co-training 問題。

具體來講,先從伯努利分布中採樣出由{0,1}組成的向量,再用該向量和 FM 模型計算得到的表示二階特徵交叉組合的向量進行相乘,這樣可以隨機丟棄部分二階交叉項。在預估的時候是將 FM 做了 Bi-Interaction 後得到的向量,乘以伯努利分布的期望 β,用來對齊計算過程中丟失的數據的大小。引入如上思路之後,AUC 提升約 0.001。

2.6 總結

總體來講,我們從 FwFM 演化出 Field-wise Bi-Interaction 組件,包含線性加和模塊用來學習一階特徵,還包括矩陣分解 ( MF ) 模塊和 FM 模塊,用來學習特徵 field 粒度和 feature 粒度的特徵交叉。相比於上一代 NFM 模型,使用這樣的模型,在計算量和參數量都減少了 6 倍的情況下,點擊率得到了 5.19% 的提升。

3. Multi-task NFwFM

3.1 多任務基本架構

3.2 樣本 reweight

具體來說,我們引入一個樣本 reweight 的概念,主要目的是為了引入更多更高質量的關注行為數據。因為無數的經驗告訴我們這是非常有效的做法。

以下圖為例,假設有 A、B、C、D 這 4 個 item,圖中實線部分表示 item 的真實 CTR ( 由大到小分別是 C > D > B > A );而實際的關注轉化率的關係是 A > C > B > D = 0。

3.3 Homoscedastic Uncertainty 學習方式

上述工作點擊率提升很少的原因是 reweight 模型過於簡單。如前文所述,多任務的缺點是在參數共享的情況下,如果兩個任務有不相關的部分,兩個任務就會互相干擾,從而影響效果。學術界將這種現象稱為共享衝突。共享衝突這一問題分析和解決起來較為複雜。針對美圖的具體場景,減少共享衝突的一種方法是加大點擊率預估任務的重要性,讓點擊率預估任務主導底部共享參數學習,進而讓整體模型優先正確預估點擊率模型,再去預估點擊轉化率任務。

從下圖可以看出,左圖的關注轉化的不確定性達到 0.76,確實比右圖的點擊率的不確定性 ( 約 0.42 ) 更高;因此,讓點擊率預估任務主導整個模型的學習。

4. 總結

排序端的工作,美圖經歷了從 LR 模型到深度學習模型的引進:

(1) 引入 NFM 模型,點擊率提升了 5.53%,人均時長提升 6.97%

(2) NFwFM 模型在引入了特徵 Filed 信息後,在模型尺寸和計算複雜度可控的情況下,點擊率提升了 5.19%,人均時長提升了 2.93%;

多目標 NFwFM 模型,在引入更多更高質量數據之後,不僅關注轉化率提升了 15.65%,點擊率也提升了 1.57%。

參考文獻

1. Covington P, Adams J, Sargin E. Deep neural networks for youtube recommendations

2. Ma J, Zhao Z, Yi X, et al. Modeling task relationships in multi-task learning with multi-gate mixture-of-experts

3. Rich Caruana. 1998. Multitask learning. In Learning to learn

4. Lin T Y, Goyal P, Girshick R, et al. Focal loss for dense object detection

5. Kendall A, Gal Y, Cipolla R. Multi-task learning using uncertainty to weigh losses for scene geometry and semantics

6. [白楊 -2018] 基於用戶行為的視頻聚類方案

https://cloud.tencent.com/developer/article/1193177

7. [蔣文瑞 2018]. 深度模型 DNN 在個性化推薦場景中的應用

https://cloud.tencent.com/developer/article/1193180

8. [陳文強 2019]. 多任務學習在美圖推薦排序的近期實踐

https://cloud.tencent.com/developer/article/1475686

作者介紹

陳文強、白楊、黃海勇,來自於美圖公司數據智能部。該團隊負責美圖大數據和 AI,通過用戶畫像、推薦算法、內容理解、大數據等,對公司的產品、技術、運營、商業化等賦能。

相關焦點

  • 深度學習與PaddlePaddle的應用-個性化推薦
    作者:沈克強 來源:人工智慧學習圈I 研究背景推薦系統(Recommender System)是向用戶建議有用物品的軟體工具和技術,它運用數據分析、數據挖掘等技術,實現對用戶瀏覽信息或商品進行智能推薦,是機器學習,尤其是深度學習算法的重要應用場景。
  • 【推薦】基於MATLAB編程、機器學習、深度學習在圖像處理中的實踐技術應用
    基於MATLAB編程、機器學習、深度學習在圖像處理中的實踐技術應用主辦方:Ai尚研修(點亮科研技術簡學踐行、您的隨行導師平臺)         網  址:www.aishangyanxiu.com協辦單位:陝西中科資環信息技術有限責任公司
  • 深度學習推薦模型DeepFM技術剖析:助力華為應用市場APP推薦
    今年8月下旬,在澳大利亞墨爾本召開的IJCAI2017會議上,來自華為伏羲推薦團隊的專家發表了他們在深度學習推薦算法方面的最新成果。伏羲推薦引擎是華為應用市場聯合華為諾亞方舟實驗室開發的一款推薦系統。針對華為應用市場的業務特點和數據特徵,伏羲推薦算法團隊提出的端到端的深度學習推薦模型DeepFM,助力華為應用市場更加精準、個性化的推薦體驗。
  • FACEBOOK/谷歌/微美全息等AI深度學習+AR技術助力交互顯示擴展應用...
    人工智慧、機器學習、深度學習、自然言處理等先進技術帶來的產業革命和生產力的充分釋放,經過多年的創新發展,人工智慧讓智能設備逐步實現從認識物理世界到個性化場景落地的跨越。在構成人工智慧行業主體的三類企業中,算法企業是推動核心底層技術發展的重要力量,其重要意義在於以算法突破工業界紅線,推動其真正達到工業界應用的KPI。
  • 【推薦實踐】深度學習在阿里B2B電商推薦系統中的實踐
    推薦導購場景在電商中是重要的滿足用戶"逛"和"買"的場景,本次分享我們聚焦深度學習在阿里B2B電商 ( 1688 ) 推薦系統中的應用,其中包括商品推薦中召回 ( 多興趣Deep Match ),排序 ( 自研DMR ) 的相關工作,以及在新興的互動內容場景 ( 直播、短視頻 ) 中通過異構網絡來解決異構信息的精準匹配問題。
  • 新書推薦:TensorFlow深度學習及實踐
    自從深度學習在語音識別和圖像識別任務中取得突破性成果後,使用深度學習的應用數量開始呈爆炸式增加。深度學習方法被大量應用在身份識別、無人駕駛、癌症檢測、遊戲AI等方面,甚至在許多領域,深度神經網絡的準確度已經超過人類自身的操作。深度學習的數學原理並不複雜,但它的一些設計思想很巧妙。入門深度學習,在數學方面只要知道如何對函數求導以及知道與矩陣相乘相關的知識即可。
  • 基於深度學習的商品檢索技術在服裝搭配中的應用
    摘要商品檢索是一門綜合了物體檢測、圖像分類以及特徵學習的技術。近期,很多研究者成功地將深度學習方法應用到這個領域。
  • 【新書推薦】TensorFlow深度學習及實踐
    自從深度學習在語音識別和圖像識別任務中取得突破性成果後,使用深度學習的應用數量開始呈爆炸式增加。深度學習方法被大量應用在身份識別、無人駕駛、癌症檢測、遊戲AI等方面,甚至在許多領域,深度神經網絡的準確度已經超過人類自身的操作。深度學習的數學原理並不複雜,但它的一些設計思想很巧妙。入門深度學習,在數學方面只要知道如何對函數求導以及知道與矩陣相乘相關的知識即可。
  • 在圖像處理中應用深度學習技術
    儘管圖像預處理、後期處理和信號處理仍採用現有方法進行,但在圖像分類應用中(缺陷、對象以及特徵分類),深度學習變得愈加重要。利用深度學習處理某些任務更簡單,效果更好,甚至某些任務只能用深度學習方法來解決。深度學習正在逐漸威脅傳統圖像處理方法的地位——特別是處理任務中包含有複雜變量時(如反射面、光照不佳的環境、光照變化或移動的對象)。
  • 深度學習在推薦系統上的應用
    為什麼我們會想到使用深度學習去處理推薦系統裡面的事情呢,推薦系統從基於內容的推薦,到協同過濾的推薦,協同過濾的推薦在整個推薦算法領域裡獨領風燒了多年,從基本的基於用戶的協同過濾,基於item的協同過濾,到基於model的協同過濾等眾多算法的延伸。或許深度學習在推薦系統裡面沒有像圖像處理算法那樣一枝獨秀,但是深度學習對於推薦系統的幫助確實起到了,推波助瀾的功效。
  • 深度學習技術介紹及應用
    在很多人眼裡,深度學習是一個非常神奇的技術,是人工智慧的未來,是機器學習的聖杯。今天大恆圖像帶您一起揭開他神秘的面紗,了解什麼才是深度學習。  當我們在網絡上搜索「深度學習」的時候往往還能搜到「人工智慧」以及「機器學習」這兩個關鍵詞。有很多人甚至認為深度學習就是人工智慧,其實這些概念之間還是有一些區別的。
  • 【Embedding】SDNE:深度學習在圖嵌入領域的應用
    今天學的論文是清華大學崔鵬老師工作《Structural Deep Network Embedding》(後簡稱 SDNE),並發表於 2016 KDD,目前為止共有 880 多引用,是一個非常經典的將深度學習應用於 NetWork Embedding 的算法。
  • 深度學習應對推薦系統,必須懂的3個層面
    應用領域有:電子商務、電影視頻、社交網絡、個性化閱讀、位置服務、個性化郵件、個性化廣告、個性化旅遊、證券、理財、個性化音樂等等。第一個層面:推薦系統的數據分析例如:一方面淘寶用戶在逛淘寶時會留下用戶的個人信息、喜好信息、上下文信息;另外一方面用戶的行為,用戶對寶貝的評價、評分、點擊、瀏覽、搜藏、購買等行為會構成用戶與寶貝商品之間形成行為數據。
  • 微信的機器學習與人工智慧應用實踐
    2018 年 1 月 13-14 日,AICon 全球人工智慧與機器學習技術大會在北京召開,微信小程序商業技術負責人張重陽應邀擔任本次大會的聯席主席,發表演講介紹了人工智慧應用落地過程中的 4 個"in",並結合在微信的實踐案例做了深入的講解。以下為演講全文。
  • 深度學習在推薦領域的應用:Lookalike 算法
    本文選自《深度學習算法實踐》,曾發表於《程式設計師》雜誌。了解本書詳情請點擊閱讀原文。在神經網絡和深度學習算法出現後,提取特徵任務就變得可以依靠機器完成了,人們只要把相應的數據準備好就可以了,其他數據都可以提取成向量形式,而社交關係作為一種圖結構如何表示為深度學習可以接受的向量形式,而且這種結構還能有效還原原結構中位置信息?這就需要一種可靠的向量化社交關係的表示方法。基於這一思路,在2016 年的論文中出現了一個算法node2vec,使社交關係也可以很好地適應神經網絡。
  • 深度學習應用大盤點
    第一種理解大大低估了深度學習構建應用的種類,而後者又高估了它的能力,因而忽略了那些不是一般人工智慧應用的更現實和務實的應用。最好最自然的理解應該是從人機互動角度來看待深度學習應用。深度學習系統似乎具備近似於生物大腦的能力,因此,它們可以非常高效地應用於增強人類或者動物已經可以執行的任務上。
  • 遞歸的藝術 - 深度遞歸網絡在序列式推薦的應用
    本文是深度學習在個性化推薦實踐應用的第二篇,在第一篇中,我詳述了如何利用歷史沉澱數據挖掘用戶的隱藏特徵,本文在上一篇的基礎上進行延伸,詳細分析如何利用LSTM,即長短時記憶網絡來進行序列式的推薦。    根據用戶的長期歷史數據來挖掘隱特徵是協同過濾常用的方法,典型的算法有基於神經網絡的受限玻爾茲曼機 (RBM),基於矩陣分解的隱語義模型等。
  • 深度學習(Deep Learning)系列篇(1):深度學習在騰訊的平臺化和應用實踐(全)
    引言:深度學習是近年機器學習領域的重大突破,有著廣泛的應用前景。隨著Google公開Google Brain計劃,業界對深度學習的熱情高漲。騰訊在深度學習領域持續投入,獲得了實際落地的產出。我們準備了四篇文章,闡述深度學習的原理和在騰訊的實踐,介紹騰訊深度學習平臺Mariana,本文為第一篇。
  • 使用OpenCV深度學習模塊在圖像分類下的應用實踐
    極市導讀:本文來自6月份出版的新書《OpenCV深度學習應用與性能優化實踐》,由Intel與阿里巴巴高級圖形圖像專家聯合撰寫,系統地介紹了OpenCV DNN 推理模塊原理和實踐。極市為大家爭取到5本贈書福利,詳見文末。深度學習理論的廣泛研究促進了其在不同場景的應用。
  • 深度學習模型及應用詳解!50本包郵贈送福利
    推薦語 本書深入淺出地介紹了深度學習中常用的多種算法和模型,並結合實際的搜索廣告系統,介紹了很多深度神經網絡在實際系統中的應用。本書兼顧了理論介紹和實際應用,尤其適合於想要將深度學習技術應用於工程實踐的讀者閱讀。