Netflix大數據應用

2021-01-08 湯圓叨叨

Netflix是一家什麼樣的公司?

Netflix是一家美國公司,在美國、加拿大提供網際網路隨選流媒體播放,定製DVD、藍光光碟在線出租業務。該公司成立於1997年,總部位於加利福尼亞州洛斯蓋圖,1999年開始訂閱服務。2007年2月25日,Netflix宣布已經售出第10億份DVD。2009年,該公司可提供多達10萬部DVD電影,並有1千萬的訂閱用戶。

在網際網路流媒體興起之前,影片的主要載體是DVD。早在2009年,Netflix就擁有了超過10萬部的DVD影片。顧客在線選擇後,Netflix免費將DVD郵寄給他們。後來,隨著流媒體的興起,Netflix在保留郵寄DVD業務的同時,也開始提供通過電子郵件傳送DVD和在網上直接觀看DVD這兩種流媒體服務。

大數據賦能Netflix

(一)擁有龐大的數據

根據Netflix公布的2020年第一季度的財報,第一季度Netflix全球付費用戶新增1580萬,遠超公司之前預期的700萬和分析師預期的847萬。截至目前,Netflix全球用戶總量已接近1.83億。龐大的訂閱用戶為Netflix提供了強大的數據來源。

僅有龐大的數據並不能支撐Netflix的精準推算,Netflix還擁有先進的推薦引擎和數據算法,可以根據類型、主題、演員特徵、故事情節、內容等向觀眾推薦影片。此外,Netflix還在數據獲取技術上精益求精,Netflix設立Netflix Adward獎金,獎勵那些為推薦算法做出貢獻的人,鼓勵人們為獲取數據改進方法做出努力,Netflix還舉辦大數據分析、挖掘比賽,不斷地提高數據分析和獲取能力,將數據運用到實際生產和營銷中,逐漸轉化為經濟效益。

(二)推薦引擎

推薦引擎是Netflix公司的一個關鍵服務,顧客可以在一個個性化網頁上對影片做出1-5的評級。Netflix將這些評級放在一個巨大的數據集裡,該數據集容量超過了30億條。Netflix使用推薦算法和軟體來標識具有相似品味的觀眾對影片可能做出的評級。

Netflix 已經使用參賽選手的方法提高了影片推薦的效率,這已經得到了很多影片評論家和用戶的好評。

(三)大數據算法

Netflix的幾種最核心的推薦算法:

1.Personalized Video Ranker: PVR

這是Netflix推薦系統最核心的部分,這是基於「基因」的電影推薦主要就是由PVR來完成的。「基因」是指電影或影視劇的題材和分類。PVR是千人千面的,即使同一個「基因」推薦序列,每個用戶看到的影片及排序都是不同的。

2.Top-N Video Ranker

PVR關注的是每個推薦序列的排序,而Top-N的核心目標是從所有序列中找出來最相關的。可以簡單理解地為,Top-N的計算範圍僅限於每個推薦序列頭部的數據,優化目標也是從所有推薦序列中優中選優。

3.Trending Now

Netflix發現近期趨勢(從幾分鐘到幾天)是預測用戶觀看行為的有效因子。Netflix使用trending ranker算法來生成Trending Now的推薦結果。

4.Continue Watching

Netflix使用continue watching raker來對是否繼續觀看某部影片或者某個系列來進行建模。Continue Watching不是未觀看完視頻的簡單陳列,它會綜合考慮距離上次觀看的時間,是停在了影片的中段、開頭還是結尾,使用的什麼設備,期間是否又觀看了別的影片等眾多因素。

5.Video-Video Similarity

Because You Watched (BYW) 推薦——基於觀看歷史的推薦——是一種普遍被使用的非常重要的推薦形態。這類推薦方法的核心是計算兩個影片的「相似度」。這種相似度本身是非個性化的,Netflix會在把BYW推送到個人頁面的時候加入個性化相關的度量。

6.Page Generation: Row Selection and Ranking

基於上面介紹的這些算法,Netflix通常會對每個用戶都生成一個上萬行的推薦結果集合。

7.Evidence

推薦理由選擇算法包括:1)對於影片的預測評分;2)內容介紹;3)演員陣容、所獲獎項之類的元數據;4)推薦圖片的選擇能關聯其他UI相關的部分。

推薦理由選擇算法會評估推薦影片相關的可供顯示的所有條目,然後選擇出最有利於幫助用戶做出判斷的條目顯示在頁面的推薦理由區域。

8.Search

從播放時長來看,80%的用戶選擇都或多或少受到了推薦的影響。其餘的20%來自於搜索,搜索也有自己的算法。Netflix綜合使用了信息檢索及相關技術為用戶提供最相關的搜索結果。

(四)數據分析與應用

1.推算觀眾的喜好和習慣

Netflix根據觀眾的觀看行為來判斷觀眾的愛好和習慣。當觀眾快進時,說明觀眾對這部分情節不感興趣;當觀眾回放時,說明觀眾對這部分情節回味無窮,他們認為這部分精彩或誘人,是全片的精華,製作者應該發揚;當觀眾暫停時,說明這部分比較乏味,不能把觀眾牢牢固定在座位上。對此,Netflix的公關總監Jonathan Friedland表示:「我們知道用戶在Netflix的觀看習慣,所以通過基於用戶習慣的分析,我們對哪些電視劇會受歡迎很有信心。隨著時間的推移,我們能夠針對不同用戶退出他們更加喜歡的節目。」

Netflix還用大數據算出觀眾的媒介觀看喜好。它根據觀眾與電視、筆記本、平板電腦的距離,分別設立「10英尺數學家」、「2英尺用戶界面管理員」、「18英寸用戶界面管理員」的崗位,研究如何使觀眾在使用各種媒介時都能達到最佳的觀影效果,不斷提高觀看體驗。

2.推算電視劇、導演和演員的交集

通過大數據分析,Netflix發現有大量觀眾點播1990年的英劇《紙牌屋》,而這部分觀眾大多是好萊塢名導大衛芬奇和演員凱文史派西的粉絲,他們十分希望兩人能重拍這部英劇。在多方因素共同作用下,Netflix決定重拍《紙牌屋》。結果,大衛芬奇執導的首播集為全劇鋪下了基調,保證了優良的品質;凱文史派西的精湛演技吸引了眾多觀眾,提升了全劇的表演檔次;《紙牌屋》的政治題材揭露了美國政界的陰暗面,引起了強烈反響。在算出三者交集方面,Netflix的大數據技術功不可沒。

3.推算播出方式

通過大數據技術,Netflix了解到觀眾更喜歡一次看數集電視劇,而不是一集一集地追著看。於是,Netflix改變了美劇邊播邊拍的傳統,完整的拍完一季,一次性播出13集,不像一般的美劇先播一集,再根據反饋拍攝下一集。Netflix的做法改變了美劇的製作模式,優勢明顯。對觀眾而言,他們不用忍受追劇的煎熬,不會總是被電視劇吊胃口,而是可以酣暢淋漓地欣賞整季,過足了觀癮。對製作而言,整季播出可以讓編劇先明確一個大結構,構造一個宏大的格局,讓步電視劇變得融會貫通,集與集直接銜接緊密,避免因邊播邊拍而造成的情節零碎和過度不自然。

到了觀眾可能想快進的片段時,都要加入獵奇或情色元素。如此不顧邏輯的合理性和劇情的連貫性,生硬的迎合觀眾,反而破壞了觀賞性,只能讓觀眾反感。因過度迎合觀眾而喪失了電視劇的特點和個性,適得其反。其次,《馬可波羅》的故事發生地是中國,其服飾、道具、布景都極具中國風格,但臺詞風格和思想觀念都是西化的,無論是中國觀眾還是西方觀眾都無法接受這種東西方文化不平衡的差異。

湯圓在下一篇文章裡將會通過具體的例子對Netflix的大數據營銷進行分析。

#創作者賦能學院#

相關焦點

  • 工業大數據的技術與應用
    其以產品數據為核心,極大延展了傳統工業數據的範圍,同時還包括工業大數據相關技術和應用。工業大數據的主要來源有如下3類。工業大數據應用則是對特定的工業大數據集,集成應用工業大數據系列技術與方法,獲得有價值信息的過程。工業大數據技術的研究與突破,其本質目標就是從複雜的數據集中發現新的模式與知識,挖掘得到有價值的新信息,從而促進位造型企業的產品創新,提升經營水平和生產運作效率以及拓展新型商業模式。
  • 2015網際網路+大數據應用案例Top100
    對於企業而言,大數據有時候就像是一個偵探家,能夠撥開重重迷霧,找到問題的本質以及解決方案,而關鍵在於,你是否真的懂得如何去駕馭它,讓它為你服務。在網際網路領域,大數據的應用已十分廣泛,尤其以企業為主,大數據真能改變企業的運作方式嗎?答案毋庸置疑是肯定的。隨著企業開始利用大數據,我們每天都會看到大數據新的奇妙的應用,幫助人們真正從中獲益。
  • 2015.09:網際網路大數據在政府統計中的應用路徑研究(「大數據在政府...
    網際網路大數據在政府統計中的應用路徑研究[1] 「大數據在政府統計中的應用研究」課題組[2]   內容摘要:近幾年,網際網路變得越來越「無所不在」,由此而產生的數據越來越多,網際網路大數據逐漸發展成為一門新學科、一套新學說以及一種分析與解決問題的新方法和新手段。
  • 《領導幹部大數據應用指南》由人民日報出版社正式出版
    人民網北京6月15日電 近日,大數據領導幹部讀本《領導幹部大數據應用指南》由人民日報出版社正式出版發行,並在新華書店及京東商城、當當網、西單圖書大廈網上圖書店同步上架。《領導幹部大數據應用指南》根據政府大數據應用的現狀及特點設置了相關篇章,包括:大數據認知篇、政府大數據政策篇、宏觀經濟大數據篇、紀檢政法大數據篇、民生大數據篇、社會治理大數據篇、行業大數據篇、開放共享篇等,涵蓋了大數據的概念、思維、政策及應用等內容。
  • 百度雲服務,讓視頻大數據應用更加豐富多彩
    近些年大數據這個詞越來越多的伴隨著網際網路行業的崛起頻繁出現在人們的視野中,一時間,伴隨著雲服務的成熟,把握住大數據逐漸成為了邁向成功的達摩利斯之劍。隨著雲時代的來臨,大數據的需求大增,如何有效運用各種類型的大數據創造商機,已成眾家從業者關心的焦點。透過大數據的分析技術,人類在社交媒體上的互動與喜好,生活方式的各種數據,都可以被歸納整理成有意義的信息,只要能夠掌握大數據並且實時分析,就能有效的改變交通、運輸、能源、醫療、服務等產業,進而創造龐大商機。
  • 打通數據生產、連結、應用全鏈,「三盟科技」引領國內教育大數據...
    近年,一則國內某大學通過大數據分析精準找到貧困學生群體,向其飯卡悄悄發放補助的新聞溫暖全網。 與之類似,大數據分析還曾幫助學校找到失聯學生、通過精準畫像拉齊師資短板,教育大數據在學校管理運營中的作用逐漸凸顯,市場由青轉紅。
  • 大數據的奇妙應用:反洗錢?反恐怖融資?
    螞蟻金服大安全團隊反洗錢中心有一個反洗錢業務處理平臺,就是DT時代(數據時代)反洗錢的一項新嘗試。這個平臺首先基於大數據對海量交易進行智能排查,再對其中有疑點的case逐個分析、鑑別。從過去經驗看,效果還挺不錯呢。在剛剛結束、由復旦大學中國反洗錢研究中心主辦的2014第三屆中國反洗錢技術應用年會上,大家看著這個平臺那也是醉了。
  • 廣東工信廳王月琴:創新工業大數據應用,促進位造業數位化轉型
    近年來,廣東深入貫徹落實國家大數據發展戰略,大力發展5G網絡、工業網際網路、大數據、人工智慧等新一代信息技術,緊緊圍繞製造業數位化轉型這個核心,以工業大數據創新應用為抓手,推動新一代信息技術與製造業深度融合,加快推進經濟實現高質量發展。一是著力搭建工業大數據創新應用載體。
  • 值得買科技攜手中關村大數據產業聯盟,共同探索消費大數據應用前景
    1月11日,中關村大數據產業聯盟秘書長趙國棟一行蒞臨北京值得買科技股份有限公司參觀交流,並與值得買科技創始人兼CEO隋國棟、首席技術官劉峰等相關負責人召開座談會,就雙方在大數據尤其是消費大數據領域的合作前景進行了深入探討。會後,中關村大數據產業聯盟向隋國棟頒發了副理事長證書。
  • 【麗江新聞快訊】推進車聯網大數據場景應用,麗江數據籌備中心授牌...
    【麗江新聞快訊】推進車聯網大數據場景應用,麗江數據籌備中心授牌……等9條 2020-09-08 17:08 來源:澎湃新聞·澎湃號·媒體
  • 山東聚焦數據開放共享及應用保護 推動數據市場化配置
    1月8日,山東省發展和改革委員會副主任關兆泉在該省人民政府召開的新聞發布會上表示,山東將重點在數據共享、開放、應用和保護等方面積極探索,更好地推動數據市場化配置。
  • 智能雲科打造工業大數據融合應用生態,推動製造業整體轉型發展
    智能雲科信息科技有限公司申報的「面向機加工設備互聯互通的工業大數據融合應用試點示範」項目成功入選名單的「工業大數據融合應用」領域。  此次「2020年大數據產業發展試點示範項目公示名單」「工業大數據融合應用」 共90家,其中「重點行業方向」全國共計33家,智能雲科位列其中。不久前,智能雲科還入圍了工信部2019年工業網際網路試點示範項目。
  • 國家級應用數學中心——南數數據運籌科學研究院在無錫設立應用中心
    12月15日,以「大數據與人工智慧人才高質量發展」為主題的2020年大數據與人工智慧人才發展高峰論壇在無錫高新區舉行
  • 2020年中國大數據產業主體發展現狀分析 行業應用企業類型豐富...
    2015年左右,大數據相關政策規劃密集出臺,同期為大數據企業新增數量頂峰時期。近年來,我國大數據產業迎來新的發展機遇期,產業規模日趨成熟。大數據產業主體從「硬」設施向「軟」服務轉變的態勢將更加明顯,面向金融、政務、電信、醫療等領域的大數據服務將實現倍增創新。
  • 馭「數」行遠,應「雲」而生——信用企業大數據及雲服務應用分享...
    近日,由集美區工信局指導,華為、中軟國際及廈門信息集團大數據運營公司共同舉辦的「馭『數』行遠,應『雲』而生——信用企業大數據及雲服務應用」分享沙龍在廈門圓滿落幕。本次活動以提升企業優質運用大數據和雲服務的能力為主旨,共同探討當前經濟形勢下,廈門企業如何尋求數位化轉型道路以獲得更好的發展機遇。「大數據是信息技術發展的必然產物,更是信息化進程的新階段,其發展推動了數字經濟的形成與繁榮。此次交流活動增進園區企業之間的數位化思路。
  • 大數據集團赴福州調研政務大數據成果
    大數據集團赴福州調研政務大數據成果 來源: 大數據集團 發布時間:2019-03-08 字體:[ 大 中 小 ] 進入21世紀,以大數據、雲計算、網際網路為代表的新一輪信息技術革命席捲全球,大數據的應用滲透至政治、經濟、文化、教育、醫療、
  • ...加強「四川天府健康通」推廣應用,用大數據技術為疫情防控提供...
    四川在線記者 李淼1月17日,省委副書記、代省長黃強赴省大數據中心調研,強調要認真貫徹落實習近平總書記關於疫情防控工作的重要講話和重要指示精神,全面落實黨中央國務院和省委決策部署,堅持常態化精準防控和局部應急處置有機結合,居安思危,有備無患,充分運用大數據手段助力疫情防控,盡最大努力確保全川人民群眾過一個平安祥和的春節。
  • Sony Cinema系列全畫幅攝影機推出輕量機型FX6,通過Netflix認證
    #netflix#Sony Cinema系列全片幅專業攝影機推出出輕量機型FX6 ,通過Netflix專業製作認證Sony 宣布 Sony Cinema 系列全片幅專業相機推出出全新輕盈機型 FX6 ,強調結合 Sony 影像部門嶄新技術,採用用 Sony E 接環,搭載全新開發 10.2MP Exmor R CMOS 組件、與 A7S III 同級的 BIONZ
  • 聯想大數據戰略:依託聯盟構建大數據標準
    聯想匠牛聯合實驗室展示的工業智慧機器人比如為工業企業提供集成數據採集與分析、裝備健康管理、故障預測與診斷、維護決策與優化等各類工業大數據應用服務定製化解決方案的天澤智雲;面向工業智能製造的工業產品開發與創新平臺的開源智能硬體開發者社區聯想匠牛聯合實驗室;從事工業可穿戴設備研發應用及工業物聯網整體解決方案的逗號科技;研發開創性內存大數據,堪稱世界上速度最快的大數據公司的湖圖塔科技
  • 推進保險大數據應用 壹心科技攜手北航成立聯合實驗室
    來源:金融界網站今日(8月13日),北京壹心壹翼科技有限公司和北京航空航天大學大數據科學與腦機智能高精尖創新中心籤署戰略合作協議,雙方決定成立聯合實驗室,推動和引領保險行業大數據和人工智慧發展。壹心科技創始人戚洪標認為,通過成立聯合實驗室,雙方將建立在保險大數據、保險人工智慧系統等領域的專項合作項目,整合雙方的平臺優勢與資源渠道,努力為代理人和專業中介公司提供全方位平臺服務,進而通過賦能保險中介為保險行業高效發展提供動能。據介紹,保險公司大量高價值的數據是行業的天然優勢,但當前對大數據進行深入挖掘和利用的還不夠深透。