常用的大數據分析模型有哪些

2020-12-12 千家智客

  現如今會上如果不說兩句大數據、雲計算、區塊鏈、邊緣計算等名詞,就感覺被時代拋棄一樣。那今天我們主要為大家講解下什麼是大數據;在做大數據可視化時,有哪些常見得到數據分析模型。

 

  那麼什麼是大數據呢?

 

  大數據(Big Data)概念是1998年由SGI首席科學家John Masey在USENIX大會上提出的。他當時發表了一篇名為Big Data and the Next Wave of Infrastress的論文,使用了大數據來描述數據爆炸的現象。但大數據真正得到業界關注,則是其後多年的事情了。其中大數據最重要的發酵素則是2003-2006年Google發布的GFS、MapReduce和BigTable三篇論文。

 

  大數據是指海量數據或巨量數據,其規模巨大到無法通過目前主流的計算機系統在合理時間內獲取、存儲、管理、處理並提煉以幫助使用者決策。

 

  大數據有哪些特徵呢?

 

  大數據的5V特徵,即Variety(多樣化)、Volume(大量化)、Velocity(快速化)、Value(價值密度低)、Veracity(真實性)。其中,Variety表示來源多和格式多,數據可以來源於搜尋引擎、社交網絡、通話記錄、傳感器等等,這些數據要麼以結構化形式存儲,要麼以非結構化數據存儲;Volume表示數據量比較大,從TB級別,躍升到PB級別。尤其是在移動互聯時代,視頻、語言等非結構化數據快速增長;Velocity表示數據存在時效性,需要快速處理,並得到結果出來,這一點也是和傳統的數據挖掘技術有著本質的區別;Value表示大量不相關信息,不經過處理則價值較低,屬於價值密度低的數據。Veracity(真實性)數據質量因數據來源以及記錄方式等影響因素的不同,會出現較大的差異,而這種差異性會極大程度地影響數據分析的精確性

 

  大數據處理流程是怎麼樣的呢?

 

  一般的大數據處理流程都有以下幾個過程:數據採集、數據存儲、數據處理、數據展現。如下圖所示。

 

  簡而言之,大數據就是數據量非常大、數據種類繁多、無法用常規歸類方法應用計算的數據集成。

 

  有了這麼多的大數據,我們如何使用呢?

 

  通過不同渠道採集來的數據,經過對數據清洗後,那接下來就是應用大數據的時候了。根據我們的需求目標定義不同的數據模型,通過數據模型對數據進行篩選,獲得我們需要的數據。那麼在我們日常工作中有哪些常用的大數據模型呢?今天我們主要分析幾個常用的模型做簡單的介紹。供大家參考。

 

  1、行為事件分析

 

  行為事件分析法:顧名思義主要通過事件的行為來分析,獲得有效的數據。目前主要是用來來研究某行為事件的發生對企業組織價值的影響以及影響程度。那麼我們的企業可以藉此來追蹤或記錄的用戶行為或業務過程。比如用戶註冊、瀏覽產品詳情頁、購買、提現等,通過研究與事件發生關聯的所有因素來挖掘用戶行為事件背後的原因、交互影響等。

 

  在日常工作中,運營、市場、產品、數據分析師根據實際工作情況而關注不同的事件指標。如最近三個月來自哪個渠道的用戶註冊量最高?變化趨勢如何?各時段的人均充值金額是分別多少?上周來自北京發生過購買行為的獨立用戶數,按照年齡段的分布情況?每天的獨立Session數是多少?諸如此類的指標查看的過程中,行為事件分析起到重要作用。

 

  行為事件分析法具有強大的篩選、分組和聚合能力,邏輯清晰且使用簡單,已被廣泛應用。行為事件分析法一般經過事件定義與選擇、下鑽分析、解釋與結論等環節。尤其是電商公司通過前期的用戶行為數據的採集,在促銷活動中就可以有目的的區域性,定製性用戶廣告投放。通過精準的用戶行為數據分析,可獲得更高精準用戶的轉化率。

 

  2、漏鬥分析模型

 

  漏鬥分析是一套流程分析,它能夠科學反映用戶行為狀態以及從起點到終點各階段用戶轉化率情況的重要分析模型。其實企業經營中經常使用到,最簡單的應該是我們銷售部門的銷售項目漏鬥。銷售管理者通過項目漏鬥來分析接下來重點項目跟進和贏單概率。銷售漏鬥也是一種數據分析模型。

 

  漏鬥分析模型在電商平臺也是廣泛應用。主要在流量監控、產品目標轉化等日常數據管理工作中。例如在一款產品服務平臺中,直播用戶從激活APP開始到花費,一般的用戶購物路徑為激活APP、註冊帳號、進入直播間、互動行為、禮物花費五大階段,漏鬥能夠展現出各個階段的轉化率,通過漏鬥各環節相關數據的比較,能夠直觀地發現和說明問題所在,從而找到優化方向。對於業務流程相對規範、周期較長、環節較多的流程分析,能夠直觀地發現和說明問題所在。

 

  3、留存分析模型

 

  留存分析是一種用來分析用戶參與情況/活躍程度的分析模型,考察進行初始行為的用戶中,有多少人會進行後續行為。簡要的說就是您舉辦一場活動,邀請了1000人參會,在參會過程中陸續有人對這個活動不感興趣了,就中途退出了活動現場,還有部分用戶堅持下來了,那麼堅持下來的用戶一定是您的目標客戶嗎?那麼也未必對吧。我們就需要一個工具來識別留存下來的用戶哪些才是真正的用戶。這就是用來衡量產品對用戶價值高低的重要方法。留存分析可以幫助回答以下問題:

 

  一個新客戶在未來的一段時間內是否成為您期許目標用戶的行為?如發生購買行為,參與活動等;某個平臺改進了用戶在線體驗,邀請有興趣的用戶參與,看是否有成功轉化?

 

  4、分布分析模型

 

  分布分析是用戶在特定指標下的頻次、總額等的歸類展現。它可以展現出單用戶對產品的依賴程度,分析客戶在不同地區、不同時段所購買的不同類型的產品數量、購買頻次等,幫助運營人員了解當前的客戶狀態,以及客戶的運轉情況。如訂單金額(100以下區間、100元-200元區間、200元以上區間等)、購買次數(5次以下、5-10次、10以上)等用戶的分布情況。

 

  分布分析模型的功能與價值:科學的分布分析模型支持按時間、次數、事件指標進行用戶條件篩選及數據統計。為不同角色的人員統計用戶在一天/周/月中,有多少個自然時間段(小時/天)進行了某項操作、進行某項操作的次數、進行事件指標。

 

  5、點擊分析模型

 

  即應用一種特殊高亮的顏色形式,顯示頁面或頁面組(結構相同的頁面,如商品詳情頁、官網博客等)區域中不同元素點擊密度的圖示。包括元素被點擊的次數、佔比、發生點擊的用戶列表、按鈕的當前與歷史內容等因素。

 

  點擊圖是點擊分析方法的效果呈現。點擊分析具有分析過程高效、靈活、易用,效果直觀的特點。點擊分析採用可視化的設計思想與架構,簡潔直觀的操作方式,直觀呈現訪客熱衷的區域,幫助運營人員或管理者評估網頁的設計的科學性。

 

  6、用戶行為路徑分析模型

 

  用戶路徑分析,顧名思義,用戶在APP或網站中的訪問行為路徑。為了衡量網站優化的效果或營銷推廣的效果,以及了解用戶行為偏好,時常要對訪問路徑的轉換數據進行分析。

 

  以電商為例,買家從登錄網站/APP到支付成功要經過首頁瀏覽、搜索商品、加入購物車、提交訂單、支付訂單等過程。而在用戶真實的選購過程是一個交纏反覆的過程,例如提交訂單後,用戶可能會返回首頁繼續搜索商品,也可能去取消訂單,每一個路徑背後都有不同的動機。與其他分析模型配合進行深入分析後,能為找到快速用戶動機,從而引領用戶走向最優路徑或者期望中的路徑。

 

  7、用戶分群分析模型

 

  用戶分群即用戶信息標籤化,通過用戶的歷史行為路徑、行為特徵、偏好等屬性,將具有相同屬性的用戶劃分為一個群體,並進行後續分析。我們通過漏鬥分析可以看到,用戶在不同階段所表現出的行為是不同的,譬如新用戶的關注點在哪裡?已購用戶什麼情況下會再次付費?因為群體特徵不同,行為會有很大差別,因此可以根據歷史數據將用戶進行劃分,進而再次觀察該群體的具體行為。這就是用戶分群的原理。

 

  8、屬性分析模型

 

  顧名思義,根據用戶自身屬性對用戶進行分類與統計分析,比如查看用戶數量在註冊時間上的變化趨勢、查看用戶按省份的分布情況。用戶屬性會涉及到用戶信息,如姓名、年齡、家庭、婚姻狀況、性別、最高教育程度等自然信息;也有產品相關屬性,如用戶常駐省市、用戶等級、用戶首次訪問渠道來源等。

 

  屬性分析模型的價值是什麼?一座房子的面積無法全面衡量其價值大小,而房子的位置、風格、是否學區、交通環境更是相關的屬性。同樣,用戶各維度屬性都是進行全面衡量用戶畫像的不可或缺的內容。

 

  屬性分析主要價值在:豐富用戶畫像維度,讓用戶行為洞察粒度更細緻。科學的屬性分析方法,可以對於所有類型的屬性都可以將「去重數」作為分析指標,對於數值類型的屬性可以將「總和」「均值」「最大值」「最小值」作為分析指標;可以添加多個維度,沒有維度時無法展示圖形,數字類型的維度可以自定義區間,方便進行更加精細化的分析。

 

  常用的大數據分析模型有哪些?中琛魔方大數據(www.zcmorefun.com)表示模型只是前人總結的方式和方法,在實際工作中對解決問題起著指導性作用,但不可否認的是,具體的問題要具體分析,要根據不同的情況作出不同的改進,重要的還是更多的實踐!


相關焦點

  • 常用數據分析模型及波特五力模型
    導讀:數據分析是指用適當的統計分析方法對收集來的大量數據進行分析,將它們加以匯總和理解並消化,以求最大化地開發數據的功能,發揮數據的作用。數據分析是為了提取有用信息和形成結論而對數據加以詳細研究和概括總結的過程。
  • 大數據分析模型有哪幾種類型
    常見的大數據分析模型。選擇了數據結構,算法也隨之確定,是數據而不是算法是系統構造的關鍵因素。這種洞見導致了許多種軟體設計方法和程序設計語言的出現,面向對象的程序設計語言就是其中之一。
  • 五種常用大數據分析方法
    這些關係可能會導致對數據所代表的總體得出某些推論或結論。結論可能會導致數學模型預測當前不在數據集中的數據結果。但是,在導致決策或行動步驟之前,數據分析無效。這些關係可能會導致對數據所代表的總體得出某些推論或結論。結論可能會導致數學模型預測當前不在數據集中的數據結果。但是,在導致決策或行動步驟之前,數據分析無效。  在一番掙扎之後,中琛魔方給大家總結了網際網路運營的五大數據分析方法,希望幫助大家在數據分析中越來越遊刃有餘~加油!
  • 手遊產品最常用的5種玩家行為數據分析模型全解析
    幾百個數據採集點、數百億級數據量,手遊產品的數據分析是怎麼做的?數據分析的基礎模型涵蓋方差分析、因子分析、回歸分析、主成分分析、聚類分析、邏輯回歸、用戶細分等等,遊戲運營的數據分析通常依據AARRR海盜法則相對精簡,業內專注對留存、付費及活躍的幾個常用數據的分析。 這裡我們將介紹在遊戲數據分析領域常用的5種數據分析模型。
  • 真正能掙錢的分析模型有哪些?這三個你絕對要學會
    很多人在一開始接觸數據分析的時候,往往不知道哪些是內容是有用的,哪些內容是沒用的,經常是鬍子眉毛一把抓,胡亂分析一大堆數據,根本產生不了什麼價值,數據分析的工作也會被老闆質疑。其實在我們數據分析的工作中,很多時候都是要在資源有限的情況下,去最大化的撬動效益,這才是數據分析的價值。
  • 大數據分析軟體的類型有哪些
    導讀 在大數據和大數據分析,他們對企業的影響有一個興趣高漲。
  • 9種常用數據分析方法
    數據分析是從數據中提取有價值信息的過程,過程中需要對數據進行各種處理和歸類,只有掌握了正確的數據分類方法和數據處理模式,才能起到事半功倍的效果,以下是數據分析員必備的9種數據分析思維模式:回歸回歸是一種運用廣泛的統計分析方法,可以通過規定因變量和自變量來確定變量之間的因果關係,建立回歸模型,並根據實測數據來求解模型的各參數,然後評價回歸模型是否能夠很好的擬合實測數據,如果能夠很好的擬合,則可以根據自變量作進一步預測。3.
  • 數據分析基礎內容介紹 — 模型、工具、統計、挖掘與展現
    底下第一層稱為Data Sources 元數據層。,那這個數據倉庫就是多層模型中的第二層。第四層是Data Mining數據挖掘層,數據挖掘與數據分析(統計分析)有什麼區別呢,數據分析往往是統計量和算法比較清楚,數據挖掘往往是目標不是很清楚,在實現目標的過程中採用什麼方法不能確定,所以數據挖掘比數據分析難度要高很多。
  • 大數據分析一般用什麼工具分析?
    導讀 小編在前段時間分享了很多關於大數據的知識以及大數據的前景等等,今天小編帶大家了解一下,大數據到底是通過哪些工具分析的呢?
  • 數極客發布第10大用戶行為數據分析模型-間隔分析
    在我們分析用戶轉化行為時,除了利用數極客的 6 大轉化率分析和提升模型之外,我們還會關注用戶完成轉化所需的時長,數極客間隔分析模型通過任意兩個行為之間的時長間隔分析,可以掌握用戶完成轉化的效率,分析用戶體驗是否存在問題。二、間隔分析的應用場景?例如:用戶從首次訪問到註冊之間的時長,可以幫助我們掌握用戶註冊轉化所需的時長分布。
  • 審計大數據信息化面臨的挑戰有哪些_審計大數據分析工具
    需要可視化的展示審計成果 審計報表圖表展示一目了然 下面為大家介紹Smartbi的審計大數據分析案例,讓我們來看一下Smartbi是如何解決這些問題的吧!
  • 北京得盛項目數據分析事務所有限公司:企業大數據來源有哪些
    北京得盛項目數據分析事務所有限公司:企業大數據來源有哪些 來源:財訊網 • 2020-12-10 14:02:24 近年來
  • 大數據分析五步法流程順序
    流程如此重要,具體到數據分析的流程也是一樣的,數據分析可以分為五步,過程和家裡的賢內助做飯的過程相似,分為問題識別,數據可行性論證,數據準備,建立模型,評估結果。希望本文可以拋磚引玉,引發對大數據分析的適用性、可靠穩健的大數據分析標準、如何健康發展大數據產業等問題更深入的探討。
  • 三個常用統計模型的典型應用場景
    跟大家聊三個常用統計模型的應用場景。哪三個模型呢?決策樹、K-means聚類、因子分析。為啥是這三個模型呢?因為這三個模型分別代表了數據分析的三種思路:分類、聚類、降維。一個非常典型的場景是流失模型,對電信業來說,通過用戶的行為來提前找到哪些人有流失風險,並通過專門優惠等手段挽留,是運營中的重要部分。之前我在轉入網際網路行業時,第一選擇本來是遊戲公司(可惜願意收的給不起合理工資……),因此研究了一下遊戲用戶流失模型的內容,發現跟電信業有相通之處。
  • BIM建模軟體有哪些?關於常用BIM軟體的介紹!
    BIM軟體是實現BIM的一個工具,目前據不完全統計國際上稱得上BIM軟體的就有70多款,我國常用的也有二三十款之多,但常用的有哪些呢?今天我們就聊聊BIM建模軟體有哪些?關於常用BIM軟體的介紹!Tekla Structures最擅長於施工細節的建置,尤其是鋼結構之施工圖方面,發展得非常完善,在業界有大量應用實績。Tekla亦可進而導入控制系統,控制鋼筋彎曲機,控制預鑄混凝土之生產。結構分析所需的非幾何信息,如:荷載、荷載組合、支承條件,亦可包括在結構模型中。但目前一般BIM軟體均未提供結構分析功能。而採用搭配傳統分析設計程序進行分析設計。
  • 數據分析的理念、流程、方法、工具
    本文將對數據分析的關鍵知識模塊做介紹,可以為你解答以下問題:為什麼要做數據分析?數據如何驅動運營?數據分析的指標有哪些?數據分析的模型有哪些?怎麼評估用戶價值?數據分析報告怎麼寫?數據可視化工具 ...
  • 數據分析必讀乾貨:簡單而實用的3大分析方法
    來源:大數據DT 本文約3300字,建議閱讀8分鐘 數據分析師需要哪些「專業技能」? 在實際應用中,細分有許多不同的方法,就如同我們在解題時,有各種不同的「解題思路」一樣。有時候,面對同一個問題,兩個不同的解題思路都可以達到解題的目的;但更多時候,只有唯一正確的解題思路才可以正確地解題。所以,在分析之前,選擇正確的『細分』方法便非常重要。 下面,我們就具體來看一下,在細分分析中,有哪些解題思路。
  • 8個常用數據分析方法,輕鬆搞定各種業務分析
    在數據分析訓練營給大家講解數據分析案例的時候,發現一些新手小白在做數據分析時,拿到數據不知道怎麼分析、從什麼維度分析,腦海裡沒有清晰的分析思路。對於數據分析思路的培養是一個不斷練習積累的過程,剛入行的小白可以先套用一些常用的數據分析方法或模型,掌握基礎的分析思路。
  • 方法論:用AARRR模型做數據分析
    對一個剛入門的產品經理來說,為一個全新的產品或項目做數據分析,都會有手足無措的感覺。現在,筆者把自己在數據分析這塊工作上的所遇所思寫成文章分享給大家,按照文章的步驟,你也能做出一個基本的數據分析。一、明確數據分析的目的:做數據分析前,一定要先確定好目標,這樣後面的每一步才能不偏離大方向。
  • BIM模型的常見結構設計計算方法有哪些?
    在Revit中創建只包含構件尺寸等基本信息的結構專業初期模型,並利用程序間的模型數據轉換接口將Revit模型導人到結構分析計算軟體中(如: PKPM、YJK、Midas 等)進行結構整體分析和構件配筋計算等,接著將計算調整完成後的模型重新返回到Revit中,對模型附加更多的信息,然後在Navisworks軟體中將所有專業的模型合併,進行專業協調。