數據挖掘與預測分析術語總結

2021-01-08 人人都是產品經理

數據挖掘目前在各類企業和機構中蓬勃發展。因此我們製作了一份此領域常見術語總結,希望你喜歡。

分析型客戶關係管理(Analytical CRM/aCRM)

用於支持決策,改善公司跟顧客的互動或提高互動的價值。針對有關顧客的知識,和如何與顧客有效接觸的知識,進行收集、分析、應用。

大數據(Big Data)

大數據既是一個被濫用的流行語,也是一個當今社會的真實趨勢。此術語指代總量與日俱增的數據,這些數據每天都在被捕獲、處理、匯集、儲存、分析。維基百科是這樣描述「大數據」的:「數據集的總和如此龐大複雜,以至於現有的資料庫管理工具難以處理(…)」。

商業智能(Business Intelligence)

分析數據、展示信息以幫助企業的執行者、管理層、其他人員進行更有根據的商業決策的應用、設施、工具、過程。

流失分析(Churn Analysis/Attrition Analysis)

描述哪些顧客可能停止使用公司的產品/業務,以及識別哪些顧客的流失會帶來最大損失。流失分析的結果用於為可能要流失的顧客準備新的優惠。

聯合分析/權衡分析(Conjoint Analysis/ Trade-off Analysis)

在消費者實際使用的基礎上,比較同一產品/服務的幾個不同變種。它能預測產品/服務上市後的接受度,用於產品線管理、定價等活動。

信用評分(Credit Scoring)

評估一個實體(公司或個人)的信用值。銀行(借款人)以此判斷借款者是否會還款。

配套銷售/增值銷售(Cross / Up selling)

一個營銷概念。根據特定消費者的特徵和過往行為,向其銷售補充商品(配套銷售)或附加商品(增值銷售)。

顧客細分&畫像(Customer Segmentation & Profiling)

根據現有的顧客數據,將特徵、行為相似的顧客歸類分組。描述和比較各組。

數據集市(Data Mart)

特定機構所儲存的,關於一個特定主題或部門的數據,如銷售、財務、營銷數據。

數據倉庫(Data Warehouse)

數據的中央存儲庫,採集、儲存來自一個企業多個商業系統的數據。

數據質量(Data Quality)

有關確保數據可靠性和實用價值的過程和技術。高質量的數據應該忠實體現其背後的事務進程,並能滿足在運營、決策、規劃中的預期用途。

抽取-轉換-加載 ETL (Extract-Transform-Load)

數據倉儲中的一個過程。從一個來源獲取數據,根據需求轉換數據以便接下來使用,之後把數據放置在正確的目標資料庫。

欺詐檢測(Fraud Detection)

識別針對特定組織或公司的疑似欺詐式轉帳、訂購、以及其他非法活動。在IT系統預先設計觸髮式警報,嘗試或進行此類活動會出現警告。

Hadoop

另一個當今大數據領域的熱門。Apache Hadoop是一個在已有商業硬體組成的計算機集群上,分布式存儲、處理龐大數據集的開源軟體架構。它使得大規模數據儲存和更快速數據處理成為可能。

物聯網(Internet of Things, IoT)

廣泛分布的網絡,由諸多種類(個人、家庭、工業)諸多用途(醫療、休閒、媒體、購物、製造、環境調節)的電子設備組成。這些設備通過網際網路交換數據,彼此協調活動。

顧客的生命周期價值 (Lifetime Value, LTV)

顧客在他/她的一生中為一個公司產生的預期折算利潤。

機器學習(Machine Learning)

一個學科,研究從數據中自動學習,以便計算機能根據它們收到的反饋調整自身運行。與人工智慧、數據挖掘、統計方法關係密切。

購物籃分析(Market Basket Analysis)

識別在交易中經常同時出現的商品組合或服務組合,例如經常被一起購買的產品。此類分析的結果被用於推薦附加商品,為陳列商品的決策提供依據等。

聯機分析處理(On-Line Analytical Processing, OLAP)

能讓用戶輕鬆製作、瀏覽報告的工具,這些報告總結相關數據,並從多角度分析。

預測分析(Predictive Analytics)

從現存的數據集中提取信息以便識別模式、預測未來收益和趨勢。在商業領域,預測模型及分析被用於分析當前數據和歷史事實,以更好了解消費者、產品、合作夥伴,並為公司識別機遇和風險。

實時決策(Real Time Decisioning, RTD)

幫助企業做出實時(近乎無延遲)的最優銷售/營銷決策。比如,實時決策系統(打分系統)可以通過多種商業規則或模型,在顧客與公司互動的瞬間,對顧客進行評分和排名。

留存/顧客留存(Retention / Customer Retention)

指建立後能夠長期維持的客戶關係的百分比。

社交網絡分析(Social Network Analysis, SNA)

描繪並測量人與人、組與組、機構與機構、電腦與電腦、URL與URL、以及其他種類相連的信息/知識實體之間的關係與流動。這些人或組是網絡中的節點,而它們之間的連線表示關係或流動。SNA為分析人際關係提供了一種方法,既是數學的又是視覺的。

生存分析(Survival Analysis)

估測一名顧客繼續使用某業務的時間,或在後續時段流失的可能性。此類信息能讓企業判斷所要預測時段的顧客留存,並引入合適的忠誠度政策。

文本挖掘(Text Mining)

對包含自然語言的數據的分析。對源數據中詞語和短語進行統計計算,以便用數學術語表達文本結構,之後用傳統數據挖掘技術分析文本結構。

非結構化數據(Unstructured Data)

數據要麼缺乏事先定義的數據模型,要麼沒按事先定義的規範進行組織。這個術語通常指那些不能放在傳統的列式資料庫中的信息,比如電子郵件信息、評論。

網絡挖掘/網絡數據挖掘(Web Mining / Web Data Mining)

使用數據挖掘技術從網際網路站點、文檔或服務中自動發現和提取信息。

 

本文轉載自@36大數據 作者@Algolytics  翻譯@王鵬宇

原文連結:http://datartisan.com/article/detail/54.html

版權聲明:若該文章涉及版權問題,請聯繫我們主編,QQ:419297645

收藏已收藏 | {{ postmeta.bookmark }} 點讚已贊 | {{ postmeta.postlike }}

相關焦點

  • 分析數據預測未來?數據挖掘絕不是大公司的專利
    隨著數據體積的爆發性增長,人們從數據獲取的信息也隨之增多。然而從海量數據中提取信息去預測未來,卻是件很瘋狂的工作。信息收集、存儲、管理和分析不再受技術的制約,大數據,極富挑戰地吸引著越來越多的科學家、分析師,甚至是一般企業管理者或者創新企業和個人。
  • 數據分析和數據挖掘的區別——Smartbi
    但是某些數據對各自的企業是否有用,是否重要,這就需要判斷,這也就逐漸形成數據分析這個行業,但是初入數據行業的小白估計還不清楚數據分析和數據挖掘,Smartbi知道會有很多人混淆這兩者,所以現在就來為各位講講這兩者的區別。
  • Decide:利用數據挖掘和分析的魅力價格預測體系
    我想如果有一個網站能夠預測消費品的價格並且對這些預測提供包賠,那麼這一定會對電子商務產生革命性的影響。一家名叫Decide.com的創業公司則在這個方面進行了初步的探索,通過數據挖掘和分析的魅力,他們初步建立起了價格預測體系,並且還在今天推出了包賠計劃。我們首先來看看其是如何預測價格的。Decide.com的目的是解決兩個問題:電子產品更新速度過快,市場價格變化過快。通過解決這兩個問題,他們希望給潛在購物者提供最好的購物時機建議。
  • 數據挖掘入門:校園數據的分析與挖掘
    方案簡介:在學生數據量劇增以及教育目標日趨複雜的情況下,僅用人工來分析學生數據是不現實的,藉助SPSS統計分析和數據挖掘工具對大量學生數據進行深層次分析,可以挖掘出學生各項數據中隱藏的重要信息。以上是一個招生管理系統中的一個星狀數據模式的示例圖,這些數據是進行統計分析和數據挖掘的基礎。
  • Excel作為一種強大的數據挖掘工具,數據分析是做什麼的
    起初,數據挖掘緊跟「One to One」或「CRM(Customer RelationshipManagement)」的潮流,主要用於分析顧客行為、開發新客戶、預測新產品和庫存管理等,尤其被期待能夠應用於市場營銷領域。
  • 25個大數據術語
    2.分析。年末你可能會收到一份來自信用卡公司寄來的包含了全年所有交易記錄的年終報表。3.描述性分析。剛剛如果你告訴我,去年你的信用卡消費在食物上花費了25%、在服裝上花費了35%、娛樂活動上花費了20%、剩下的就是雜七雜八的事項,這種便是描述性分析。當然你還可以參考更多的細節。4.預測分析。如果你根據過去5年的信用卡歷史記錄來進行分析,並且劃分具有一定的連續性,則你可以高概率預測明年將與過去幾年相差無幾。
  • 大數據採集之大數據挖掘流程及方法總結
    結果分析:對數據挖掘的結果進行解釋和評價,轉換成為能夠最終被用戶理解的知識。 三、數據挖掘分類 直接數據挖掘:目標是利用可用的數據建立一個模型,這個模型對剩餘的數據,對一個特定的變量(可以理解成資料庫中表的屬性,即列)進行描述。
  • 小叮噹數據挖掘(一):初識數據挖掘
    認識數據挖掘,小叮噹打算從認識數據、數據預處理、挖掘頻繁模式、關聯和相關、分類和預測的聚類分析、離群點檢測這幾部分為大家全面介紹。今天我們先來初識數據挖掘。1.為什麼要進行數據挖掘?>風險分析與管理預測, 顧客關係, 改進保險, 質量控制, 競爭能力分析等。
  • Smartbi解鎖「預測未來」秘笈,開啟「數據挖掘」新時代!
    小麥同時為大家準備了視頻講解:  什麼是數據挖掘  數據挖掘就是從大量的數據中去發現有用的信息,然後根據這些信息來輔助決策。聽起來是不是跟傳統的數據分析很像呢?實際上,數據挖掘就是智能化的數據分析,它們的目標都是一樣的。但是,又有很大的區別。
  • 統計數據挖掘在知客CRM中的應用分析
    通過數據挖掘實現顧客獲取就是利用客戶檔案找出客戶的一些共同特徵,通過聚類分析對客戶分群,再通過模式分析預測潛在客戶。通過預測潛在客戶對開發活動的反映,從中識別出反映積極的客戶,幫助市場人員對潛在客戶進行篩選,然後有針對性的進行營銷活動。  2.客戶細分。客戶細分是根據企業需求,將客戶劃分為多個小的同質群體的過程。
  • 「大數據分析」深入淺出:如何從零開始學習大數據分析與挖掘
    最近有很多人想學習大數據,但不知道怎麼入手,從哪裡開始學習,需要學習哪些東西?對於一個初學者,學習大數據分析與挖掘的思路邏輯是什麼?本文就梳理了如何從0開始學習大數據挖掘分析,學習的步驟思路,可以給大家一個學習的建議。
  • 大數據之數據挖掘
    數據挖掘一般是指從大量的數據中自動搜索隱藏於其中的有著特殊關係性(屬於Association rule learning)的信息的過程。主要有數據準備、規律尋找和規律表示3個步驟。數據挖掘的任務有關聯分析、聚類分析、分類分析、異常分析、特異群組分析和演變分析等。
  • 【乾貨】數據分析、數據挖掘、數據科學、機器學習領域96個在線...
    連結:https://www.datasciencetech.institute/msc-applied-data-science-and-big-data/DePaul 預測分析MS:解決了數據科學家日益增長的需求,他們將技術和分析技能融合在一起,以應對大數據分析的挑戰。
  • 深入淺出:如何從0開始學習大數據挖掘分析?
    最近有很多人諮詢,想學習大數據,但不知道怎麼入手,從哪裡開始學習,需要學習哪些東西?對於一個初學者,學習大數據挖掘分析的思路邏輯是什麼?本文就梳理了如何從0開始學習大數據挖掘分析,學習的步驟思路,可以給大家一個學習的建議。
  • 一文理清:大數據、數據挖掘、數據分析、數理統計之間的關係
    有的時候兩者的一些方法還會出現混淆的情況,例如,主成分分析和回歸分析。從嚴格意義上講,這兩種分析方法都屬於數理統計分析方法,但在數據挖掘實戰應用中也常常會用到這種方式,從這個角度講,主成分分析和回歸分析也是數據挖掘商業實戰中常用的一種分析技術和數據處理技術。
  • 「數據分析」之零基礎入門數據挖掘
    ,本文將學習應該從哪些角度分析數據?如何對數據進行整體把握,如何處理異常值與缺失值,從哪些維度進行特徵及預測值分析?探索性數據分析(Exploratory Data Analysis,EDA)是指對已有數據在儘量少的先驗假設下通過作圖、制表、方程擬合、計算特徵量等手段探索數據的結構和規律的一種數據分析方法。
  • 解讀數據挖掘與數據科學之間鮮為人知的區別
    因此需要了解數據挖掘與數據科學之間的重要區別。什麼是數據科學?數據科學是一門專注於數據分析並在此基礎上取得最佳解決方案的科學。在以往,這些問題是由數學和統計學專家來處理的。隨著人工智慧的進步得到了更廣泛的應用,這使得將優化和信息學納入分析方法成為可能。
  • 數據挖掘用什麼軟體_商業數據挖掘案例
    所謂的數據挖掘其實就是在大量的的非結構化數據裡搜索可用的數據,並提取隱含在其中、人們事先不知道的、但又有潛在應用價值的過程。Smartbi數據挖掘工具揭示的是未知的、將來的數據關係。數據挖掘的知識領域涵蓋了資料庫技術、統計學知識、機器學習、可視化等多學科知識的綜合應用。Smartbi Mining平臺是一個注重於實際生產應用的數據分析預測平臺,它旨在為個人、團隊和企業所做的決策提供預測。該平臺不僅可為用戶提供直觀的流式建模、拖拽式操作和流程化、可視化的建模界面,還提供了大量的數據預處理操作。
  • 遊戲運營案例來深入淺出數據分析&挖掘
    這裡分享三個案例來說明:案例1:開寶箱活動分析案例2:兩次召回活動優化對比案例3:利用數據挖掘預測DAU收益數據分析&挖掘數據分析並非信手拈來的,數據分析是有其一定的框架可遵循的。數據挖掘數據除了數據分析的價值,另一層價值就是數據挖掘的價值。數據分析是依賴於人的經驗及人對業務的理解,依賴人的邏輯思維能力去找到整個業務相關的信息,去找到理性且可以指導我們產品優化的點。數據挖掘就是從另外一個維度去發掘數據的價值。
  • 關於大數據,你應該知道的75個專業術語
    本文分為上篇(25 個術語)和下篇(50 個術語)。機器之心對文章進行了編譯。上篇(25 個術語)如果你剛接觸大數據,你可能會覺得這個領域很難以理解,無從下手。不過,你可以從下面這份包含了 25 個大數據術語的清單入手,那麼我們開始吧。 算法(Algorithm):算法可以理解成一種數學公式或用於進行數據分析的統計學過程。