數據分析入門:14種常用的數據分析方法

2020-12-05 吊車尾學院木木老師

分析數據是將收集的數據通過加工、整理和分析、使其轉化為信息,通常用方法有:

排列圖

排列圖是一種找出影響產品質量主要因素的圖表方法。

其結構是由兩個縱坐標和一個橫坐標,若干個直方形和一條折線構成。左側縱坐標表示不合格品出現的頻數(出現次數或金額等),右側縱坐標表示不合格品出現的累計頻率(如百分比表示),橫坐標表示影響質量的各種因素,按影響大小順序排列。直方形高度表示相應的因素的影響程度(即出現頻率為多少),折線表示累計頻率(也稱帕累託曲線)。

舉個例子,例某酒杯製造廠對某日生產中出現的120個次品進行統計,做出排列圖,如下圖所示:

通常累計百分比將影響因素分為三類:佔0%~80%為A類因素,也就是主要因素;80%~90%為B類因素,是次要因素;90%~100%為C類因素,即一般因素。由於A類因素佔存在問題的80%,此類因素解決了,質量問題大部分就得到了解決。

魚骨圖

魚骨圖是一種發現問題「根本原因」的方法,用於質量管理。方法是通過頭腦風暴找出問題的可能原因,並將它們與特性值一起,按相互關聯性整理而成的層次分明、條理清楚,並標出重要因素。

魚骨圖主要分為三種類型:整理問題型魚骨圖(各要素與特性值間不存在原因關係,而是結構構成關係,對問題進行結構化整理),原因型魚骨圖(魚頭在右,特性值通常以「為什麼……」來寫);對策型魚骨圖(魚頭在左,特性值通常以「如何提高/改善……」來寫)

分層法

將性質相同的、在同一條件下收集的數據歸納在一起,以便進行比較分析。數據分層可根據實際情況按多種方式進行,例如,按不同時間、不同班次進行分層、按使用設備的種類進行分層、按原材料的進料時間、原材料成分進行分層、按檢查手段、使用條件進行分層、按不同缺陷項目進行分層等。

散布圖

散布圖是用非數學的方式來辨認某現象的測量值與可能原因因素之間的關係。用來繪製散布圖的數據必須是成對的(X,Y)。通常用垂直軸表示現象測量值Y,用水平軸表示可能有關係的原因因素X。推薦兩軸的交點採用兩個數據集(現象測量值集, 原因因素集)的平均值。收集現象測量值時要排除其他可能影響該現象的因素。

散布圖的相關關係可分為強正相關(如容量和附料重量)、強負相關(油的粘度與溫度)、弱正相關(身高和體重)、弱負相關(溫度與步伐)、不相關(氣壓與氣溫)和曲線相關。

關聯圖

關聯圖是用來分析事物之間「原因與結果」、「目的與手段」等複雜關係的一種圖表,它能夠幫助人們從事物之間的邏輯關係中,尋找出解決問題的辦法。關聯圖由圓圈(或方框)和箭頭組成,其中圓圈中是文字說明部分箭頭由原因指向結果,由手段指向目的。

矩陣圖

矩陣圖法就是從多維問題的事件中,找出成對的因素,排列成矩陣圖,然後根據矩陣圖來分析問題,確定關鍵點的方法,它是一種通過多因素綜合思考,探索問題的好方法。

常見的矩陣圖有:L型矩陣圖,用來表示兩組事件之間的關係,或關係的程度,也適用於各種結果與原因的關係;T形矩陣圖,用來表示A、B兩組事件及A、C兩組事件,兩兩之間的關係;Y形矩陣圖,是由A與B、B與C、A與C的三個L形矩陣圖所組合而成的矩陣圖;X形矩陣圖,是由A與B、B與C、C與D、D與A的四個L形矩陣圖所組合而成;C形矩陣圖,用來表示A、B、C三組事件的立體空間上的關係;P型矩陣圖。

KJ法

KJ法所用的工具是A型圖解。而A型圖解就是把收集到的某一特定主題的大量事實、意見或構思語言資料,根據它們相互間的關係分類綜合的一種方法。

PDPC法

PDPC法是在制定計劃階段或進行系統設計時,事先預測可能發生的障礙(不理想事態或結果),從而設計出一系列對策措施以最大的可能引向最終目標(達到理想結果)。該法可用於防止重大事故的發生,因此也稱之為重大事故預測圖法。

PDPC法可分為兩種,一種是順向思維法,定好理想的目標,然後按順序考慮實現目標的手段和方法。為了能夠穩步達到目標,需要設想很多條路線。;一種是逆向思維法,從理想狀態開始,考慮實現這個目標的前提是什麼,為了滿足這個前提又應該具備什麼條件。一步一步退回來,一直退到出發點。

吊車尾學院是一家致力於數位化人才培養的教育平臺。我們的授課老師均為國內知名網際網路公司的數據分析師、數據算法工程師,打得了全國競賽,拿得起冠軍獎盃,致力於打造小白也能聽懂並進階的數據分析人才。如果你拒絕不了數據分析的魅力,就不要猶豫地加入我們吧!

相關焦點

  • 數據分析的6種常用方法
    原標題:數據分析的6種常用方法 醫學工作者做完醫學實驗後,少不了要對收集的實驗數據進行數據分析。通常來說,常用的數據分析方法有以下六種:聚類分析、因子分析、相關分析、對應分析、回歸分析、方差分析。
  • 數據分析的幾種常用方法概覽
    數據分析常用方法概覽(之一) 對數據進行分析的方法很多,常用的有對比分析法、分組分析法、結構分析法、交叉分析法、漏鬥圖分析法、矩陣分析法、綜合評價分析法、5W1H分析法、相關分析法、回歸分析法、 聚類分析法、判別分析法、主成分分析法、因子分析法、時間序列、方差分析等等。
  • 9種常用數據分析方法
    數據分析是從數據中提取有價值信息的過程,過程中需要對數據進行各種處理和歸類,只有掌握了正確的數據分類方法和數據處理模式,才能起到事半功倍的效果,以下是數據分析員必備的9種數據分析思維模式:數據聚類是對於靜態數據分析的一門技術,在許多領域受到廣泛應用,包括機器學習,數據挖掘,模式識別,圖像分析以及生物信息。4. 相似匹配相似匹配是通過一定的方法,來計算兩個數據的相似程度,相似程度通常會用一個是百分比來衡量。
  • 新手如何快速入門數據分析?
    如果你需要前輩的指導,那麼你可以按照CDA數據分析研究院的老師推薦的學習方法來學習數據分析:首先,數據分析師需要三個方面的能力:技術(編程),數據分析方法,行業知識。不過 Excel 這種常用的辦公軟體,比如說做個圖,算算總合、平均之類的,熟練使用vlookup等幾個常用函數,稍微複雜點的數據透視表 (pivot) 就夠了。 3)如果SQL 上手比較快,時間充裕,那就練練 power BI, 主要目的是看看都有什麼樣的圖表,感受一下各自適用什麼樣的場景。具體怎麼做圖不是非常重要,真要用的時候搜索一下現學就好了。
  • 五種常用大數據分析方法
    在數據分析中,常用到的分3類:時間對比、空間對比以及標準對比。  時間對比:  最常用的就是同比和環比,通過時間周期的數據對比,了解目前數據水平的高低  同比:某個周期的時段與上一個周期的相同時段比較,如今年的6月比去年的6月,本周的周一比上周的周一等等。
  • SEM優化常用的幾種數據分析方法
    SEM優化工作少不了做分析報表,而數據分析不僅僅是為了發現問題,為解決問題提供參考數據,也是對推廣效果的直觀展現方式,善用工具,能事半功倍地掌握工作,並及時作出調整。簡而言之,數據分析就是為了幫助我們對工作做到心中有數。
  • 數據分析的幾種常用方法概覽(之二)
    數據分析常用方法概覽(之二)上一篇,我們了解了數據分析時常用的對比分析法、分組分析法、結構分析法、交叉分析法、漏鬥圖分析法、矩陣分析法、綜合評價分析法等八種分析方法,今天我們繼續了解下上文提到的另外八種常見數據分析方法。
  • SEM常用的4種數據分析方法,你用過幾種?
    有經驗的 SEMer 都知道,盡信數據則不如無數據。數據就躺在哪裡,關鍵在分析之前,你之前要 有清晰的思維邏輯:你為什麼要分析數據?你希望通過數據分析得到什麼?我一般的分析數據邏輯如下:確定分析的目的—>收集數據—>整理數據—>分析數據—>得到一些分析的思路今天主要分享下數據分析的常用方法,
  • 常用的四種大數據分析方法
    本文主要講述數據挖掘分析領域中,最常用的四種數據分析方法:描述型分析、診斷型分析、預測型分析和指令型分析。簡單地來說,分析可被劃分為4種關鍵方法。下面會詳細介紹這四種方法。1. 描述型分析:發生了什麼?
  • 常用數據分析方法:方差分析及實現!
    方差分析是一種常用的數據分析方法,其目的是通過數據分析找出對該事物有顯著影響的因素、各因素之間的交互作用及顯著影響因素的最佳水平等。本文介紹了方差分析的基礎概念,詳細講解了單因素方差分析、雙因素方差分析的原理,並且給出了它們的python實踐代碼。
  • 常用的數據分析方法及案例講解
    常用的數據分析方法有描述統計、信度分析、相關分析、回歸分析、聚類分析等。本文將結合實際案例,為大家一一講解這些數據分析的方法。如果你想了解如何做數據分析,就接著看下去吧~描述性統計分析是通過圖表或數學方法,對數據資料進行整理、分析,並對數據的分布狀態、數字特徵和隨機變量之間關係進行估計和描述的方法。這也是我們在日常生活最常用的一種數據分析方法,因此這裡就不再用案例展開講解了。2、信度分析信度即可靠性,它是指採用同樣的方法對同一對象重複測量時所得結果的一致性程度。企業在招聘員工時會有一套性格測試題,這裡面就用到了信度分析。
  • 運營er常用的數據分析方法有哪些?
    這不最近領導找小編談話了,說小編在工作是無用功,應該用科學的數據分析的方法去運營。我.......為了避免重蹈的覆轍,小編決定奮發圖強,去看看到底什麼是數據分析,有哪些好用的數據方法。下面就是小編整理了幾種搜集到的運營er常用的數據分析方法,大家可以先了解一下。01細分分析細分分析是分析的基礎,單一維度下的指標數據的信息價值很低。
  • 16種常用的數據分析方法-回歸分析
    2 回歸分析 研究自變量與因變量之間關係形式的分析方法,它主要是通過建立因變量y 與影響他的自變量Xi 之間的回歸模型,來預測因變量y 的發展趨勢。
  • 論文常用數據分析方法分類總結-3
    論文常用數據分析方法分類總結-211.灰色關聯:灰色關聯是一種評價多個指標綜合排名的方法,用於判斷指標排名。14.數據分布數據分布-SPSSAU判斷數據分布是選擇正確分析方法的重要前提。正態性:很多分析方法的使用前提都是要求數據服從正態性,比如線性回歸分析、相關分析、方差分析等,可通過正態圖、P-P/Q-Q圖、正態性檢驗查看數據正態性。隨機性:遊程檢驗是一種非參數性統計假設的檢驗方法,可用於分析數據是否為隨機。
  • 數據分析的方法(一)
    至今,數據分析師的行業依然很火熱,但是大部分人還是不清楚數據分析的目的是什麼,分析的步驟、方法都有哪一些。數據分析主要就是為了從海量的數據中提取有用的信息和形成結論,從而對數據加以詳細的研究和概括總結。
  • 論文常用數據分析方法分類總結-4
    論文常用數據分析方法分類總結-2論文常用數據分析方法分類總結-316.平均值和求和也是信息濃縮的常用方法,比如要將多個題項合併成一個變量,可通過求平均值概括成一個題項。當數據不滿足正態,存在極端值時,可用中位數代替平均值。18.
  • SEM常用的這4種數據分析方法,掌握效率翻倍!
    數據就躺在哪裡,關鍵在分析之前,你之前要 有清晰的思維邏輯:你為什麼要分析數據?你希望通過數據分析得到什麼?我一般的分析數據邏輯如下:確定分析的目的—>收集數據—>整理數據—>分析數據—>得到一些分析的思路本篇主要分享下數據分析的常用方法,
  • 數據分析實用的4種分析方法
    在日常工作中數據分析主要是為了支持業務,而業務很大程度上是圍繞用戶進行的,因而可以從用戶場景出發來具體選擇數據工具。用戶場景主要分成三大類: 第一類是洞察,要去觀察和找到我們用戶當中的一些特點規律。
  • 數據分析入門學習指南,零基礎小白都能輕鬆看懂
    數據分析在如今的求職場上越來越重要。然而,讓很多朋友困惑的是,我是沒有編程基礎的小白,能學會數據分析麼?該如何學習數據分析呢?其實,如果你打算成為一名數據分析師,如何出身並不重要,數據科學是一門應用學科,你需要系統提升數據獲取、數據分析、數據可視化、機器學習的水平。下面我就簡單提供一個數據分析入門的路徑。
  • 數據分析?從一開始你就錯了!探索性數據分析套路解讀
    在進行一些小型數據分析時,base R和readr library 足夠應付。但在處理的數據量越來越大時,最高效也最常用的是fread()。在讀入數據時,fread()會自動檢測各類數據,如sep,colClass和nrows等等。並且現在大量的數據都是機器產生的結構化數據,fread()能充分應付這類大型數據,為之後的數據分析開好頭。