數據分析入門:14種常用的數據分析方法

2021-01-11 吊車尾學院木木老師

分析數據是將收集的數據通過加工、整理和分析、使其轉化為信息,通常用方法有:

排列圖

排列圖是一種找出影響產品質量主要因素的圖表方法。

其結構是由兩個縱坐標和一個橫坐標,若干個直方形和一條折線構成。左側縱坐標表示不合格品出現的頻數(出現次數或金額等),右側縱坐標表示不合格品出現的累計頻率(如百分比表示),橫坐標表示影響質量的各種因素,按影響大小順序排列。直方形高度表示相應的因素的影響程度(即出現頻率為多少),折線表示累計頻率(也稱帕累託曲線)。

舉個例子,例某酒杯製造廠對某日生產中出現的120個次品進行統計,做出排列圖,如下圖所示:

通常累計百分比將影響因素分為三類:佔0%~80%為A類因素,也就是主要因素;80%~90%為B類因素,是次要因素;90%~100%為C類因素,即一般因素。由於A類因素佔存在問題的80%,此類因素解決了,質量問題大部分就得到了解決。

魚骨圖

魚骨圖是一種發現問題「根本原因」的方法,用於質量管理。方法是通過頭腦風暴找出問題的可能原因,並將它們與特性值一起,按相互關聯性整理而成的層次分明、條理清楚,並標出重要因素。

魚骨圖主要分為三種類型:整理問題型魚骨圖(各要素與特性值間不存在原因關係,而是結構構成關係,對問題進行結構化整理),原因型魚骨圖(魚頭在右,特性值通常以「為什麼……」來寫);對策型魚骨圖(魚頭在左,特性值通常以「如何提高/改善……」來寫)

分層法

將性質相同的、在同一條件下收集的數據歸納在一起,以便進行比較分析。數據分層可根據實際情況按多種方式進行,例如,按不同時間、不同班次進行分層、按使用設備的種類進行分層、按原材料的進料時間、原材料成分進行分層、按檢查手段、使用條件進行分層、按不同缺陷項目進行分層等。

散布圖

散布圖是用非數學的方式來辨認某現象的測量值與可能原因因素之間的關係。用來繪製散布圖的數據必須是成對的(X,Y)。通常用垂直軸表示現象測量值Y,用水平軸表示可能有關係的原因因素X。推薦兩軸的交點採用兩個數據集(現象測量值集, 原因因素集)的平均值。收集現象測量值時要排除其他可能影響該現象的因素。

散布圖的相關關係可分為強正相關(如容量和附料重量)、強負相關(油的粘度與溫度)、弱正相關(身高和體重)、弱負相關(溫度與步伐)、不相關(氣壓與氣溫)和曲線相關。

關聯圖

關聯圖是用來分析事物之間「原因與結果」、「目的與手段」等複雜關係的一種圖表,它能夠幫助人們從事物之間的邏輯關係中,尋找出解決問題的辦法。關聯圖由圓圈(或方框)和箭頭組成,其中圓圈中是文字說明部分箭頭由原因指向結果,由手段指向目的。

矩陣圖

矩陣圖法就是從多維問題的事件中,找出成對的因素,排列成矩陣圖,然後根據矩陣圖來分析問題,確定關鍵點的方法,它是一種通過多因素綜合思考,探索問題的好方法。

常見的矩陣圖有:L型矩陣圖,用來表示兩組事件之間的關係,或關係的程度,也適用於各種結果與原因的關係;T形矩陣圖,用來表示A、B兩組事件及A、C兩組事件,兩兩之間的關係;Y形矩陣圖,是由A與B、B與C、A與C的三個L形矩陣圖所組合而成的矩陣圖;X形矩陣圖,是由A與B、B與C、C與D、D與A的四個L形矩陣圖所組合而成;C形矩陣圖,用來表示A、B、C三組事件的立體空間上的關係;P型矩陣圖。

KJ法

KJ法所用的工具是A型圖解。而A型圖解就是把收集到的某一特定主題的大量事實、意見或構思語言資料,根據它們相互間的關係分類綜合的一種方法。

PDPC法

PDPC法是在制定計劃階段或進行系統設計時,事先預測可能發生的障礙(不理想事態或結果),從而設計出一系列對策措施以最大的可能引向最終目標(達到理想結果)。該法可用於防止重大事故的發生,因此也稱之為重大事故預測圖法。

PDPC法可分為兩種,一種是順向思維法,定好理想的目標,然後按順序考慮實現目標的手段和方法。為了能夠穩步達到目標,需要設想很多條路線。;一種是逆向思維法,從理想狀態開始,考慮實現這個目標的前提是什麼,為了滿足這個前提又應該具備什麼條件。一步一步退回來,一直退到出發點。

吊車尾學院是一家致力於數位化人才培養的教育平臺。我們的授課老師均為國內知名網際網路公司的數據分析師、數據算法工程師,打得了全國競賽,拿得起冠軍獎盃,致力於打造小白也能聽懂並進階的數據分析人才。如果你拒絕不了數據分析的魅力,就不要猶豫地加入我們吧!

相關焦點

  • 數據分析的幾種常用方法概覽
    數據分析常用方法概覽(之一)對數據進行分析的方法很多,常用的有對比分析法、分組分析法、結構分析法、交叉分析法、漏鬥圖分析法、矩陣分析法、綜合評價分析法、5W1H分析法、相關分析法、回歸分析法、 聚類分析法、判別分析法、主成分分析法、因子分析法
  • 9種常用數據分析方法
    數據分析是從數據中提取有價值信息的過程,過程中需要對數據進行各種處理和歸類,只有掌握了正確的數據分類方法和數據處理模式,才能起到事半功倍的效果,以下是數據分析員必備的9種數據分析思維模式:1.分類分類是一種基本的數據分析方式,數據根據其特點,可將數據對象劃分為不同的部分和類型,再進一步分析,能夠進一步挖掘事物的本質。2.
  • 五種常用大數據分析方法
    在數據分析中,常用到的分3類:時間對比、空間對比以及標準對比。  時間對比:  最常用的就是同比和環比,通過時間周期的數據對比,了解目前數據水平的高低  同比:某個周期的時段與上一個周期的相同時段比較,如今年的6月比去年的6月,本周的周一比上周的周一等等。
  • SEM優化常用的幾種數據分析方法
    SEM優化工作少不了做分析報表,而數據分析不僅僅是為了發現問題,為解決問題提供參考數據,也是對推廣效果的直觀展現方式,善用工具,能事半功倍地掌握工作,並及時作出調整。簡而言之,數據分析就是為了幫助我們對工作做到心中有數。
  • 產品數據分析常用的4種方法
    導讀 同樣的數據不同的數據分析師解讀出來的結論可能是不一樣的,甚至是完全相反的,但結論本身沒有對錯,所以從客觀的數據到主觀的人,需要有一些科學的分析方法作為橋梁,幫助數據的信息更好
  • 數據分析的幾種常用方法概覽(之二)
    數據分析常用方法概覽(之二)上一篇,我們了解了數據分析時常用的對比分析法、分組分析法、結構分析法、交叉分析法、漏鬥圖分析法、矩陣分析法、綜合評價分析法等八種分析方法,今天我們繼續了解下上文提到的另外八種常見數據分析方法。
  • 新手如何快速入門數據分析?
    如果你需要前輩的指導,那麼你可以按照CDA數據分析研究院的老師推薦的學習方法來學習數據分析:首先,數據分析師需要三個方面的能力:技術(編程),數據分析方法,行業知識。不過 Excel 這種常用的辦公軟體,比如說做個圖,算算總合、平均之類的,熟練使用vlookup等幾個常用函數,稍微複雜點的數據透視表 (pivot) 就夠了。 3)如果SQL 上手比較快,時間充裕,那就練練 power BI, 主要目的是看看都有什麼樣的圖表,感受一下各自適用什麼樣的場景。具體怎麼做圖不是非常重要,真要用的時候搜索一下現學就好了。
  • 最常用的四種大數據分析方法
    本數據挖掘分析領域中,最常用的四種數據分析方法:描述型分析、診斷型分析、預測型分析和指令型分析。 使用一些工具來幫助大家更好的理解數據分析在挖掘數據價值方面的重要性,是十分有必要的。其中的一個工具,叫做四維分析法。 簡單地來說,分析可被劃分為4種關鍵方法。 下面會詳細介紹這四種方法。 1. 描述型分析:發生了什麼?
  • 常用的數據分析方法及案例講解
    常用的數據分析方法有描述統計、信度分析、相關分析、回歸分析、聚類分析等。本文將結合實際案例,為大家一一講解這些數據分析的方法。如果你想了解如何做數據分析,就接著看下去吧~描述性統計分析是通過圖表或數學方法,對數據資料進行整理、分析,並對數據的分布狀態、數字特徵和隨機變量之間關係進行估計和描述的方法。這也是我們在日常生活最常用的一種數據分析方法,因此這裡就不再用案例展開講解了。2、信度分析信度即可靠性,它是指採用同樣的方法對同一對象重複測量時所得結果的一致性程度。企業在招聘員工時會有一套性格測試題,這裡面就用到了信度分析。
  • 要掌握5種常用的數據分析方法,做分析就不再有想法了
    而且由於演繹的版本不同,導致分析方法種類繁多,令人眼花繚亂,甚至深不可測 沒有必要把分析方法看得太大,所有的分析方法歸納為兩種:分類與對比,分類與對比,分類與對比,重要的事情說三遍,大多數分析方法都是兩者的結合,為什麼說數據分析是分類與對比?
  • 16種常用的數據分析方法-回歸分析
    2 回歸分析 研究自變量與因變量之間關係形式的分析方法,它主要是通過建立因變量y 與影響他的自變量Xi 之間的回歸模型,來預測因變量y 的發展趨勢。
  • BI大數據分析入門掌握
    商業的發展越來依從數據進行運用,隨著網際網路的發展,企業今後的決策一定是基於數據的決策與管理,python作為一個商業智能的工具性語言,一定是作為業務分析的必備掌握工具。pandas包是數據分析的核心包,其構建數據結構主要series和DataFame兩種結構。
  • 論文常用數據分析方法分類總結-4
    繼續我們的知識總結,本文總結包括:多選題研究、聚類分析研究、權重研究、非參數檢驗、數據分布。查看本系列之前的文章,可點擊下面的連結:論文裡的分析方法要用哪一種,SPSSAU告訴你答案論文常用數據分析方法分類總結-2論文常用數據分析方法分類總結-316. 模型研究方法
  • 論文常用數據分析方法分類總結-3
    查看本系列之前的文章,可點擊下面的連結:論文裡的分析方法要用哪一種,SPSSAU告訴你答案論文常用數據分析方法分類總結-211. 多選題研究TOPSIS法:TOPSIS權重法是一種評價多個樣本綜合排名的方法,用於比較樣本的排名。模糊綜合評價:是通過各指標的評價和權重對評價對象得出一個綜合性評價。灰色關聯:灰色關聯是一種評價多個指標綜合排名的方法,用於判斷指標排名。14. 非參數檢驗
  • 數據分析的方法(一)
    至今,數據分析師的行業依然很火熱,但是大部分人還是不清楚數據分析的目的是什麼,分析的步驟、方法都有哪一些。數據分析主要就是為了從海量的數據中提取有用的信息和形成結論,從而對數據加以詳細的研究和概括總結。
  • 數據分析實用的4種分析方法
    在日常工作中數據分析主要是為了支持業務,而業務很大程度上是圍繞用戶進行的,因而可以從用戶場景出發來具體選擇數據工具。用戶場景主要分成三大類: 第一類是洞察,要去觀察和找到我們用戶當中的一些特點規律。
  • 5種速成數據分析方法
    大數據正悄然改變我們的世界,無處不在,各行各業都在使用大數據,大數據可以為政府、企業、研發等提供決策依據,因此,掌握正確的大數據分析方法,智能的、深入的、有價值的信息提取是十分有必要的!
  • Python數據分析怎麼入門
    Python作為一門非常適用於大數據的語言,在進入大數據時代以來,成為備受歡迎的數據分析工具。Python數據分析的人才需求,也在不斷增加。今天我們就從自學python入門的角度,來聊聊Python數據分析怎麼入門?首先,想學Python來做數據分析,要對企業的用人需求和崗位技能要求有清晰的了解,針對性地去學習,才能更快實現入門入行。
  • 網際網路數據分析入門:流量分析
    當今時代信息化產業飛速發展,各類底層大數據平臺百花齊放,億級數據、秒級響應已經不再是當年的遙不可及的神話。然而對於企業來說,數據計算快僅僅是滿足企業進行業務數據分析的硬體基礎,如何發掘這些海量的數據產生應用價值,走好數據分析這最後一公裡,引導企業進行戰略決策卻是至關重要的一步。本文以網際網路行業為數據業務分析背景,希望能跟大家交流一些數據分析方面的心得和體驗。
  • 推薦幾種常見的數據分析方法
    基礎分析方法1.對比分析法概念:根據數據維度的不同特徵,選取兩個或兩個以上重點分析維度,進行重要指標對比,分析其數量關係及形成原因的分析方法,是最基本的分析方法。對比分析的主要參照標準:(1)歷史標準:和歷史水平進行比較,說明其發展水平或增長速度。