安全數據的判別分析

2021-01-10 百家號

安全數據的判別分析包括四大內容,如圖所示

1 距離判別法

2 貝葉斯判別法

3 Fisher判別法

Fisher判別法是一種先進行高維向低維投影,再根據距離判別的一種方法,就是通過將k組多元安全統計數據投影到某一個方向上(或某一低維空間中),使投影后的組與組之間儘可能地分開,然後代入新的安全統計樣品數據,與判別臨界值作比較來確定應將其判別為哪個總體。

基本思想是投影,即將K組p維數據投影到某一個方向,使得組與組之間的距離儘可能的大,藉助一元方差分析的思想來構造一個線性判別函數,其係數是根據類與類之間距離最大、類內部距離最小的原則來確定,再根據所建立的線性判別函數結合相應的判別規則來判斷待判樣品的類別。

4 粉塵爆炸危險性等級的Fisher判別分析

將23種可燃性粉塵的爆炸危險性分類結果作為已知的粉塵爆炸危險性分類數據,然後運用Fisher判別分析法對表8-6中的兩種粉塵進行判別分類。

(1)將表8-4的23種可燃性粉塵的爆炸危險性分成4類;

(2)根據Fisher判別理論,使用SPSS軟體,得出最大特徵值及其對應的特徵向量;

(6)對每個樣品計算第一判別函數值和第二判別函數值,並分別以其為橫、縱坐標,得到散點圖8-2。

4 小結

(1)將安全統計資料進行分類的方法有兩種,一種是聚類分析,是在事先並不知道存在什麼類別的情況下,完全按照反映安全現象特徵的數據所揭示的規律來將安全現象進行分類;另一種是判別分析,在對當前研究的安全現象已經分過類的基礎上,如何將未知的安全現象正確地歸於哪一類的問題。

(2)分析安全統計樣品之間的相似性,一般是用「距離」或「相似係數」來度量安全現象之間的相似性。樣品點之間距離的計算方法主要有歐氏距離、平方歐式距離、絕對距離、切比雪夫距離、馬氏距離等;常用的相似係數測度方法有夾角餘弦與Pearson相關係數。

(3)計算類與類之間距離的方法有最短距離法、最長距離法、中間距離法、重心法、組間平均距離法、可變類平均法、可變法、離差平方和法等。

(4)距離判別法是根據新樣品到各個類之間距離的遠近來判別新樣品的類別。

(5)系統聚類的基本思想是:將距離相近的樣品先聚成類,距離較遠的樣品後聚成類,直到每個樣品都能聚到合適的類中。常用譜系圖來描述聚類過程。

(6)K-均值聚類的基本思想是:事先制定需要劃分的類別個數,然後確定各聚類中心,再計算出各樣本到聚類中心的距離,最後按距離的遠近進行分類。

(7)貝葉斯判別法考慮了各個安全統計總體出現概率與錯判損失的影響,基本思想是:假定在抽樣前就對所研究的安全統計總體有一定的認識,並且要用先驗分布來描述這種認識,然後再根據抽取的安全統計樣本對先驗認識作修正,得到後驗分布,隨後的各種統計推斷均基於後驗分布來進行。

(8)Fisher判別法的基本思想是投影,將數據投影到某一個方向,使投影后組與組之間的距離儘可能的大,構造一個線性判別函數,函數的係數是根據類與類之間距離最大、類內部距離最小的原則來確定,根據線性判別函數與相應的判別規則來判斷待判樣品的類別。

相關焦點

  • 安全數據的聚類分析和判別分析概述
    2)聚類與分類的區別分類是有指導的學習,聚類是一種無指導的學習通過一定的方法在逐步分類過程中將沒有類標誌的安全統計數據聚集成有意義的類。3)聚類分析的方法從基本思路上看,聚類分析的方法主要分為三類:系統聚類法、分解法和動態法(或快速聚類法)。
  • 分類分析之判別分析,SPSS判別分析實操
    判別分析是常用的一種分類分析方法。與聚類分析不同的是【聚類分析是直接比較各事物之間的性質,將性質相近的歸為一類,將性質差別較大的歸入不同的類。而且事先並不知曉分類標準】,而判別分析先根據已知類別的事物的性質,利用某種技術建立函數式,然後對未知類別的新事物進行判斷以將之歸入已知的類別中。
  • 什麼是判別分析?有哪些使用場景?
    判別分析最初應用於考古學, 例如要根據挖掘出來的人頭蓋骨的各種指標來判別其性別年齡等.。慢慢的已經成為一種常用的分類分析方法,其通過已知的分類情況,根據數據的特徵對其他研究對象進行預測歸類。原理說明判別分析時,通常需要將數據分為兩部分。一部分是訓練模型數據,一部分是驗證模型數據。首先通過訓練集數據訓練擬合出一個模型。接著再利用另一部分驗證模型效果。如果在測試集數據上,也表現良好,那麼說明擬合模型非常好。後面可以利用此模型用於預測其它「沒有確定類別」的數據,來預測新數據的類別情況。
  • 運用sklearn進行線性判別分析(LDA)代碼實現
    基於sklearn的線性判別分析(LDA)代碼實現一、前言及回顧本文記錄使用sklearn庫實現有監督的數據降維技術——線性判別分析(LDA)。在上一篇LDA線性判別分析原理及python應用(葡萄酒案例分析),我們通過詳細的步驟理解LDA內部邏輯實現原理,能夠更好地掌握線性判別分析的內部機制。
  • 多元回歸分析(multiple linear regression)和判別分析(discriminant analysis)
    研究多個因素間關係及具有這些因素的個體之間的一系列統計分析方法稱為多元(因素)分析。主要包括:多元線性回歸,判別分析,聚類分析,主成分分析,因子分析,典型相關,logistic 回歸,Cox 回歸。本期和下一期公眾號文章將挑選幾個常用的多元統計方法為進行介紹。
  • 數據分析淺談 | 基礎篇
    統計分析方法論:描述統計、假設檢驗、信度分析、相關分析、方差分析、回歸分析、聚類分析、判別分析、主成分與因子分析、時間序列分析,決策樹。 判別分析:根據已掌握的一批分類明確的樣品建立判別函數,使產生錯判的事例最少,進而對給定的一個新樣品,判斷它來自哪個總體。
  • 2017考研數學:曲線拐點的判別方法分析
    函數是高等數學的研究對象,函數的特性包括分析特性和幾何特性,分析特性包括函數的極限、函數的連續與間斷、函數的導數、函數的積分等,幾何特性包括曲線的圖形、曲線的切線和法線、曲線的凹凸性、曲線所圍成的面積等,其中曲線的凹凸性是反映曲線的彎曲方向的,如果曲線向下彎曲,則稱之為凸,如果曲線向上彎曲,則稱之為凹,如果曲線在某點的彎曲方向發生改變,
  • 線性判別分析LDA(Linear Discriminant Analysis)
    (i從1到m),每個x(i)對應一個類標籤至此,我們只需要求出原始樣本的均值和方差就可以求出最佳的方向w,這就是Fisher於1936年提出的線性判別分析。看上面二維樣本的投影結果圖:線性判別分析(多類情況)前面是針對只有兩個類的情況,假設類別變成多個了,那麼要怎麼改變,才能保證投影后類別能夠分離呢?我們之前討論的是如何將d維降到一維,現在類別多了,一維可能已經不能滿足要求。假設我們有C個類別,需要K維向量(或者叫做基向量)來做投影。將這K維向量表示為
  • 統計學最常用的「數據分析方法」清單(二)
    與聚類分析區別 聚類分析可以對樣本逬行分類,也可以對指標進行分類;而判別分析只能對樣本; 聚類分析事先不知道事物的類別,也不知道分幾類;而判別分析必須事先知道事物的類別,也知道分幾類; 聚類分析不需要分類的歷史資料,而直接對樣本進行分類;而判別分析需要分類歷史資料去建立判別函數
  • 新手如何快速入門數據分析?
    CDA數據分析研究院原創作品, 轉載需授權隨著網際網路迅猛發展,各大公司沉澱了很多的數據,如何找出藏在這些數據背後的規律,利用這些數據來給公司創造價值,作為一個新手面對這些問題的時候,你是不是考慮怎麼快速學習數據分析呢?
  • 自激振蕩的判別條件
    自激振蕩的判別條件
  • Websense分析總結:數據安全之二三事
    隨著企業逐漸對數據安全重視,市場中各種類型的數據安全產品和解決方案也在各自為營,企業安全相關工作人員需要準確判斷自身數據安全需求,並正確認識數據安全解決方案的特點,才能為企業做出最佳的數據安全產品選擇,和最符合成本利益投資。
  • 數據分析的幾種常用方法概覽(之二)
    數據分析常用方法概覽(之二)上一篇,我們了解了數據分析時常用的對比分析法、分組分析法、結構分析法、交叉分析法、漏鬥圖分析法、矩陣分析法、綜合評價分析法等八種分析方法,今天我們繼續了解下上文提到的另外八種常見數據分析方法。
  • 數據分析的幾種常用方法概覽
    數據分析常用方法概覽(之一) 對數據進行分析的方法很多,常用的有對比分析法、分組分析法、結構分析法、交叉分析法、漏鬥圖分析法、矩陣分析法、綜合評價分析法、5W1H分析法、相關分析法、回歸分析法、 聚類分析法、判別分析法、主成分分析法、因子分析法、時間序列、方差分析等等。
  • 如何用SPSS進行數據分析?
    1.6 統計功能CDA數據分析師認為SPSS統計功能是進行數據分析要重點掌握的模塊,通過此功能可以完成絕大部分數理統計模型分析,其中包括:回歸分析、列聯表分析、聚類分析、因子分析、相關分析、對應分析、時間序列分析、判別分析等。
  • 數據分析難?教你spss使用的正確姿勢
    軟體不會用,各種數據傻傻搞不清楚,尤其是怎麼分析數據更是暈頭轉向,當然跟著靠譜的老師學習,一邊看實操一邊自己做,這樣肯定事半功倍。本次我們整理出了spss的數據分析教程,都是有實操的,只要跟著做,絕對沒問題!
  • 「技術」機加工質量數據相關性分析及應用
    大數據時代的到來,如何發掘已有資料庫價值,利用相關性分析為產品加工問題提供理論指導、不斷提升產品質量成為關鍵。本文通過介紹資料庫整合及二次清洗,運用相關性分析、強相關性項目策略,結合實際情況簡要介紹了機加工質量數據相關性分析的過程。在當今大數據時代,人們開始正視現有的大量數據。
  • 三點式振蕩電路能否振蕩的判別方法
    0 引言 在模擬電子技術課程中,判別振蕩電路能否產生振蕩的步驟的是:先看直流通路,看放大器件是否工作在放大區;再看交流通路,看是臺滿足振蕩條件。
  • 《厄爾尼諾/拉尼娜事件判別方法》國家標準發布
    原來,在國際上,儘管對於厄爾尼諾/拉尼娜事件的總體認識比較一致,但具體判別標準卻始終存在分歧。針對國內尚缺乏統一的厄爾尼諾/拉尼娜事件判別標準的現狀,為了規範判別標準,促進氣候業務和相關研究工作的開展,國家氣候中心牽頭,通過總結國內外現有厄爾尼諾/拉尼娜事件監測指數,並吸收該領域的最新研究成果,制定《厄爾尼諾/拉尼娜事件判別方法》國家標準。
  • 5個步驟,用SPSS進行數據分析
    SPSS是一款非常強大的數據處理軟體,那麼該如何用SPSS進行數據分析呢? 統計功能 小編認為SPSS統計功能是進行數據分析要重點掌握的模塊,通過此功能可以完成絕大部分數理統計模型分析,其中包括:回歸分析、列聯表分析、聚類分析、因子分析、相關分析、對應分析、時間序列分析、判別分析等。 如何用SPSS進行數據分析?