32. 方法篇:數理統計-武林崛起

2020-12-11 陳屹的企業太極管理

寫者在我,看者在你,讀有所悟,汝心使然。這就是閱讀中空性的自然體現。

之前,我們已經了解到概率論(數理統計)的乾坤是隨機與疊加。而數理統計的目的,是判斷是否有疊加的變異。並明確變異是什麼。

要談數理統計,離不開介紹控制圖和西格瑪σ。我想還是以武林歪史的方式來演繹,以便大家理解。

戲說數理統計控制

1924年,有個奇人叫休哈特,創立了武林的一個新的門派,叫SQC教。(休哈特1924年提出控制圖Control Chart。他在1931年出版了《產品生產的質量經濟控制》(Economic Control of Quality of Manufactured Product)。此書被公認為是質量基本原理的起源。因此他也被人們尊稱為「統計質量控制SQC之父」。)

SQC教的絕學武功叫μ功法(期望值μ),但教主博學多才,其掌握的武功功法遠遠超過μ功法。教主對自己的徒弟,並非只傳授μ功法,而是看資質,量身定製武功套路西格瑪σ(標準差)。(期望值μ和標準差σ是控制圖的基本參數。)

西格瑪σ數值越大,武功越雜,想當年射鵰英雄傳裡的郭靖大俠,就是大值σ的武功,從江南七俠的武功,到洪七公的打狗棒法,再加上全真教的丘處機的武功,什麼都有。(σ的數值越大,精度越差,離散度越高。)西格瑪越小,武功越專,就像郭靖的師傅之一丘處機,僅憑全真教的功法,就走遍天下。(σ的數據越小,精度越高,離散度越低。)

但不管學的專,學的雜,能打得贏對手才是武功的王道。衡量是否能戰勝對手,看的不是σ的值,而是學藝的水平。當練武之人達到3σ時,其面對1000個對手,尚有2.7個是其對手。如果其水平達到6σ時,一百萬個對手只有3.4個才堪與一戰。(3σ是質量受控的基本表現,合格率是99.73%,6σ是質量傑出的表現,合格率接近100%。)

工序能力指數

學藝有成,想要行走江湖的,教主會讓四大金剛把守山門(工序能力指數)來考核弟子的功力。只有考核合格的弟子才有資格出去闖蕩,其中:

左山門的把守金剛叫Cpu。他負責考核練功只認一條理(單向公差)走上偏門的弟子(給定單向公差的上限公差)。

右山門的把守金剛叫Cpl。他負責考核練功只認一條理(單向公差)走下偏門的弟子(給定單向公差的下限公差)。

中間山門的把守金剛有兩個,分別叫叫Cp和Cpk。Cp和Cpk考核哪些做事靈活,不認死理的弟子(雙向公差)Cp考核的是弟子相對功夫套路較雜,但還是以μ功法為比武核心的(分布中心與公差中心重合的雙向公差)。只要達到1.0以上的,就可以通過。Cpk考核的弟子是武功學偏門了。其功夫核心已不是μ功法,而是離μ功法有一定差異的功法(分布中心與公差中心不重合的雙向公差)。不過這類弟子相對練得比較精,功夫套路倒是不雜,需要達到1.33以上的才算合格。

凡是順利下山的弟子,武功都達到一定修為,但武功水平也就3σ,一般合格水平。因為教主心裡明白,窮人家孩子早當家,練武時間越久,武功修為是上去了,但花費也上去了,不合算。(不建議工序能力指數過高,是因為質量也是成本,要達到這個水平,投入不見得合算。)

教主的弟子大部分都希望學業求精,同時也希望功夫是最能行走江湖的。所以一般都選修與Cpk金剛對陣的功夫。(目前用Cpk來作為工序能力考核的指數是最常見的方式。)

如果是在接受行走江湖的四大金剛考核之前,要臨時下山的,因為其修煉·的時間並不長,必須接受兩大護法的考核,這兩大護法的名字叫Pp和Ppk。通過兩大護法考核通過的標準是1.67。(Pp和Ppk適用於初期生產的過程控制檢驗,Ppk的數據樣本量小於100。Cp,Cpk適用於大量生產的抽查,數據樣本量大於100。)

上述Cpu、Cpl、Cp、Cpk、Pp、Ppk均有數學公式,因為有專門的軟體Minitab。本文裡就不教大家如何計算了。(說實話是我自己覺得算起來太煩,就偷懶了。)

判異準則

制約武功的提高有瓶頸,一個是自身水平的制約(數理統計中稱為異常原因),一個是周圍環境的幹擾(數理統計中稱為偶然因素)。提高武功水平,需要不斷提高自身的武功水平(改善異常原因)。和排除不必要的幹擾(消除偶然因素)。其中以提高自身的武功水平為主。

自身水平不足所造成的走火入魔現象包括:

因貪心不足,本來只想修精一門技藝的,結果橫跨了好幾門技藝(σ數值變大)。因太鑽牛角尖,單門技藝裡的單一動作很精(σ數值變小)。練的糊塗了,修煉μ功法的,結果反而偏離了(分布中心偏離公差中心)。總體而言,走火入魔後,形還是那個形,神已不是那個神(保持正態分布曲線的形狀,但位置,高矮胖瘦發生了變化)。

檢查武功修為的進度,有兩種方法,一種是專門一天觀察弟子的習武情況(分析用控制圖,全數連續取樣)。還有一種方法是定期的抽查弟子的習武情況(控制用控制圖,按程序規定的取樣方法取樣)。

當專門一天觀察弟子的習武情況時,發現弟子動作老是練不準,而且這種練不準已經成為習慣時,就代表弟子已經到了比較危險的時候。各種不好的習慣包括:

在重複規定動作中,時不時的打出不規範動作。(連續 25 點中有一點及以上在控制界限線外,或連續 35 點中有2點及以上在控制界限線外,或連續 100 點中有3 點及以上在控制界限線外)。動作中老是有習慣性偏好,包括:1. 鏈的傾向:連續 7點或更多點、11點中有10點、14點中有12點、17點中有14點,20點中有16點在中心線一側。2. 趨勢傾向:連續6點或更多的點具有上升或下降趨勢。3. 周期傾向;點子的排列隨時間的推移而呈周期性。4. 控制不住傾向:①連續3 點中有 2點、7 點中有3點落在中心線同 一側2σ與3σ控制線之間。②連續5點中有4點在中心線同一側的1σ與3σ控制線以間。③連續8點在中心線兩側,但沒有一點在中心線兩側的1σ範圍內。

當定期抽查弟子的習武情況時。除了上述的習慣性偏好動作非常危險之外,其他可能走火入魔的表現包括:

動作變形。(點子落在控制界限線外或控制界限線上。)動作標準的可怕,有點擺拍的意思了。(①連續15點靠近中心線附近,落在「1σ」與中心線之間。②連續14點相鄰點上下交替。)通過上面的戲說,希望解釋清楚,在什麼時候選用什麼樣的數學模型進行判別。如何知道過程是受控還是不受控。

接下來的內容,非專業人士可以跳過,因為我實在不知道怎麼編故事了。而且非專業人士也無需深入了解。

如何選用合適的控制圖

統計的觀察者對於結果的影響非常重要。所謂統計的觀察者,指的是以哪種角度對數據分組。分組技術是控制圖中最重要的組成部分。

控制圖分為計數型統計圖和計量型統計圖。每一類統計圖又有四個分支。

計量型統計圖包括以下四種統計圖:

單值-極差控制圖:可用於按時間順序排列的任何數據,有多種用途,是最常用的控制圖類型。使用場合為在一個固定的時刻只有一個數據點,即沒有分組的情形。均值-極差控制圖和均值-標準差控制圖:是最常用的基本控制圖。它們適用於控制各種計量值的場所。極差與標準差圖的區別是極差適用樣品數小於10以下的抽樣分析,標準差圖適用樣品數大於10的抽樣分析。中位數-極差控制圖:與均值-極差控制圖相似,只是用中位數圖代替均值圖。由於中位數的計算比均值簡單,所以多用於需在現場把測定數據直接記入控制圖的場合。計數型統計圖包括以下四種統計圖:

P控制圖(不合格率控制):用於控制對象為不合格品率或合格品率的場合。PN控制圖(不合格數控制):用於控制對象為不合格品數的場合。C控制圖(缺陷數控制圖):用於單件上缺陷數的控制。U控制圖(單位缺陷數控制圖)。當樣本大小變化時,不宜用C控制圖,需換算為平均每單位的缺陷數後再使用U控制圖。

上面描述的,都是數理統計在統計過程控制SPC中如何使用。在實戰中,數理統計還被應用在持續改善6西格瑪,測量系統分析MSA,直方圖,排列圖等工具上面。礙於篇幅有限,今後逐一介紹。

作者介紹

陳屹

外資企業在中國的第一代工業工程師

汽車行業的資深管理者

太極管理學的創始人

國學的志願推廣者

相關焦點

  • 淺說數理統計與概率論
    數理統計            數理統計是伴隨著概率論的發展而發展起來的一個數學分支,研究如何有效的收集、整理和分析受隨機因素影響的數據,並對所考慮的問題作出推斷或預測,為採取某種決策和行動提供依據或建議。       根據上面描述,數理統計可分為描述統計和推斷統計。
  • 機器學習數學基礎:數理統計與描述性統計
    今天是概率統計基礎的第二篇文章, 基於第一篇隨機變量與隨機事件進行整理, 首先理一理這裡面的邏輯,第一篇的內容蘊涵了大部分概率論的知識(除了大數定律和中心極限定理這種理論性的支持, 後期有機會會補上)。而今天的這篇內容是在概率論的基礎上往前一步, 屬於數理統計的內容。
  • 概率論與數理統計課件
    ‍點擊上方高數君可加關注 帶你一起學習高數,複習考研數學 概率論與數理統計課件百度雲下載連結
  • 概率論與數理統計
    概率論與數理統計初步主要考查考生對研究隨機現象規律性的基本概念、基本理論和基本方法的理解,以及運用概率統計方法分析和解決實際問題的能力。我們總結各個部分考察的主要內容及對考生的要求,最後總結此門科目經常考的題型及容易犯的錯誤,供大家參考。
  • 數字32的含義,數理32寶馬金鞍
    數字32的含義,數理32寶馬金鞍32數字在易經預測體系中,是屬于吉數。32數暗示為:寶馬金鞍。詩曰:僥倖多望,貴人得助,財帛如裕,繁榮至上。歌手尚雯婕的歌迷稱她為「三兒」在網絡使用時常簡寫為諧音32;歌手楊坤在《中國好聲音》中,被觀眾稱為「三十二郎」後來楊坤的學生們演出時,都穿著印有32的演出服,被稱為32號黃金戰袍。數字32的含義【數理】數字32為大吉之數。【總論】池中之龍,風雲際會,一躍上天,成功可望。
  • 統管學院本科生生活導師簡介——數理統計系
    長期從事計量經濟學、數理統計以及生物統計的科學研究;在半參數,非參數回歸建模,估計,檢驗及其在經濟學,金融學和生物醫學方面的應用開展了許多有價值的研究工作;在國際和國內著名的統計和經濟學雜誌(包括Journal of the American Statistical Association,Journal of Econometric等)上發表學術論文六十餘篇,其中三大檢索論文四十餘篇,被SCI他引幾百餘次
  • 概率論與數理統計複習攻略
    除以上6種常見的概率模型外,還有指數分布,隨機變量的函數等模型,不再—一列舉,可參考《概率論與數理統計9講》有關內容。 學生普遍反映本課程自學較難,除概念抽象外,恐怕一些特殊的計算方法也會帶來不少學習上的困難。要突破這一點,最好的方法是將有關的典型例題讀完後,合上書,認真復算一遍,邊算邊加深理解。
  • 概率論與數理統計初步
    概率論與數理統計初步主要考查考生對研究隨機現象規律性的基本概念、基本理論和基本方法的理解,以及運用概率統計方法分析和解決實際問題的能力。、相關係數和矩,掌握判斷兩個隨機變量不相關的方法。
  • 概率論與數理統計的第一講
    概率的第一講,主要講清楚歷史發展背景、學習方法、概率統計的專業應用背景等,提高學生的認知能力。
  • 2021考研數學:概率與數理統計高分複習攻略
    2021考研很多考生抱怨概率論與數理統計部分難度較大,殊不知概率部分其實內容不多,也不難,考察方式單一,只要考生在備考過程2021考研數學概率論與數理統計中重視基礎,取得滿分也是沒問題的,一起來了解一下。概率論與數理統計可分為概率和數理統計兩部分。
  • 考研數學概率與數理統計學科特點
    概率與數理統計這門課程從試卷本身的難度的話,在三門課程中應該算最低的,但是從每年得分的角度來說,這門課程是三門課中得分率最低的。這主要是由兩方面造成的。一方面是時間不充裕,概率解答題位於試卷的最後,學生即使會,也來不及解答;另一方面是概率本身學科的特點,導致很多學生覺得概率非常難。
  • 2021考研概率論與數理統計衝刺:數理統計的基本概念考試要求_北京...
    概率論與數理統計是考研數學中尤其重要的一門,在這個階段大家一定不要放鬆,持續備戰方可戰勝困難,下面中公考研小編為大家整理概率論與數理統計相關內容,希望對各位考生有所幫助。數理統計的基本概念考試要求1.理解總體、簡單隨機樣本、統計量、樣本均值、樣本方差及樣本矩的概念,其中樣本方差定義為2.了解分布、分布和分布的概念及性質
  • 2017考研數學概率論與數理統計考情分析
    概率論與數理統計這門學科是數一數三的公共考查科目,這部分知識在整張試卷中佔22%的分值,其相對高數知識體系要簡單。因此,考試對這門學科的考查更加注重基礎,包括基本概念、基本公式、基本定理以及解題基本方法。  二、考試重點集中  概率論與數理統計可分為概率論和數理統計兩部分。
  • 數據分析:關於社會統計學與數理統計的區別,看完長見識了
    1946年H.克拉默發表的《統計學數學方法》是第一部嚴謹且比較系統的數理統計著作,它是數理統計學進入成熟階段的標誌。由於數理統計其本質是帶著概率意義下的結論。比如:區間估計,假設檢驗,方差分析等。因此數理統計屬於概率論的應用屬於自然科學。
  • 概率論與數理統計第四版
    概率論與數理統計是描述「隨機現象」並研究其數量規律的一門學科。通過本課程的教學,使學員掌握概率的定義和計算,能用隨機變量概率分布及數字特徵研究「隨機現象」的規律,了解數理統計的基本理論與思想,並掌握常用的包括點估計、區間估計和假設檢驗等基本統計推斷方法。該課程的系統學習,可以培養學員提高認識問題、研究問題與處理相關實際問題的能力。
  • 概率論和數理統計:向著「不確定性」進軍的數學學科
    說到隨機現象的研究,還有一個與概率論密切聯繫的同類學科——數理統計。但概率論、數理統計、統計方法又有各自不同的內容。【概率論】基於大量同類隨機現象的統計規律,對隨機現象的結果可能性作出科學客觀的判斷,並對其可能性大小做出數量上的描述,從而形成一整套的數學理論和方法。
  • 數理統計丨剖析均值方差與標準差
    前言:為什麼要學會數理統計?因為我們現在所接觸的所有跟人工智慧相關的算法,特別是機器學習,我們都能在這些領域的算法中看到數理統計的影子。甚至說許多機器學習中我們經常聽到的一些傳統算法,比如SVM之類的,其實都是來源於數理統計。包括許多機器學習中的方法論,其實都是源於數理統計的方法論。
  • 2018年概率論與數理統計考研大綱解析
    2018年考試大綱重磅來襲,為了保證各位考生能夠正確解讀大綱要求,中公考研數學團隊帶你以最快的速度,最有效的方式解讀概率論與數理統計的大綱內容。   首先,通過與往年考研大綱對比不難發現,概率概率論與數理統計這一科目秉承往年的穩定性,考查知識點沒有發生任何變化。
  • 吉林大學概率論與數理統計專業碩士研究生培養方案
    攻讀碩士學位的研究生(簡稱碩士生)必須在本學科內掌握堅實的基礎理論和系統的專門知識;掌握本學科的現代統計方法和技能;掌握本學科的現代概率論理論。在所研究方向的範圍內了解本學科發展的現狀和趨勢;掌握一門外國語;具有從事科學研究、大學教學或獨立擔負專門技術工作的能力。   二、研究方向:見附表一。
  • 《概率論與數理統計》課後答案
    前言:        為方便各位同學期末複習《概率論與數理統計》,現特意為各位同學送上符合廣東財經大學的課後答案一份