32. 方法篇:數理統計-武林崛起

2020-12-11 陳屹的企業太極管理

寫者在我，看者在你，讀有所悟，汝心使然。這就是閱讀中空性的自然體現。

之前，我們已經了解到概率論（數理統計）的乾坤是隨機與疊加。而數理統計的目的，是判斷是否有疊加的變異。並明確變異是什麼。

要談數理統計，離不開介紹控制圖和西格瑪σ。我想還是以武林歪史的方式來演繹，以便大家理解。

戲說數理統計控制

1924年，有個奇人叫休哈特，創立了武林的一個新的門派，叫SQC教。（休哈特1924年提出控制圖Control Chart。他在1931年出版了《產品生產的質量經濟控制》（Economic Control of Quality of Manufactured Product）。此書被公認為是質量基本原理的起源。因此他也被人們尊稱為「統計質量控制SQC之父」。）

SQC教的絕學武功叫μ功法（期望值μ），但教主博學多才，其掌握的武功功法遠遠超過μ功法。教主對自己的徒弟，並非只傳授μ功法，而是看資質，量身定製武功套路西格瑪σ（標準差）。（期望值μ和標準差σ是控制圖的基本參數。）

西格瑪σ數值越大，武功越雜，想當年射鵰英雄傳裡的郭靖大俠，就是大值σ的武功，從江南七俠的武功，到洪七公的打狗棒法，再加上全真教的丘處機的武功，什麼都有。（σ的數值越大，精度越差，離散度越高。）西格瑪越小，武功越專，就像郭靖的師傅之一丘處機，僅憑全真教的功法，就走遍天下。（σ的數據越小，精度越高，離散度越低。）

但不管學的專，學的雜，能打得贏對手才是武功的王道。衡量是否能戰勝對手，看的不是σ的值，而是學藝的水平。當練武之人達到3σ時，其面對1000個對手，尚有2.7個是其對手。如果其水平達到6σ時，一百萬個對手只有3.4個才堪與一戰。（3σ是質量受控的基本表現，合格率是99.73%，6σ是質量傑出的表現，合格率接近100%。）

工序能力指數

學藝有成，想要行走江湖的，教主會讓四大金剛把守山門（工序能力指數）來考核弟子的功力。只有考核合格的弟子才有資格出去闖蕩，其中：

左山門的把守金剛叫Cpu。他負責考核練功只認一條理（單向公差）走上偏門的弟子（給定單向公差的上限公差）。

右山門的把守金剛叫Cpl。他負責考核練功只認一條理（單向公差）走下偏門的弟子（給定單向公差的下限公差）。

中間山門的把守金剛有兩個，分別叫叫Cp和Cpk。Cp和Cpk考核哪些做事靈活，不認死理的弟子（雙向公差）Cp考核的是弟子相對功夫套路較雜，但還是以μ功法為比武核心的（分布中心與公差中心重合的雙向公差）。只要達到1.0以上的，就可以通過。Cpk考核的弟子是武功學偏門了。其功夫核心已不是μ功法，而是離μ功法有一定差異的功法（分布中心與公差中心不重合的雙向公差）。不過這類弟子相對練得比較精，功夫套路倒是不雜，需要達到1.33以上的才算合格。

凡是順利下山的弟子，武功都達到一定修為，但武功水平也就3σ，一般合格水平。因為教主心裡明白，窮人家孩子早當家，練武時間越久，武功修為是上去了，但花費也上去了，不合算。（不建議工序能力指數過高，是因為質量也是成本，要達到這個水平，投入不見得合算。）

教主的弟子大部分都希望學業求精，同時也希望功夫是最能行走江湖的。所以一般都選修與Cpk金剛對陣的功夫。（目前用Cpk來作為工序能力考核的指數是最常見的方式。）

如果是在接受行走江湖的四大金剛考核之前，要臨時下山的，因為其修煉·的時間並不長，必須接受兩大護法的考核，這兩大護法的名字叫Pp和Ppk。通過兩大護法考核通過的標準是1.67。（Pp和Ppk適用於初期生產的過程控制檢驗，Ppk的數據樣本量小於100。Cp，Cpk適用於大量生產的抽查，數據樣本量大於100。）

上述Cpu、Cpl、Cp、Cpk、Pp、Ppk均有數學公式，因為有專門的軟體Minitab。本文裡就不教大家如何計算了。（說實話是我自己覺得算起來太煩，就偷懶了。）

判異準則

制約武功的提高有瓶頸，一個是自身水平的制約（數理統計中稱為異常原因），一個是周圍環境的幹擾（數理統計中稱為偶然因素）。提高武功水平，需要不斷提高自身的武功水平（改善異常原因）。和排除不必要的幹擾（消除偶然因素）。其中以提高自身的武功水平為主。

自身水平不足所造成的走火入魔現象包括：

因貪心不足，本來只想修精一門技藝的，結果橫跨了好幾門技藝（σ數值變大）。因太鑽牛角尖，單門技藝裡的單一動作很精（σ數值變小）。練的糊塗了，修煉μ功法的，結果反而偏離了（分布中心偏離公差中心）。總體而言，走火入魔後，形還是那個形，神已不是那個神（保持正態分布曲線的形狀，但位置，高矮胖瘦發生了變化）。

檢查武功修為的進度，有兩種方法，一種是專門一天觀察弟子的習武情況（分析用控制圖，全數連續取樣）。還有一種方法是定期的抽查弟子的習武情況（控制用控制圖，按程序規定的取樣方法取樣）。

當專門一天觀察弟子的習武情況時，發現弟子動作老是練不準，而且這種練不準已經成為習慣時，就代表弟子已經到了比較危險的時候。各種不好的習慣包括：

在重複規定動作中，時不時的打出不規範動作。（連續 25 點中有一點及以上在控制界限線外，或連續 35 點中有2點及以上在控制界限線外，或連續 100 點中有3 點及以上在控制界限線外）。動作中老是有習慣性偏好，包括：1. 鏈的傾向：連續 7點或更多點、11點中有10點、14點中有12點、17點中有14點，20點中有16點在中心線一側。2. 趨勢傾向：連續6點或更多的點具有上升或下降趨勢。3. 周期傾向；點子的排列隨時間的推移而呈周期性。4. 控制不住傾向：①連續3 點中有 2點、7 點中有3點落在中心線同一側2σ與3σ控制線之間。②連續5點中有4點在中心線同一側的1σ與3σ控制線以間。③連續8點在中心線兩側，但沒有一點在中心線兩側的1σ範圍內。

當定期抽查弟子的習武情況時。除了上述的習慣性偏好動作非常危險之外，其他可能走火入魔的表現包括：

動作變形。（點子落在控制界限線外或控制界限線上。）動作標準的可怕，有點擺拍的意思了。（①連續15點靠近中心線附近，落在「1σ」與中心線之間。②連續14點相鄰點上下交替。）通過上面的戲說，希望解釋清楚，在什麼時候選用什麼樣的數學模型進行判別。如何知道過程是受控還是不受控。

接下來的內容，非專業人士可以跳過，因為我實在不知道怎麼編故事了。而且非專業人士也無需深入了解。

如何選用合適的控制圖

統計的觀察者對於結果的影響非常重要。所謂統計的觀察者，指的是以哪種角度對數據分組。分組技術是控制圖中最重要的組成部分。

控制圖分為計數型統計圖和計量型統計圖。每一類統計圖又有四個分支。

計量型統計圖包括以下四種統計圖：

單值-極差控制圖：可用於按時間順序排列的任何數據，有多種用途，是最常用的控制圖類型。使用場合為在一個固定的時刻只有一個數據點，即沒有分組的情形。均值-極差控制圖和均值-標準差控制圖：是最常用的基本控制圖。它們適用於控制各種計量值的場所。極差與標準差圖的區別是極差適用樣品數小於10以下的抽樣分析，標準差圖適用樣品數大於10的抽樣分析。中位數-極差控制圖：與均值-極差控制圖相似，只是用中位數圖代替均值圖。由於中位數的計算比均值簡單，所以多用於需在現場把測定數據直接記入控制圖的場合。計數型統計圖包括以下四種統計圖：

P控制圖（不合格率控制）：用於控制對象為不合格品率或合格品率的場合。PN控制圖（不合格數控制）：用於控制對象為不合格品數的場合。C控制圖（缺陷數控制圖）：用於單件上缺陷數的控制。U控制圖（單位缺陷數控制圖）。當樣本大小變化時，不宜用C控制圖，需換算為平均每單位的缺陷數後再使用U控制圖。

上面描述的，都是數理統計在統計過程控制SPC中如何使用。在實戰中，數理統計還被應用在持續改善6西格瑪，測量系統分析MSA，直方圖，排列圖等工具上面。礙於篇幅有限，今後逐一介紹。

作者介紹

陳屹

外資企業在中國的第一代工業工程師

汽車行業的資深管理者

太極管理學的創始人

國學的志願推廣者

32. 方法篇:數理統計-武林崛起

相關焦點

淺說數理統計與概率論

機器學習數學基礎:數理統計與描述性統計

概率論與數理統計課件

概率論與數理統計

數字32的含義,數理32寶馬金鞍

統管學院本科生生活導師簡介——數理統計系

概率論與數理統計複習攻略

概率論與數理統計初步

概率論與數理統計的第一講

2021考研數學：概率與數理統計高分複習攻略

考研數學概率與數理統計學科特點

2021考研概率論與數理統計衝刺:數理統計的基本概念考試要求_北京...

2017考研數學概率論與數理統計考情分析

數據分析:關於社會統計學與數理統計的區別,看完長見識了

概率論與數理統計第四版

概率論和數理統計：向著「不確定性」進軍的數學學科

數理統計丨剖析均值方差與標準差

2018年概率論與數理統計考研大綱解析

吉林大學概率論與數理統計專業碩士研究生培養方案

《概率論與數理統計》課後答案