寫者在我,看者在你,讀有所悟,汝心使然。這就是閱讀中空性的自然體現。
之前,我們已經了解到概率論(數理統計)的乾坤是隨機與疊加。而數理統計的目的,是判斷是否有疊加的變異。並明確變異是什麼。
要談數理統計,離不開介紹控制圖和西格瑪σ。我想還是以武林歪史的方式來演繹,以便大家理解。
戲說數理統計控制
1924年,有個奇人叫休哈特,創立了武林的一個新的門派,叫SQC教。(休哈特1924年提出控制圖Control Chart。他在1931年出版了《產品生產的質量經濟控制》(Economic Control of Quality of Manufactured Product)。此書被公認為是質量基本原理的起源。因此他也被人們尊稱為「統計質量控制SQC之父」。)
SQC教的絕學武功叫μ功法(期望值μ),但教主博學多才,其掌握的武功功法遠遠超過μ功法。教主對自己的徒弟,並非只傳授μ功法,而是看資質,量身定製武功套路西格瑪σ(標準差)。(期望值μ和標準差σ是控制圖的基本參數。)
西格瑪σ數值越大,武功越雜,想當年射鵰英雄傳裡的郭靖大俠,就是大值σ的武功,從江南七俠的武功,到洪七公的打狗棒法,再加上全真教的丘處機的武功,什麼都有。(σ的數值越大,精度越差,離散度越高。)西格瑪越小,武功越專,就像郭靖的師傅之一丘處機,僅憑全真教的功法,就走遍天下。(σ的數據越小,精度越高,離散度越低。)
但不管學的專,學的雜,能打得贏對手才是武功的王道。衡量是否能戰勝對手,看的不是σ的值,而是學藝的水平。當練武之人達到3σ時,其面對1000個對手,尚有2.7個是其對手。如果其水平達到6σ時,一百萬個對手只有3.4個才堪與一戰。(3σ是質量受控的基本表現,合格率是99.73%,6σ是質量傑出的表現,合格率接近100%。)
工序能力指數
學藝有成,想要行走江湖的,教主會讓四大金剛把守山門(工序能力指數)來考核弟子的功力。只有考核合格的弟子才有資格出去闖蕩,其中:
左山門的把守金剛叫Cpu。他負責考核練功只認一條理(單向公差)走上偏門的弟子(給定單向公差的上限公差)。
右山門的把守金剛叫Cpl。他負責考核練功只認一條理(單向公差)走下偏門的弟子(給定單向公差的下限公差)。
中間山門的把守金剛有兩個,分別叫叫Cp和Cpk。Cp和Cpk考核哪些做事靈活,不認死理的弟子(雙向公差)Cp考核的是弟子相對功夫套路較雜,但還是以μ功法為比武核心的(分布中心與公差中心重合的雙向公差)。只要達到1.0以上的,就可以通過。Cpk考核的弟子是武功學偏門了。其功夫核心已不是μ功法,而是離μ功法有一定差異的功法(分布中心與公差中心不重合的雙向公差)。不過這類弟子相對練得比較精,功夫套路倒是不雜,需要達到1.33以上的才算合格。
凡是順利下山的弟子,武功都達到一定修為,但武功水平也就3σ,一般合格水平。因為教主心裡明白,窮人家孩子早當家,練武時間越久,武功修為是上去了,但花費也上去了,不合算。(不建議工序能力指數過高,是因為質量也是成本,要達到這個水平,投入不見得合算。)
教主的弟子大部分都希望學業求精,同時也希望功夫是最能行走江湖的。所以一般都選修與Cpk金剛對陣的功夫。(目前用Cpk來作為工序能力考核的指數是最常見的方式。)
如果是在接受行走江湖的四大金剛考核之前,要臨時下山的,因為其修煉·的時間並不長,必須接受兩大護法的考核,這兩大護法的名字叫Pp和Ppk。通過兩大護法考核通過的標準是1.67。(Pp和Ppk適用於初期生產的過程控制檢驗,Ppk的數據樣本量小於100。Cp,Cpk適用於大量生產的抽查,數據樣本量大於100。)
上述Cpu、Cpl、Cp、Cpk、Pp、Ppk均有數學公式,因為有專門的軟體Minitab。本文裡就不教大家如何計算了。(說實話是我自己覺得算起來太煩,就偷懶了。)
判異準則
制約武功的提高有瓶頸,一個是自身水平的制約(數理統計中稱為異常原因),一個是周圍環境的幹擾(數理統計中稱為偶然因素)。提高武功水平,需要不斷提高自身的武功水平(改善異常原因)。和排除不必要的幹擾(消除偶然因素)。其中以提高自身的武功水平為主。
自身水平不足所造成的走火入魔現象包括:
因貪心不足,本來只想修精一門技藝的,結果橫跨了好幾門技藝(σ數值變大)。因太鑽牛角尖,單門技藝裡的單一動作很精(σ數值變小)。練的糊塗了,修煉μ功法的,結果反而偏離了(分布中心偏離公差中心)。總體而言,走火入魔後,形還是那個形,神已不是那個神(保持正態分布曲線的形狀,但位置,高矮胖瘦發生了變化)。
檢查武功修為的進度,有兩種方法,一種是專門一天觀察弟子的習武情況(分析用控制圖,全數連續取樣)。還有一種方法是定期的抽查弟子的習武情況(控制用控制圖,按程序規定的取樣方法取樣)。
當專門一天觀察弟子的習武情況時,發現弟子動作老是練不準,而且這種練不準已經成為習慣時,就代表弟子已經到了比較危險的時候。各種不好的習慣包括:
在重複規定動作中,時不時的打出不規範動作。(連續 25 點中有一點及以上在控制界限線外,或連續 35 點中有2點及以上在控制界限線外,或連續 100 點中有3 點及以上在控制界限線外)。動作中老是有習慣性偏好,包括:1. 鏈的傾向:連續 7點或更多點、11點中有10點、14點中有12點、17點中有14點,20點中有16點在中心線一側。2. 趨勢傾向:連續6點或更多的點具有上升或下降趨勢。3. 周期傾向;點子的排列隨時間的推移而呈周期性。4. 控制不住傾向:①連續3 點中有 2點、7 點中有3點落在中心線同 一側2σ與3σ控制線之間。②連續5點中有4點在中心線同一側的1σ與3σ控制線以間。③連續8點在中心線兩側,但沒有一點在中心線兩側的1σ範圍內。
當定期抽查弟子的習武情況時。除了上述的習慣性偏好動作非常危險之外,其他可能走火入魔的表現包括:
動作變形。(點子落在控制界限線外或控制界限線上。)動作標準的可怕,有點擺拍的意思了。(①連續15點靠近中心線附近,落在「1σ」與中心線之間。②連續14點相鄰點上下交替。)通過上面的戲說,希望解釋清楚,在什麼時候選用什麼樣的數學模型進行判別。如何知道過程是受控還是不受控。
接下來的內容,非專業人士可以跳過,因為我實在不知道怎麼編故事了。而且非專業人士也無需深入了解。
如何選用合適的控制圖
統計的觀察者對於結果的影響非常重要。所謂統計的觀察者,指的是以哪種角度對數據分組。分組技術是控制圖中最重要的組成部分。
控制圖分為計數型統計圖和計量型統計圖。每一類統計圖又有四個分支。
計量型統計圖包括以下四種統計圖:
單值-極差控制圖:可用於按時間順序排列的任何數據,有多種用途,是最常用的控制圖類型。使用場合為在一個固定的時刻只有一個數據點,即沒有分組的情形。均值-極差控制圖和均值-標準差控制圖:是最常用的基本控制圖。它們適用於控制各種計量值的場所。極差與標準差圖的區別是極差適用樣品數小於10以下的抽樣分析,標準差圖適用樣品數大於10的抽樣分析。中位數-極差控制圖:與均值-極差控制圖相似,只是用中位數圖代替均值圖。由於中位數的計算比均值簡單,所以多用於需在現場把測定數據直接記入控制圖的場合。計數型統計圖包括以下四種統計圖:
P控制圖(不合格率控制):用於控制對象為不合格品率或合格品率的場合。PN控制圖(不合格數控制):用於控制對象為不合格品數的場合。C控制圖(缺陷數控制圖):用於單件上缺陷數的控制。U控制圖(單位缺陷數控制圖)。當樣本大小變化時,不宜用C控制圖,需換算為平均每單位的缺陷數後再使用U控制圖。
上面描述的,都是數理統計在統計過程控制SPC中如何使用。在實戰中,數理統計還被應用在持續改善6西格瑪,測量系統分析MSA,直方圖,排列圖等工具上面。礙於篇幅有限,今後逐一介紹。
作者介紹
陳屹
外資企業在中國的第一代工業工程師
汽車行業的資深管理者
太極管理學的創始人
國學的志願推廣者