「技術」機加工質量數據相關性分析及應用

2021-01-09 AI汽車製造業

大數據時代的到來,如何發掘已有資料庫價值,利用相關性分析為產品加工問題提供理論指導、不斷提升產品質量成為關鍵。本文通過介紹資料庫整合及二次清洗,運用相關性分析、強相關性項目策略,結合實際情況簡要介紹了機加工質量數據相關性分析的過程。

在當今大數據時代,人們開始正視現有的大量數據。與傳統的採樣樣本、隨機樣本相比,大數據分析針對全體數據或者是和某個特定現象相關的所有數據(圖1)。如何發掘已有數據的內在聯繫,相關性分析為我們提供了簡單而精確的理論支持。

加工線質量數據包括CMM數據、離線檢具數據、在線測量數據、擰緊數據、壓裝數據及試漏數據等,如何利用已有的數據更好地指導生產、提升產品質量是我們的出發點。

機加工質量數據相關性分析過程分為四步驟進行: 資料庫整合及二次清洗、相關性分析、強相關性項目策略以及經驗固化和推廣應用。

資料庫整合及二次清洗

進行機加工質量數據相關性分析之前,先要將已有的資料庫內容進行整合和數據二次清洗,將數據中異常數據剔除。

為方便CMM或者檢具操作,加工線中的數據通常按照加工工序分組。數據整合主要是將不同的數據組進行組合,便於分析。將不同特徵的數據從Q-DAS資料庫中提取出來,提取的同時要將每組數據的附加信息全部保留。如圖2所示,這些附加信息包括數據對應的時間、日期、零件ID及檢驗工具的編號等。數據整合可以按照零件ID進行整合(圖3),同一零件對應的所有零件信息歸為一組。後續數據分析的過程如需分析其他附加信息列,在已有整合數據進行重新篩選排列組合即可。

數據二次清洗主要是將數據組中的不完整數據、存在異常的數據剔除。數據異常的判別方法有兩種:一種為物理判別法,判別由於已知因素造成的實測值偏離正常結果,例如已知設備調整、零件批次變化等數據可以直接剔除;另一種為統計判別法,將給定一個置信概率,並確定一個置信限,凡超過此限的誤差,就認為它不屬於隨機誤差範圍,將其視為異常值剔除。通常採用判異方法可以依據拉依達準則、格拉布斯準則以及狄克遜準則等。在物理識別不易判斷時,我們通常採用統計判別法。當然,已經剔除的異常值本身也可能潛在部分有價值信息。這是數據清洗本身無法避免的弊端。

數據相關性分析

數據清洗處理之後,需要對處理後的數據進行相關性分析。進行相關性分析的數據可以針對全體數據,也可以是針對和某個特定現象相關的所有數據。

常用的相關性分析的方法有:皮爾遜相關係數,主要用於變量間線性相關的分析;斯皮爾曼等級相關係數,主要用於變量間非線性相關的分析;肯德爾相關係數,主要用於分類變量的分析。

相關係數中也會出現負值,負值表示負相關,正值表示正相關(圖4)。相關係數絕對值處在0.8~1為極強相關,0.6~0.8為強相關,0.4~0.6為中等相關,0.2~0.4為弱相關,0~0.2為極弱相關。

強相關數據策略

針對已經發現的極強相關、強相關數據內容,應進一步制定策略(圖5),指導設備調整、工藝控制。極強相關項目集中在同工序尺寸、位置關聯尺寸、圓度及圓跳動等尺寸。強相關內容主要包括毛坯、設備間影響尺寸等。針對不同相關項目,應逐一制定工藝控制方案。

例如:對於毛坯來料尺寸影響產品質量項目,可以將毛坯控制尺寸設為PQC項目,避免來料質量變化對產品的影響;同時也可以對來料部分項目加嚴抽檢,發現問題,及時篩選。對於工序間尺寸間強相關項目,可以採取收嚴過程尺寸公差,加嚴過程管控,發現趨勢及時調整。設備調整後,需要進行質量數據的二次驗證,為後續調整提供依據。對於分類變量例如:人員、設備和停機等強相關項目,可以針對變量本身加強控制。之後還要加強人員培訓管理,定期維護保養設備,確認停機後設備狀態等措施,避免這些分類變量引起的質量差異,提升過程質量的穩定性。

舉個具體的例子:缸蓋線DECK FACE面距離W點的距離是保證發動機燃燒室容積的重要尺寸(圖6),該尺寸加工通常分幾步進行:①以毛坯基準定位,測量W點,進行半精加工凸輪軸罩蓋面(基準A』)鉸工藝定位銷孔(基準E、F);②以凸輪軸蓋面及工藝定位銷孔為基準,半精加工DECK FACE面(基準B』)及該面定位銷;③探測DECK FACE面(基準B』),精銑凸輪軸蓋面(基準A)。這幾個工步分配在不同的工序進行。相關性分析結果表明對應的各工序間相關性強。如何保證燃燒室容積滿足最終產品要求,以及如何提升過程穩定性是關鍵問題。

1)確認來料W點滿足毛坯要求:①每個W點的偏差+手動調整值必須在±0.3mm之內;②3個點兩兩之間偏差值必須在±0.3mm之內;③3個點偏差值的平均值寫入主程序,通過運算將值帶入各個工藝相關的坐標。

2)收嚴半精加工的公差,由0.125mm收嚴至0.075mm,保證最終產品滿足產品要求。

3)加嚴過程監控,探測F1000面過程控制內容,將該內容列入該工序刀具補償內容並同時增加控制線輸出給前工序,發現DECK FACE面和凸輪軸罩蓋面半精加工尺寸同時偏大或者偏小及時調整。

以上措施實施完成後,DECK FACE面距離W點距離尺寸得到完美控制,過程能力穩定在PPK2.0以上。

經驗固化和推廣應用

在機加工質量數據相關性分析的過程中,需要將已經發現的強相關項目調整方法固化並推廣應用。

例如:溫度變化與部分尺寸間存在強相關關係。切削液溫度控制在多少攝氏度對過程能力穩定沒有影響?經過數據驗證,20℃後開始加工,過程能力可以滿足要求。將20℃要求固化到設備參數內,當切削液溫度達到20℃,設備允許起動。

再例如:擰緊某螺栓力矩非連續報警。數據分析發現報警全部由A班某固定員工預擰緊。經驗證該員工預緊方法與其他員工存在差異。規範該崗位作業指導手冊,該螺栓預緊方式應為僅允許預緊2~3扣。

總結

數據相關性分析和應用是一個不斷開發新方法、不斷發現新聯繫、不斷處理新問題以及不斷提升質量的過程。引用維克託·邁克·舍恩伯格的話「在大數據的背景下,相關關係大放異彩。」機加工質量數據相關性分析將為質量穩定提供理論基礎,必將指導我們在提升產品質量的道路上繼續前行。

拓展閱讀

相關焦點

  • R 語言之數據分析「Resampling」
    本節主要總結「數據分析」的「Resampling」重抽樣思想,並通過 R 語言實現。有一種東西叫作「傳統」,它在很多時候很有用,但會讓你思維固化,在新的環境下讓你出錯。在總結回歸分析和方差分析的時候 ④R語言之數據分析「初章」,我總是會在模型的建立之前提到「統計假設」,在模型建立之後進行「假設檢驗」,原因想必大家都能理解,就是因為這些「統計假設」是我們模型建立思想的基礎,是支撐我們模型正確性的「必要條件」。但是,不可否認的是,這些「必要條件」最終會成為我們「數據分析」的局限,讓我們對「不滿足條件的數據集」束手無策。
  • Gartner預測2019年十大「數據和分析技術」趨勢:增強型分析成為...
    增強型數據分析,增強型數據管理,持續型智能,可解釋的 AI,數據結構,NLP/對話式分析,商業 AI 和 ML,區塊鏈和持久性內存伺服器共同構成了 Gartner 2019 年十大「數據和分析技術趨勢」。 最近兩天裡,2 月 18 日-19 日,在雪梨舉行的 Gartner 數據與分析峰會上,增強型數據分析和可解釋的人工智慧成為焦點。
  • 恆星的光度、溫度、半徑和質量與「主序星」物理量有很好的相關性
    」是指在相互的引力作用下以橢圓軌道運動相互繞轉的兩顆恆星組成的系統,在雙星的軌道運動裡面如果知道了它們的軌道運動方式,就可以利用「克卜勒定律」或者「牛頓萬用引力定律」來測量它們的質量。利用「克卜勒第三定律」求出恆星的質量在銀河系裡面其實大部分的恆星是位於雙星或者「聚星」系統中的,三到六、七顆恆星在引力作用下聚集在一起組成的恆星系統,所以把雙星系統裡面的恆星稱為「子星」。
  • 什麼才是打開「數據分析」的正確姿勢?
    數據專員小王做了一份長達26頁的數據分析報告,這份報告是圍繞現有的內部渠道的運營質量進行的數據抽取和分析。「因為負責渠道的同事提出了需求,希望了解渠道這半年來的相關數據。」「是要數據,還是要分析?」「要數據,但是要協助分析。」「如果要數據,你提供一張Excel表格就可以了,但如果要分析,這個PPT是不合格的。」
  • 全國81所「大數據管理與應用」本科專業高校教育教學綜合排名一覽
    導讀:2020 年教育部公布全國 51 所普通高校成功申報「大數據管理與應用」本科專業,2019 年教育部公布全國 25 所普通高校成功申報「大數據管理與應用」本科專業,2018 年教育部公布全國 5 所普通高校成功申報「大數據管理與應用」本科專業。
  • 日本沙迪克Sodick 電火花放電加工機AD25Ls
    直線電機驅動 成型放電加工機AD25Ls
  • 「金猿產品展」Stratifyd——AI驅動的增強智能數據分析平臺
    應用場景/人群Stratifyd增強智能數據分析平臺適用於全行業、多場景的應用,主要目標客戶群體包括:企業決策者、客戶體驗官、數字營銷人員、客戶關係管理人員、運營人員、客服人員、數據分析師等。Stratifyd的使用場景主要包括以下幾個方面:應用場景一:客訴分析監測不同渠道消費者投訴情況,捕捉對話蘊含的重要指標。
  • 從相關性分析到有監督學習,淺談數據挖掘分析
    相關性分析是我們做數據分析時最常用的一種方法。我們在對業務進行分析時,都會思考哪幾個環節是相互影響的,通過層層推理,找到工作中的關鍵問題,從而改進業務,提高工作效率。業務環節相互影響,在數據上的體現就是具有相關性。我們按照數據的類型來說下,在做數據分析時會碰到哪些相關性分析。
  • 「行業研究專題」如何應用MECE原則來分析問題
    所以這條原則翻譯過來,可以是「相互獨立,完全窮盡」,也可以翻譯成「不重複,無遺漏」。講到這裡,你肯定會說,好,我知道MECE是什麼意思了。那具體怎麼用呢?接下來我們舉幾個例子來詳細闡述。02案例一:公司用戶研究組接到一個任務:分析公司的消費人群的特徵。在分析之前,要先對人群進行拆分,並擬定調研的方案。
  • 聚焦蛋白質組學技術開發及應用,「景傑生物」完成5.3億元B輪融資
    36氪獲悉,「景傑生物」已於近日完成5.3億元B輪融資,本輪融資由IDG資本領投,達晨、弘暉資本、蘇州隆門創投等知名投資方跟投,上一輪領投方國投創業繼續跟投。本輪融資是繼年初由國投創業領投,博遠資本跟投的首輪融資後,「景傑生物」完成的第二輪融資,共計6.6億元,所募集資金將主要用於進一步推動其新業務線的開發、市場拓展以及團隊優化。
  • 「競品分析」的理念、流程、方法、工具
    2,競品分析與市場分析其實是有區別的。市場分析、競品分析、產品分析、產品體驗分析在「分析目的」、「產品數量」、「分析維度」三個方面都是有所區別的,是一個從宏觀到微觀的過程。>產品視角有八個競品分析維度:(1)功能設計:功能分析需要精確到三級功能(2)用戶體驗:包括頁面布局、頁面色彩、logo設計、內容質量、內容數量(3)用戶情況:包括畫像、數據、反饋
  • 民航數據分析的相關性原則
    ICAO9859中指出:「以數據為基礎的決策是任何管理系統最重要的方面之一,用於有效決策的數據質量,必須自始至終加以考慮,很多資料庫缺少必要的數據質量,沒有考慮到支持安全風險管理功能和安全保證功能使用的數據局限性,將會產生有缺陷的分析結果,可能導致錯誤的決定。」
  • Python數據分析中Pandas數據運算實踐
    ,通過方法 info() 看下有數據質量:上面這些數據到底說了個啥?看過我前面文章的同學應該知道,info() 這個方法經常用作查看數據空值,很不辛,這裡有些屬性的數據不全,如:Age(年齡)屬性只有714名乘客有記錄Cabin(客艙)更是只有204名乘客是已知的這裡我們進一步使用 describe() 看下這批數據的統計分析數據:能看出來啥呢?
  • 將單細胞大數據用於藥物研發,「百奧智匯」完成A+輪融資
    所募集資金將用於「百奧智匯」進一步擴大和加速單細胞大數據及單細胞數據分析平臺在創新藥物研發領域的轉化應用,推進其單細胞大數據和分析系統在藥物新靶標挖掘、生物免疫學驗證、抗體開發、生物標誌物發現、基礎科研及臨床研究等方面建立起市場優勢;同時進一步擴大國內外商業化布局。
  • 埃洛克防務發布「守望者」、「觀測者」
    結合母公司AIRLOOK在製圖、人工智慧、雲計算等技術與服務的積累,埃洛克防務將攜手合作夥伴,深耕防務業務在應急、公安、生態、工程、工業、能源等領域的廣泛應用。「守望者」與「觀測者」以簡單易上手的操作體驗,適用不同的應用場景。
  • 開發以中文「與數據對話」的AI決策系統,「訊能集思」要做人工智慧...
    一個矛盾:企業強烈的數位化需求和企業傳統的數據分析運行機制在「訊能集思」創始人張宗堯博士看來,「商業決策平臺」概念的產生來自於企業強烈的數位化需求和企業傳統的數據分析運行機制之間的矛盾。為利用進階的人工智慧技術消除業務人員、商業IT部門和數據分析師的使用代溝(Gap),使他們能同步使用數據、進行數據分析,並提供包括需求預測、客戶行為分析、庫存採購管理、生產排程與產能分配及良率分析等多種功能,「訊能集思」以「AI+BI」(人工智慧+商業智能)為核心,使用 DPAK 分析算法將大量數據在同一平臺內即時導入,並通過平臺化算法降低疊加成本,簡化數據分析流程,通過結合業務領域知識及特定算法
  • 數據分析基礎相關性分析,SPSS實操
    一、相關性分析定義相關性分析用於描述變量之間線性相關程度的強弱,並用適當的統計指標表示出來的過程。相關性分析1、二元定距變量的相關分析二、SPSS相關性分析操作spss相關性分析操作流程基本數據統計分析--spssSPSS主界面操作:
  • 數據分析模型:歸因分析
    本篇講述歸因分析在實際業務中的應用及實現方法,主要講解「渠道歸因」和「運營位歸因」的「單值傳遞歸因」、「多值記錄集合歸因」、「時序還原歸因」以及「路徑還原歸因」幾個方法。
  • 近紅外光譜分析技術在食品加工中的應用
    1、近紅外光譜技術介紹現代近紅外光譜分析技術是近年來分析化學領域迅猛發展的高新分析技術2、近紅外分析儀在食品加工企業的應用優勢(1)分析速度快。近紅外光譜的信息必須由計算機進行數據處理及統計分析,一般一個樣品取得光譜數據後可以立刻得到定性或定量分析結果。通過己建立的校正模型,測定一個樣品通常只需幾秒到時幾十秒的時間,極大的縮短了檢測周期。(2)分析效率高。
  • 數據分析秘籍在這裡:Kaggle 六大比賽最全面解析(上)
    一種流行的技術是 Bag of Words(詞袋),其中句子被有效地轉換為 0 或 1 的集合,即特定單詞是否出現。(不出現為 0,出現為 1)由於需要轉換數據,大多數 Notebook 的前幾個步驟傾向於將文本轉換為機器可讀的內容,並且這一步驟都趨於相似。之後,大家的方法會出現很大差異,並對特徵工程應用各種不同的可視化和技術。