毛清華 汪澤龍 謝澤文 張強
來源/高等職業教育—天津職業大學學報
原標題/智能製造背景下崗位畫像對工業工程專業人才培養的啟示
工業工程師崗位畫像相較於傳統的訪談調查方法具有明顯優勢。通過對前程無憂等綜合招聘網站的數據進行爬取,搜集全國工業工程類崗位的招聘信息,利用一般性統計分析方法對招聘信息進行多維度分析。對於企業具體的崗位信息,採用jieba中文分詞製成語料庫,對語料庫進行詞頻統計並繪製成詞雲圖,直觀呈現詞語在語料庫佔比。通過語料庫構建LDA主題模型,形成工業工程崗位畫像。研究發現,大部分招聘企業位於東南沿海地區,以中型企業為主,企業看重工作經驗超過學歷,對初級工業工程師企業更偏向要求專業技能基礎紮實,對高級工業工程師則更多偏向協調與管理等能力。工業工程人才培養單位應強化專業技能培養,提高動手操作能力,基於企業真實需求動態調整培養計劃,工業工程從業人員應了解基本就業情況與企業需求,完善自身發展規劃。
隨著「德國工業4.0」「美國先進位造夥伴計劃」「中國製造2025」三大國家製造戰略的提出,世界進入智能製造時代。智能製造對從業人員勝任能力提出了全新的要求,這就需要人才培養單位和從業者迅速做出適應性變革。
製造業是工業工程人才的基礎性和主導性就業行業,智能製造背景下用人單位的工業工程崗位需求特徵是人才培養單位調整培養方案的基本依據。我國高校工業工程人才培養體系與企業實際需求存在一定的內容和時間脫節,不同企業對工業工程崗位的勝任要求也有所不同。
傳統上,培養單位通過訪談調查等方式了解用人單位的崗位需求特徵,據此調整專業人才培養方案,存在樣本容量小、多樣性差和調查成本高、效率低的缺陷,通過網絡招聘數據挖掘分析,構建智能製造背景下工業工程崗位畫像,可以有效克服傳統方法的缺陷,幫助高校更好地培養工業工程人才和從業人員更好地成長發展。
一、數據挖掘應用概況
國外將數據挖掘應用於招聘管理比國內早。國外研究表明:可以通過文本分析方法對非數值數據進行分析,但是由於英語與漢語在句法結構方面存在很大差異,中文具有與英文不同的四種分詞算法,分別是基於自定義搭配詞組的分詞方法、基於中文統計的分詞方法、基於理解的分詞方法和基於重組的分詞方法。
國內數據挖掘研究主要有三個方向:一是問題驅動型研究;二是數據挖掘算法研究;三是基於雲計算的數據挖掘研究。最近幾年,招聘研究開始轉向數據挖掘分析方向。
本文通過網絡爬蟲獲取工業工程網絡招聘數據中的基本信息與職業信息,基於文本分析量化處理以上數據,利用LDA主題模型從繁雜的崗位信息提取出主題,進而了解工業工程招聘信息背後的關聯。
二、工業工程崗位招聘信息數據獲取與處理分析
(一) 工業工程崗位招聘信息的採集與預處理
工業工程崗位招聘數據的精確有效會影響崗位畫像成型,是分析工作的基礎。很多企業的招聘信息在公司官網發布,但是獲取每家企業官網招聘信息工作量龐大且困難。而招聘網站信息更加全面、更新及時,可以了解到各行各業的招聘標準。所以本文擬通過爬取前程無憂招聘網站信息採集研究數據。
1.工業工程崗位招聘信息採集
崗位信息採集流程如下:首先,通過Pycharm編寫程序,涉及Html 代碼分析、正則表達式等,應用了requests、urllib、lxml等庫。其次,設定爬取的崗位信息、地區範圍等。最後,通過lxml庫將爬取到的信息保存到Excel表中。
一個前程無憂網站的招聘界面主要包括了企業信息、職位信息、相似崗位等內容。根據研究的需要,決定爬取企業名稱、崗位、學歷、薪水、企業性質、企業規模與職位要求,共7個方面信息。對「工業工程」崗位進行搜索,爬取到前程無憂(51job) 網站191頁共8247條數據,剔除數據後考慮到樣本容量和數據全面性問題,對與「工業工程」對等的兩個關鍵詞「IE」與「精益生產」進行搜索,分別抓取到154頁共7140條數據和115頁共5548條數據,與「工業工程」關鍵詞合併獲取460頁共20835條數據。
2.工業工程崗位招聘信息預處理
爬取到的崗位數據會存在許多不合要求的數據,需要對其進行數據清洗,主要涉及去除重複數據、某項信息空白的數據、信息採集錯誤數據與薪資單位的統一,以及去除職位要求的一些非正常字符。具體處理包括:
(1) 將學歷劃分為博士、碩士、本科、大專、高中、中專、中技與初中及以下。
(2) 將不同的薪水單位,如萬元/年、萬元/月、千元/月等,通過算法統一為千元/月。
(3) 將企業性質劃分為外資、合資、民營和國營等。
(4) 將企業規模劃分為10000人以上、5001-10000 人、1001-5000 人、501-1000 人、151-500人、51-150人與少於50人等。
(5) 將經驗要求劃分為0到10年不等。
(6) 將不同地區劃分,如省、省—市、市—區,通過操作統一為市級。
(二) 工業工程崗位招聘信息一般性統計分析
完成數據爬取與數據清洗後,得到可以進行一般統計分析的數據。本文使用Tableau軟體與Excel軟體對數據進行一般性統計分析。
1.單一維度統計分析
利用Tableau軟體的地理圖功能,生成工業工程崗位招聘企業的地域分布圖,發現工業工程崗位在東南沿海城市、珠三角地區和長三角地區需求企業最為密集,區域企業數量達到200甚至300家以上;京津冀、湖北、四川、重慶一帶需求企業比較密集;而在偏遠省份,如雲南、新疆等地,用人企業僅在省會城市及其周圍。可見工業工程崗位需求強度與我國社會經濟發展空間分布基本吻合。
從用人企業性質分布可見,首先民營企業對工業工程崗位需求旺盛,佔到所有企業的一半,反映了民營企業對生產優化及成本控制的高度重視;其次是外資企業(非歐美)、合資企業、外資企業(歐美) 及國企等。從招聘崗位薪資分布看,月薪5千元~10千元崗位2753個,月薪10千元~15千元崗位957個,月薪低於5千元或高於15千元的崗位數量大大減少。
總體來看,月薪15 千元以內的崗位數量為3956 個,佔崗位總數(4818個) 的82%,基本符合二八定律。從招聘位學歷要求看,大專需求最大,本科需求次之,兩者合計佔到總需求的90%以上;高中、中專需求相當,共約佔總需求的8%左右;中技約佔1%;碩士佔比不到1%;初中及以下很少;博士需求極少。從招聘企業規模看,工業工程崗位需求最大的招聘企業規模為1001-5000人,其次是151-500人的企業,之後依次是501-1000人、50-150人、10000人以上、5001-10000人及少於50人的企業。
2.多維度統計分析
結合區域崗位數量與平均薪資兩個維度看,深圳市是招聘工業工程崗位最多的地區,達到近600個崗位;其次是上海和東莞,約300個崗位;再次為蘇州、廣州,約250個崗位;北京、青島、溫州排在後三位首先,北京市平均月薪資最高,達到月薪14+千元;其次為上海和寧波,分別達到月薪12千元與11+千元;平均薪資最低的是成都,約為8千元。
由上可見,區域招聘崗位數量並不影響崗位平均薪資,兩者之間無明顯關聯性。從工作經驗、學歷與薪資關係看,工作經驗與薪資正相關,10年以上經驗的工業工程師平均月薪達到20千元以上,入職一年以內平均月薪酬約為6.5 千元,4年經驗之後月薪資增長加快;具有博士學歷的工業工程從業人員平均月薪達到23千元左右,碩士月薪約為14千元,本科月薪約為11千元,中技、中專、高中和初中學歷從業者月薪酬差異很小,月薪約為7千元。從高中到博士學歷的月薪資增速明顯加快。
三、工業工程師崗位畫像構建
(一) 崗位畫像預處理
崗位畫像製作基於文本分析,需要對崗位信息進行文本分詞、停用詞過濾等處理製作成語料庫。本文選擇jieba分詞庫結合python作為信息處理工具。由於LDA模型無法識別數字與中英文混合輸入,故對LDA模型語料庫的部分詞語進行漢字化,如「5S」變為「現場管理」等。
1.文本分詞
將中文進行分詞是文本數據挖掘的必經步驟。英文中每個詞都是以空格為界分開的,很容易實現分詞。中文與英文很不相同,中文一個字遇到另外一個字,就能產生不同的組合,極大增加了分詞的難度。目前中文發展出三種分詞方式,分別為統計、人工智慧和字符匹配方法。本文利用的jieba中文分詞庫基於字符匹配方法進行分詞。
2.停用詞過濾
停用詞是指在語句中沒有實際意義的詞。一類是輔助人類表述,沒有實際意義,包括連詞、介詞、助詞等,諸如「地」「與」等。另一類是「大家」之類詞語,對文本分析無明顯的意義。最後一類是阿拉伯數字、標點符號等。停用詞過濾主要是為了減少無關意義的詞對文本分析造成幹擾,提高文本分析的精確性。
3.崗位畫像詞典構建
在文本分詞的過程中,容易出現專業詞彙分割現象,造成對相關信息分析的影響,導致實驗結果不準確。所以,需要結合工業工程崗位招聘信息的一些特點,建立一個工業工程崗位相關技能詞典,保證詞典中詞語或專業詞彙不會在分詞時被分割。技能詞典包括專業詞彙:現場管理、現場改善、產能評估、設備管理、作業指導書、管理成本、評估規劃、工藝改善、改善項目、生產流程、質量管理、布局規劃、工藝流程、成本控制、智能製造、標準工時、標準化、生成計劃、生產管理、動作分析、七大手法、產線規劃、生產線分析;基本技能:學習能力、工作能力、語言表達能力、團隊協作、團隊建設、管理能力、決策能力、合作精神、溝通協調、領導能力、工作經驗、思維能力、溝通能力、團隊精神、抗壓能力、客戶需求、上進心、邏輯思維;基礎要求:辦公軟體、專業繪圖軟體、本科、專科、碩士、博士、英語四級、英語六級、工作地點;福利待遇:五險一金、法定假日、帶薪假、團建、周末雙休、帶薪年假、績效獎金、年終分紅、加班補貼、專業培訓、團隊聚餐、交通補助。合計四個維度,共62個詞彙。
(二) 崗位畫像分析
崗位畫像分析主要圍繞詞雲圖與LDA 模型,利用企業給出的崗位信息處理語料庫,生成詞雲圖與建立LDA模型。
1.崗位畫像詞雲圖分析
詞雲圖針對崗位信息的欄位內容進行處理與分析,了解企業對工業工程崗位的要求。為了更好地表述這個問題,針對數據預處理階段的文本進行jieba庫的中文分詞、停用詞處理和建立專業詞典等方式,排除數據中無意義的詞語、標點或短於一個字符的欄位,如「強」「,」「精通」等,建立專業詞典避免專業詞彙被分詞。首先是統計崗位信息語料庫中的不同短語或專業詞彙出現的詞頻,隨後選取詞頻排在前列的100個詞,利用ableau統計詞頻繪製出詞雲圖。發現崗位信息中提到次數最多的是「經驗」,其次是「成本」,再次「溝通」。根據詞雲圖初步得出工業工程崗位畫像:在基本條件方面,企業看重經驗遠遠超過學歷,理工科出現頻率高,對英語有一定的要求;從專業方面看,極其重視AutoCAD等專業製圖軟體的使用,關註標準作業程序、改善、物流、生產線、工藝流程等專業知識與能力;在個人綜合素質方面,重視溝通能力、邏輯思維、責任心、協調等。
2.崗位畫像LDA模型分析
詞雲圖主要根據詞頻展現工業工程的崗位畫像,維度單一,並不精準。為了更好地研究,可以利用LDA主題模型提取相關主題,得出每個主題的關鍵詞。利用之前提取的語料庫,使用Gensim庫建立LDA模型,設定2~4個主題,設置隨機種子為0~3,經過反覆測試,最終選擇最優結果為2個主題,隨機種子數為1。利用pyLDAvis實現可視化。主題一和主題二沒有交集,說明之間差異大、聯繫少。
圖1 主題一
圖2 主題二
如圖1 所示主題一的發生概率為52.4%,代表詞語是優化、生產線、標準工時、標準作業程序、研究等,反映崗位畫像為初級工業工程師,注重優化生產能力,重視標準作業程序、標準工時與研究等。如圖2所示主題二發生概率為47.6%,代表詞語包括質量、控制、現場管理、管理工作等,反映崗位畫像為高級工業工程師,注重管理方向,更注重控制與管理,對物料、成本控制、質量體系有偏好。
四、崗位畫像對工業工程人才培養的啟示
(一) 對培養單位的啟示
從學歷要求可以看出,大專學歷的工業工程人才需求最大,其次是本科學歷,兩者佔據了所有企業需求的絕大部分,接下來分別為中專、高中、中技、碩士、初中及以下,博士最少。表明製造業企業對具備一定專業技能知識的應用型人才更加偏好,而對低技能水平或高研究水平的人才需求較少。從相應學歷對應的學校學制與課程設置看,大專為三年制,比本科學制短,且大專的課程設置更加偏向應用性,而本科更注重理論知識的學習或者學術研究素養的培養,相比大專離企業的應用需求有一定距離。同時,大專生較本科生就業姿態更接地氣,要求的薪資相對本科更低,企業需要付出的初期培養成本更低,對於從校園到工廠培養機制體系不夠完善、利潤空間較小的製造企業而言,更願意招聘大專生。而碩士、博士等研究型人才的中低端製造業需求量很低。相較於學歷,企業更看重經驗,對理工科學生有偏愛,對英語有一定的要求,極其重視專業製圖軟體的使用,重視溝通能力、邏輯思維、責任心和協調等。企業對初級工業工程師要求專業技能基本功掌握紮實,對高級工業工程師則更注重管理與協調等方面能力。
綜上所述,首先,培養單位要科學規劃培養目標,明確學生定位。這一點在本科和碩士研究生層面尤為重要,必須釐清純粹應用導向還是研究導向,應用導向強化技能培養,課程以解決具體問題為牽引;而研究導向則強化能力培養,課程以應用數學和基礎理論為主。如國外頂尖高校和國內清華大學、重慶大學等國內頂尖高校的工業工程系以能力培養為導向,從其培養目標和課程設置一目了然;處於中下層次的本科院校可以走兼顧之路,能力和技能並重。對於大專以下層次必須堅定走技能之路,培養定位就是基層工業工程人員,必須重視對工業工程專業學生基本技能的培養。
其次,儘早讓學生了解初級工業工程師與高級工業工程師的區別。重視學生對個人職業發展生涯的規劃,引導學生充分利用課餘時間和寒暑假補充課程體系之外的必要知識,幫助學生掌握更加紮實的基本專業技能,如AutoCAD應用、辦公軟體Office應用、標準化知識、工藝流程改善、生產流程改進及生產布局優化等技能,加強動手實踐能力。
再次,強化學生創新能力的培養,培育啟發式思維模式,為學生參加雙創活動、大創活動、學科競賽、挑戰杯等拓展思維、視野和能力邊界的活動制定激勵措施和營造支持氛圍,並將其納入學分體系。
最後,讓學生了解「校園人」與「企業人」之間需要經歷一段艱苦的歷程,應該提前進行思想上和技能上的準備;積極建立校企合作,讓學生更早接觸企業,更早認知企業運行模式,增強就業能力和成長潛力。
(二) 對工業工程學生的啟示
工業工程企業專業人才的需求大部分在東南沿海城市,尤其是珠三角地區與長三角地區需求旺盛,京津冀、湖北、四川和重慶等地的製造業發展也已經具有較好的基礎與規模。最需要工業工程及其相關專業人才的招聘企業規模為1001~5000人,其次為151~500人的企業。大多數工業工程月薪資在5千元~15千元的範圍,低於月薪5千元或者15千元以上的崗位大大減少。深圳對工業工程崗位的需求最多,地區崗位的數量不影響平均薪資水平。無需經驗和一年經驗的從業者月薪約為6.4千元,從兩年經驗開始薪資漲幅開始逐漸向好,從月薪7.4 千元逐漸漲到十年以上的月薪20.2千元。中技、初中及以下、中專與高中學歷的人群就業月薪資均偏低,約為6千元~7千元,從大專到博士工資逐步提升,變化範圍為月薪8千元到20+千元,博士月薪資明顯高於碩士研究生。
綜上所述,對於工業工程學生而言,需要充分了解工業工程崗位類型與工作內容。根據LDA模型,初級工業工程人才與高級工業工程人才需要具備的技能與關注的方向不同,物流工程和質量管理等也是工業工程學生可以就業的崗位,因此要充分了解自己擬從事的工作和工作內容,才能更好地做好短期和長期的職業規劃。同時,必須積極參加實習,積累工業工程相關的各種工作經驗,努力提升工業工程專業技能。在校期間更多地參加實習活動,積累相應的工作經驗,加強動手實踐能力,更好了解工業工程崗位的工作內容,豐富自己的知識能力體系,鍛鍊工作中的溝通能力。對於學生而言,在學生時代,努力學習掌握工業工程相關的專業技能,充分提高分析與解決問題的能力,培育良好的全局觀,並通過終身學習適應快速的社會發展與技術進步,可以幫助自己順利實現從學生到初級工業工程師的轉變,最終到達高級工業工程師或更高的職業目標。
更多閱讀: