一、背景
隨著大數據技術應用的越來越廣泛,在各行各業出現了大量的大數據人才崗位的空缺,而大數據的系統性教學在高校尚未普及開來,就出現了高校畢業生在大數據領域就業變得很困難的社會現狀,企業對新型大數據分析和預測技術人才的熱情和需求正在超過傳統的商業智能和信息管理人才,未來五年內大數據人才缺口會持續增長。
二、現狀
對於高校而言,傳統的教育模式更加偏向理論教學,這種模式與就業市場綜合性人才的需求相去甚遠,培育新型大數據綜合人才以適應社會需求成為高校目前亟待解決的問題。高校啟動大數據人才培養計劃,專業建設困難重重,課程體系待完善,大數據教學科研入門難,各大高校的大數據專業處於起步階段,人才培養課程體系缺乏系統性,大數據教學科研資源匱乏,可配置和指導實驗環境的專業師資不足。基礎實驗環境薄弱,大數據實驗難開展,大數據分布式軟體系統安裝、配置難度大,實驗環境容易被破壞,實驗數據、實驗教案、實驗手冊不足,實驗開展束手束腳,項目實訓缺失,教學效果與就業率打折扣,缺少大數據項目實訓,難以培養實用型人才所需的專業項目能力,高校大數據專業學習與實際應用脫軌,教學效果與就業率打折扣。
三、目標
實驗室建設目標是作為大數據教學實訓平臺,包括數據分析教學與大數據分析實訓平臺,主要滿足大數據相關專業的課程教學與實訓需要。實驗室的設計落實「產、學、研、用」一體化的思想和模式中的「學、用」,從教學、實踐和使用多方面注重專業人才和特色人才的培養。利用虛擬化教學資源,搭建教學系統和集群平臺,將理論學習、實踐教學和大數據項目實戰融為一體,由難而易、循序漸進,逐步提升學生的學習技能和實踐水平,提高「學」的質量和成效。
四、內容
1、整體架構
採用虛擬化容器技術、分布式集群部署方式進行基礎平臺構建,在高效的利用系統硬體資源的同時,靈活分配系統資源供學生進行實訓。從應用上,分為四個層次:硬體資源層、平臺支持層、實驗應用層、用戶操作層。
1)硬體資源層:由伺服器資源設備、網絡交換設備、實驗終端設備等硬體組成,通過分布式集群部署及管理,主要用於提供教學平臺、教學資源的硬體支撐,同時為大數據實驗資源提供計算能力和案例數據的存儲能力;
2)平臺支持層:主要提供學生申請實驗資源,保證每個學生使用獨立的實驗環境;
3)實驗應用層:提供學生五大課程開發環境及案例管理。開發環境包括:在線SSH、Python/R語言在線編譯環境、可視化開發環境、數據挖掘開發環境、統計分析開發環境、文本分析開發環境;
4)用戶操作層:根據角色不同,分為超級管理員、教師、學生,學生在線學習及上機實驗操作、教師對每個學生學習進行管理及分析。
2、課程
大數據實驗平臺主要滿足老師教學和學生實驗實訓的需要,提供教學課程對應的教學資源及實驗環境及課程配套資料,基本的課程分為六大類:大數據技術基礎、語言編程、數據可視化、統計分析、數據挖掘及AI課程,所有課程及配套數據、算法源碼全部提供,老師根據學生具體情況定製課程時間表,以保證給予學生最優質的大數據教學環境。
3、實驗環境
1)大數據技術基礎實驗環境
2)語言編程環境
R語言編程環境:
Python2編程環境:
Python3編程環境:
4、預期效果
1)學生對大數據及數據挖掘的概念及過程形成比較清晰的認識。
2)了解大數據/數據挖掘崗位目前的就業形式和前景,了解需要掌握的技能。
3)掌握一定的大數據/數據挖掘技能和工具,體驗一個實際項目的全過程。
4)在學校老師的帶領下能完成一個簡化版的企業項目。
5)協助學生對自己後續的職業發展做出相對合理的規劃與定位。