2015年9月國務院出臺了《促進大數據發展行動綱要》,到2016年正式發布的《中華人民共和國國民經濟和社會發展第十三個五年規劃綱要》,提出大數據為基礎性戰略資源,大數據正逐步成為現代產業智慧化的基石,將成為任何一個企業的無形有價資產。西普教育響應國家創新驅動的發展戰略,強勢推出《全國高校大數據技術系列師資培訓》。大數據技術系列師資培訓旨在幫助各大高校深度了解企業的人才需求,強化大數據實訓和項目指導,提升高校教師大數據技術授課技能,加強校企之間的溝通交流以制定契合我國創新發展需求的大數據「複合型」人才培養方案,進而促進大數據學科建設和發展。
本系列培訓總共分為三期,結合企業人才崗位需求及行業發展與高校大數據教學要求為大數據專業老師量身定製。採用"核心技術講授+O2O實驗+項目案例實訓"模式,精理論重實踐。涵蓋了大數據核心技術知識體系:Hadoop生態圈、Scala、Kafka、Spark生態棧以及Python數據分析。由淺入深地講解大數據技術框架的設計思想和背後的執行原理,從易到難的進階性的案例實戰,最後以綜合性企業項目案例進行實戰演練。
本期培訓內容以數據處理流程為主線,包括數據清洗、數據建模和數據統計。以Hadoop和Spark兩個方向展開培訓。
Hadoop方向:從Hadoop架構設計到分布式系統架構的核心原理與實現;從計算與調度冗餘到高可用通用資源調度平臺的設計;從分布式存儲、分布式計算的概念介紹到應用案例剖析;從MapReduce編程模型到Hive的架構設計;從Hive原理介紹到數據清洗統計。通過學習本課程,能夠熟練地使用Hadoop進行應用開發。
Spark方向:從Scala基礎到Scala高級特性講解,便於更深入地了解Spark執行流程;從Spark架構設計到Spark整個生態棧的構建,更透徹地剖析分布式計算;從Spark Core中RDD的巧妙設計到Spark SQL中的DataFrame/DataSet數據封裝,更清晰地熟悉離線計算/交互式計算的執行流程。通過學習本課程,能夠熟練地使用Spark進行數據處理。
日期
時間
主題
大綱內容
備註
11月3日
09:00--12:00
Hadoop架構設計與RPC通信
大數據分析系統流程概述
理論+實踐
Hadoop架構設計及環境搭建
理論+實踐
RPC框架實現
理論+實踐
14:00--17:00
HDFS實踐與Yarn架構
HDFS三大組件詳解及讀寫流程
理論+實踐
心跳機制
理論+實踐
HDFS java編程
理論+實踐
YARN架構設計及執行流程
理論+實踐
11月4日
09:00--12:00
MapReduce編程與Hadoop源碼剖析
MR編程實例(單詞統計、去重、排序、最值、平均值、Join操作)
理論+實踐
Shuffle執行流程分析
理論+實踐
Hadoop源碼剖析
理論+實踐
14:00--17:00
Hive實踐
Hive系統架構
理論+實踐
Hive shell操作及Java編程
理論+實踐
Hive源碼剖析
理論+實踐
11月5日
09:00--12:00
Scala基礎應用
Scala語法基礎、函數
理論+實踐
Scala集合
理論+實踐
Scala高級特性
理論+實踐
14:00--17:00
Spark架構與實踐
Spark的環境安裝與架構設計
理論+實踐
Spark RDD詳解及編程
理論+實踐
Spark SQL流程分析及編程
理論+實踐
會務費:1200元/人(含內部培訓資料)。
註:費用標準僅為本次訓費,培訓會涉及相關軟體安裝及計算機環境配置,建議老師自帶手提電腦
《西普教育研究院-高級大數據技術講師》證書
《NITE—高級軟體工程(大數據方向)》證書(工信部中國電子學會備案可查,證書費400元,自願獲取)。
證書樣本
序號
時間
地點
內容介紹
1
11月下旬-12月上旬
安徽
Zookeeper架構設計與實踐
Hbase架構設計與配置
Kafka架構設計與原理
Spark Streaming架構設計與流程分析
Python基礎與數據分析
2
12月下旬
哈爾濱
Flume架構設計與實踐
Sqoop架構設計與實踐
Spark交互式/實時數據分析案例
圍繞典型網際網路應用,進行一個完整用戶行為分析的場景實踐:
1. 用戶行為數據的採集、清洗與數據倉庫設計;
2. 進行多維度數據統計分析,將用戶行為以BI形式展示。
單位名稱
通信地址
發票抬頭
開票項目
培訓費
納稅人識別號
序號
姓名
性別
部門及職務
手機號碼
郵箱
身份證號(選填)
1
2
備註:身份證號:需要證書必須填寫;如果有特殊要求的請填寫此處。
西普教育
微信號 : xipujiaoyu
新浪微博:@西普教育
現已入駐:今日頭條、百度百家、搜狐號、一點資訊,歡迎訂閱