原標題:機器學習、深度學習算法原理與案例實踐暨Python大數據綜合應用高級研修班
通信和信息技術創新人才培養工程項目辦公室
通人辦〔2018〕 第5號
機器學習、深度學習算法原理與案例實踐暨Python大數據綜合應用高級研修班
一、課程簡介
課程強調動手操作;內容以代碼落地為主,以理論講解為根,以公式推導為輔。共4天8節,講解機器學習和深度學習的模型理論和代碼實踐,梳理機器學習、深度學習、計算機視覺的技術框架,從根本上解決如何使用模型、優化模型的問題;每次課中,首先闡述算法理論和少量公式推導,然後使用真實數據做數據挖掘、機器學習、深度學習的數據分析、特徵選擇、調參和結果比較。
二、課程目標
通過課程學習,可以理解機器學習的思維方式和關鍵技術;了解深度學習和機器學習在當前工業界的落地應用;能夠根據數據分布選擇合適的算法模型並書寫代碼,初步勝任使用Python進行數據挖掘、機器學習、深度學習等工作。
三、課程特點
課程重視代碼實踐,使用金融、氣象、農業、交通、安防等工業界實際數據(數據已脫敏)進行機器學習模型的落地應用。雖然課程堅持推導公式,但更重視機器學習和深度學習的原理與實操;將實際工作中遇到的行業應用和痛點做最直觀切實的展示;重視算法模型的同時,更強調實際問題中應該如何模型選擇、特徵選擇和調參。講授者同時在多家企業任職首席或顧問,有豐富的工業經驗,能夠保證聽者儘快了解數據挖掘、機器學習、深度學習的本質和實踐應用。
四、講師簡介
鄒博,中國科學院副研究員,天津大學軟體學院創業導師,成立中國科學院鄒博人工智慧研究中心(杭州站),在翔創、天識、睿客邦等公司擔任技術顧問,研究方向機器學習、深度學習、計算幾何,應用於大型氣象設備圖像與文本挖掘、股票交易與預測、量子化學醫藥路徑尋優、傳統農資產品價格預測和決策等領域。
尹老師,數據科學家,浙江大學物理學博士,浙江某高校數據科學專業負責人,兼任某網絡科技上市公司大數據總監,受聘擔任多家大數據教學機構主講教師,開發多套python高級編程、機器學習、網絡爬蟲與文本挖掘系列課程,10+年python軟體開發數據產品經驗,熟悉R Java等多種程式語言,具有豐富的python統計建模、數據挖掘、大數據技術教學經驗,先後為中國交通銀行,平安保險公司等數十家知名機構主講python課程。
2017年成立中科院鄒博人工智慧研究中心(杭州站)
2017年9月22日-24日 京東方集團機器學習與計算機視覺企業內訓
2017年9月11日-14日 中國電信2017年數據分析與挖掘人才技能評價訓練營
2017年8月3日-7日 北京理工大學機器學習和深度學習高校師資培訓
五、課程模塊
1、機器學習、深度學習算法原理及案例實現
專題模塊
內容設置
代碼與案例實踐
第1講:Python機器學習與TensorFlow
解釋器Python2.7/3.6與IDE:Anaconda/Pycharm
列表/元組/字典/類/文件
numpy/scipy/matplotlib/panda的介紹和典型使用
scikit-learn的介紹和典型使用
TensorFlow典型應用
典型圖像處理
多種數學曲線、多項式擬合
快速傅立葉變換FFT、奇異值分解SVD
Soble/Prewitt/Laplacian與卷積網絡
卷積與(指數)移動平均線
股票數據分析
缺失數據的處理
環境數據異常檢測和分析
第2講:多元線性回歸與Logistic回歸
線性回歸
Logistic/Softmax回歸
廣義線性回歸
L1/L2正則化
Ridge與LASSO
Elastic Net
梯度下降算法:BGD與SGD
特徵選擇與過擬合
Softmax回歸的概念源頭
最大熵模型
K-L散度
股票數據的特徵提取和應用
鐵達尼號乘客缺失數據處理和存活率預測
環境檢測數據異常分析和預測
模糊數據查詢和數據校正方法
PCA與鳶尾花數據分類
二手車數據特徵選擇與算法模型比較
廣告投入與銷售額回歸分析
鳶尾花數據集的分類
TensorFlow實現線性回歸
TensorFlow實現Logistic回歸
第3講:決策樹和隨機森林
熵、聯合熵、條件熵、KL散度、互信息
最大似然估計與最大熵模型
ID3、C4.5、CART詳解
決策樹的正則化
預剪枝和後剪枝、Bagging
隨機森林
不平衡數據集的處理
利用隨機森林做特徵選擇
使用隨機森林計算樣本相似度
異常值檢測
隨機森林與特徵選擇
決策樹應用於回歸
多標記的決策樹回歸
決策樹和隨機森林的可視化
葡萄酒數據集的決策樹/隨機森林分類
泰坦尼克乘客存活率估計
第4講:SVM
線性可分支持向量機
軟間隔
損失函數的理解
核函數的原理和選擇
SMO算法
支持向量回歸SVR
多分類SVM
原始數據和特徵提取
調用開源庫函數完成SVM
葡萄酒數據分類
數字圖像的手寫體識別
MNIST手寫體識別
SVR用於時間序列曲線預測
SVM、Logistic回歸、隨機森林三者的橫向比較
第5講:卷積神經網絡CNN
神經網絡結構,濾波器,卷積
池化,激活函數,反向傳播
目標分類與識別、目標檢測與追蹤
經典AlexNet、VGGNet、GoogleLeNet
ResNet、Inception-V3/V4
搭建自己的卷積神經網絡
數字圖像識別、人證合一驗證
基本OCR系統
基於CNN的圖像識別框架
卷積神經網絡調參經驗分享
第6講:圖像視頻的定位與識別
卷積深度與卷積核關係
視頻關鍵幀處理
物體檢測與定位
RCNN,Fast-RCNN,
Faster-RCNN
MaskRCNN、YOLO、FaceNet
遷移學習與人臉檢測
OCR字體定位和識別
睿客識雲、氣象識別
第七講:循環神經網絡RNN
RNN基本原理
LSTM、GRU、Attention
編碼器與解碼器結構
特徵提取:word2vec
Seq2seq模型
機器翻譯、文本摘要、閱讀理解問答系統
圖片標註與圖片問答
HMM分詞、文本摘要的生成
智能對話系統和SeqSeq模型
閱讀理解的實現與Attention
第八講:生成對抗網絡GAN與強化學習RL
生成與判別
貝葉斯、HMM到深度生成模型
GAN對抗生成神經網絡
DCGAN/Conditional GAN
InfoGan/ Wasserstein GAN
馬爾科夫決策過程
貝爾曼方程、最優策略
策略迭代、值迭代
Q Learning、SarsaLamda、DQN/A3C/ELF
圖片生成、看圖說話
對抗生成神經網絡調參經驗
飛翔的小鳥遊戲
基於增強學習的遊戲學習
DQN的實現
2、python高級編程與大數據綜合應用
第一天
第1講:Python數據科學環境搭建
1. Anaconda套件
2. Python開發IDE介紹
3. 數據科學相關庫簡介
4. Jupyter notebook基本使用
5. Markdown基礎語法
第2講:Python編程基礎
1.基礎數據結構--列表
2.基礎數據結構--字符串
3.基礎數據結構—字典
4.Python基礎語法-控制流
5.Python基礎語法-函數
6.Python異常處理
第3講:文件組織與處理
1. 文件讀寫
2. 文件組織
3. 處理Excel電子表格
4. 處理PDF和Word文檔
5. 處理CSV和JSON數據
第4講:圖像組織與處理
1.Pillow庫簡介
2.處理Image數據類型
3.圖像剪裁
4.圖像旋轉和翻轉
5.圖像繪製
第二天
第5講:Python編程進階
1.Python基礎-類
2.Python基礎-模塊
3.迭代器與生成器
4.Python標準庫介紹
5.案例:利用Python解決八皇后問題
第6講:Python與資料庫
1. Python的資料庫支持
2. Python與SQLite
3. Python與MySQL
4. Python與NoSQL
5. 案例:構建簡單的Python資料庫應用
第7講:Python文本處理
1.Python的字符串操作
2.Python與正則表達式
3.自然語言處理包NLTK
4.文本語料與詞彙資源
5.中文分詞介紹(jieba)
6.文本挖掘預處理技術
第三天
第8講:Python網絡爬蟲
1.網絡爬蟲技術基礎
2.基礎Python爬蟲庫(urllib/Requests)
3.「漂亮」的爬蟲庫-Beautiful Soup
4.靜態網頁爬取案例分享
5.Ajax和DHTML網站爬取
第9講:Python數據分析
1. 利用Python進行數據操作
2. 數值計算- numpy基礎
3. 基礎繪圖與可視化- matplotlib
4. 數據分析庫-pandas
5. 案例:美國兒童的姓名趨勢探索分析
第10講:Python數據可視化
1.數據可視化簡介
2.Python可視化進階Seaborn
3.Python交互式可視化-Bokeh
4.互動性圖表的另一選擇-Plotly
5.詞雲介紹
第四天
(選修)
第11講:Python統計分析
1.科學計算庫scipy簡介
2.統計分析庫StatsModels簡介
3.概率與分布
4.參數估計和假設檢驗
5.統計模型與回歸分析
6.多元統計分析
第12講:Python機器學習
1.機器學習簡介與基本流程
2.常用機器學習算法介紹
3.機器學習中的預處理技術
4.特徵工程
5.模型評估與改進
6.案例:某銀行貸款違約風險預測
7.案例:鐵達尼號沉船倖存者預測
第13講:高性能Python與大數據處理
1.Python大數據處理技巧
2.Cython與numpy
3.PyPy簡介
4.分布式計算與Python
5.利用PySpark處理大數據
六、頒發證書
經考核合格可獲得國家工信部全國通信和信息技術創新人才培養工程《大數據挖掘與分析應用高級工程師》職業技術水平證書。該證表明持有者已通過相關考核,具備相應的專業知識和專業技能,並作為聘用、任職、定級和晉升的重要參考依據,全國通用。
七、時間與地點
模塊一: 2018年4月19日~22日 杭 州
模塊二: 2018年4月11日~15日 上 海
八、費用標準
參會費4900元/人(含專家授課費、教材考試費、證書申報、
場地等),食宿統一安排,費用自理。
九、聯繫方式
聯繫電話: 13718006076
微 信:13718006076
聯 系 人: 張 洪
郵 箱:2542361215@qq.com
附件:報名回執表
機器學習、深度學習暨python高級編程高級研修班報名回執表
(經研究我單位選派以下同志參加此次學習)
單位名稱
發票抬頭
發票稅號
選修模塊
□1、機器學習與深度學習(杭州班)
□2、python大數據綜合應用(上海班)
發票內容
□1、培訓費 □2、會議費 □3、會 務 費
繳款方式
□1、現 金 □2、刷 卡 □3、對公轉帳
參會人數:_ ___ 人
參會費用: _ ____元
參會
人員
名單
姓 名
職 務
手 機
電 子 郵 箱
住宿安排
□1、住 □2、不住 □3、待定
住宿標準
□1、雙人標間 □2、單間 □3、待定
對本課程的意見及建議
其它感興趣的課程
註:請確定參加人員從速報名,培訓報到前7日我們將以電子郵件的方式給您發送《報到通知》及學習軟體、課件,告知具體培訓地點、乘車路線等事宜。