機器學習、深度學習算法原理與案例實踐暨Python大數據綜合應用...

2021-01-07 深圳熱線

原標題:機器學習、深度學習算法原理與案例實踐暨Python大數據綜合應用高級研修班

通信和信息技術創新人才培養工程項目辦公室

通人辦〔2018〕 第5號

機器學習、深度學習算法原理與案例實踐暨Python大數據綜合應用高級研修班

一、課程簡介

課程強調動手操作;內容以代碼落地為主,以理論講解為根,以公式推導為輔。共4天8節,講解機器學習和深度學習的模型理論和代碼實踐,梳理機器學習、深度學習、計算機視覺的技術框架,從根本上解決如何使用模型、優化模型的問題;每次課中,首先闡述算法理論和少量公式推導,然後使用真實數據做數據挖掘、機器學習、深度學習的數據分析、特徵選擇、調參和結果比較。

二、課程目標

通過課程學習,可以理解機器學習的思維方式和關鍵技術;了解深度學習和機器學習在當前工業界的落地應用;能夠根據數據分布選擇合適的算法模型並書寫代碼,初步勝任使用Python進行數據挖掘、機器學習、深度學習等工作。

三、課程特點

課程重視代碼實踐,使用金融、氣象、農業、交通、安防等工業界實際數據(數據已脫敏)進行機器學習模型的落地應用。雖然課程堅持推導公式,但更重視機器學習和深度學習的原理與實操;將實際工作中遇到的行業應用和痛點做最直觀切實的展示;重視算法模型的同時,更強調實際問題中應該如何模型選擇、特徵選擇和調參。講授者同時在多家企業任職首席或顧問,有豐富的工業經驗,能夠保證聽者儘快了解數據挖掘、機器學習、深度學習的本質和實踐應用。

四、講師簡介

鄒博,中國科學院副研究員,天津大學軟體學院創業導師,成立中國科學院鄒博人工智慧研究中心(杭州站),在翔創、天識、睿客邦等公司擔任技術顧問,研究方向機器學習、深度學習、計算幾何,應用於大型氣象設備圖像與文本挖掘、股票交易與預測、量子化學醫藥路徑尋優、傳統農資產品價格預測和決策等領域。

尹老師,數據科學家,浙江大學物理學博士,浙江某高校數據科學專業負責人,兼任某網絡科技上市公司大數據總監,受聘擔任多家大數據教學機構主講教師,開發多套python高級編程、機器學習、網絡爬蟲與文本挖掘系列課程,10+年python軟體開發數據產品經驗,熟悉R Java等多種程式語言,具有豐富的python統計建模、數據挖掘、大數據技術教學經驗,先後為中國交通銀行,平安保險公司等數十家知名機構主講python課程。

2017年成立中科院鄒博人工智慧研究中心(杭州站)

2017年9月22日-24日 京東方集團機器學習與計算機視覺企業內訓

2017年9月11日-14日 中國電信2017年數據分析與挖掘人才技能評價訓練營

2017年8月3日-7日 北京理工大學機器學習和深度學習高校師資培訓

五、課程模塊

1、機器學習、深度學習算法原理及案例實現

專題模塊

內容設置

代碼與案例實踐

第1講:Python機器學習與TensorFlow

解釋器Python2.7/3.6與IDE:Anaconda/Pycharm

列表/元組/字典/類/文件

numpy/scipy/matplotlib/panda的介紹和典型使用

scikit-learn的介紹和典型使用

TensorFlow典型應用

典型圖像處理

多種數學曲線、多項式擬合

快速傅立葉變換FFT、奇異值分解SVD

Soble/Prewitt/Laplacian與卷積網絡

卷積與(指數)移動平均線

股票數據分析

缺失數據的處理

環境數據異常檢測和分析

第2講:多元線性回歸與Logistic回歸

線性回歸

Logistic/Softmax回歸

廣義線性回歸

L1/L2正則化

Ridge與LASSO

Elastic Net

梯度下降算法:BGD與SGD

特徵選擇與過擬合

Softmax回歸的概念源頭

最大熵模型

K-L散度

股票數據的特徵提取和應用

鐵達尼號乘客缺失數據處理和存活率預測

環境檢測數據異常分析和預測

模糊數據查詢和數據校正方法

PCA與鳶尾花數據分類

二手車數據特徵選擇與算法模型比較

廣告投入與銷售額回歸分析

鳶尾花數據集的分類

TensorFlow實現線性回歸

TensorFlow實現Logistic回歸

第3講:決策樹和隨機森林

熵、聯合熵、條件熵、KL散度、互信息

最大似然估計與最大熵模型

ID3、C4.5、CART詳解

決策樹的正則化

預剪枝和後剪枝、Bagging

隨機森林

不平衡數據集的處理

利用隨機森林做特徵選擇

使用隨機森林計算樣本相似度

異常值檢測

隨機森林與特徵選擇

決策樹應用於回歸

多標記的決策樹回歸

決策樹和隨機森林的可視化

葡萄酒數據集的決策樹/隨機森林分類

泰坦尼克乘客存活率估計

第4講:SVM

線性可分支持向量機

軟間隔

損失函數的理解

核函數的原理和選擇

SMO算法

支持向量回歸SVR

多分類SVM

原始數據和特徵提取

調用開源庫函數完成SVM

葡萄酒數據分類

數字圖像的手寫體識別

MNIST手寫體識別

SVR用於時間序列曲線預測

SVM、Logistic回歸、隨機森林三者的橫向比較

第5講:卷積神經網絡CNN

神經網絡結構,濾波器,卷積

池化,激活函數,反向傳播

目標分類與識別、目標檢測與追蹤

經典AlexNet、VGGNet、GoogleLeNet

ResNet、Inception-V3/V4

搭建自己的卷積神經網絡

數字圖像識別、人證合一驗證

基本OCR系統

基於CNN的圖像識別框架

卷積神經網絡調參經驗分享

第6講:圖像視頻的定位與識別

卷積深度與卷積核關係

視頻關鍵幀處理

物體檢測與定位

RCNN,Fast-RCNN,

Faster-RCNN

MaskRCNN、YOLO、FaceNet

遷移學習與人臉檢測

OCR字體定位和識別

睿客識雲、氣象識別

第七講:循環神經網絡RNN

RNN基本原理

LSTM、GRU、Attention

編碼器與解碼器結構

特徵提取:word2vec

Seq2seq模型

機器翻譯、文本摘要、閱讀理解問答系統

圖片標註與圖片問答

HMM分詞、文本摘要的生成

智能對話系統和SeqSeq模型

閱讀理解的實現與Attention

第八講:生成對抗網絡GAN與強化學習RL

生成與判別

貝葉斯、HMM到深度生成模型

GAN對抗生成神經網絡

DCGAN/Conditional GAN

InfoGan/ Wasserstein GAN

馬爾科夫決策過程

貝爾曼方程、最優策略

策略迭代、值迭代

Q Learning、SarsaLamda、DQN/A3C/ELF

圖片生成、看圖說話

對抗生成神經網絡調參經驗

飛翔的小鳥遊戲

基於增強學習的遊戲學習

DQN的實現

2python高級編程與大數據綜合應用

第一天

第1講:Python數據科學環境搭建

1. Anaconda套件

2. Python開發IDE介紹

3. 數據科學相關庫簡介

4. Jupyter notebook基本使用

5. Markdown基礎語法

第2講:Python編程基礎

1.基礎數據結構--列表

2.基礎數據結構--字符串

3.基礎數據結構—字典

4.Python基礎語法-控制流

5.Python基礎語法-函數

6.Python異常處理

第3講:文件組織與處理

1. 文件讀寫

2. 文件組織

3. 處理Excel電子表格

4. 處理PDF和Word文檔

5. 處理CSV和JSON數據

第4講:圖像組織與處理

1.Pillow庫簡介

2.處理Image數據類型

3.圖像剪裁

4.圖像旋轉和翻轉

5.圖像繪製

第二天

第5講:Python編程進階

1.Python基礎-類

2.Python基礎-模塊

3.迭代器與生成器

4.Python標準庫介紹

5.案例:利用Python解決八皇后問題

第6講:Python與資料庫

1. Python的資料庫支持

2. Python與SQLite

3. Python與MySQL

4. Python與NoSQL

5. 案例:構建簡單的Python資料庫應用

第7講:Python文本處理

1.Python的字符串操作

2.Python與正則表達式

3.自然語言處理包NLTK

4.文本語料與詞彙資源

5.中文分詞介紹(jieba)

6.文本挖掘預處理技術

第三天

第8講:Python網絡爬蟲

1.網絡爬蟲技術基礎

2.基礎Python爬蟲庫(urllib/Requests)

3.「漂亮」的爬蟲庫-Beautiful Soup

4.靜態網頁爬取案例分享

5.Ajax和DHTML網站爬取

第9講:Python數據分析

1. 利用Python進行數據操作

2. 數值計算- numpy基礎

3. 基礎繪圖與可視化- matplotlib

4. 數據分析庫-pandas

5. 案例:美國兒童的姓名趨勢探索分析

第10講:Python數據可視化

1.數據可視化簡介

2.Python可視化進階Seaborn

3.Python交互式可視化-Bokeh

4.互動性圖表的另一選擇-Plotly

5.詞雲介紹

第四天

(選修)

第11講:Python統計分析

1.科學計算庫scipy簡介

2.統計分析庫StatsModels簡介

3.概率與分布

4.參數估計和假設檢驗

5.統計模型與回歸分析

6.多元統計分析

第12講:Python機器學習

1.機器學習簡介與基本流程

2.常用機器學習算法介紹

3.機器學習中的預處理技術

4.特徵工程

5.模型評估與改進

6.案例:某銀行貸款違約風險預測

7.案例:鐵達尼號沉船倖存者預測

第13講:高性能Python與大數據處理

1.Python大數據處理技巧

2.Cython與numpy

3.PyPy簡介

4.分布式計算與Python

5.利用PySpark處理大數據

六、頒發證書

經考核合格可獲得國家工信部全國通信和信息技術創新人才培養工程《大數據挖掘與分析應用高級工程師》職業技術水平證書。該證表明持有者已通過相關考核,具備相應的專業知識和專業技能,並作為聘用、任職、定級和晉升的重要參考依據,全國通用。

七、時間與地點

模塊一: 2018年4月19日~22日 杭 州

模塊二: 2018年4月11日~15日 上 海

八、費用標準

參會費4900元/人(含專家授課費、教材考試費、證書申報、

場地等),食宿統一安排,費用自理。

九、聯繫方式

聯繫電話: 13718006076

微 信:13718006076

聯 系 人: 張 洪

郵 箱:2542361215@qq.com

附件:報名回執表

機器學習、深度學習暨python高級編程高級研修班報名回執表

(經研究我單位選派以下同志參加此次學習)

單位名稱

發票抬頭

發票稅號

選修模塊

□1、機器學習與深度學習(杭州班)

□2、python大數據綜合應用(上海班)

發票內容

□1、培訓費 □2、會議費 □3、會 務 費

繳款方式

□1、現 金 □2、刷 卡 □3、對公轉帳

參會人數:_ ___ 人

參會費用: _ ____元

參會

人員

名單

姓 名

職 務

手 機

電 子 郵 箱

住宿安排

□1、住 □2、不住 □3、待定

住宿標準

□1、雙人標間 □2、單間 □3、待定

對本課程的意見及建議

其它感興趣的課程

註:請確定參加人員從速報名,培訓報到前7日我們將以電子郵件的方式給您發送《報到通知》及學習軟體、課件,告知具體培訓地點、乘車路線等事宜。

相關焦點

  • Python大數據綜合應用 :零基礎入門機器學習、深度學習算法原理與案例
    機器學習、深度學習算法原理與案例實現暨Python大數據綜合應用高級研修班一、課程簡介
  • 【推薦】基於MATLAB編程、機器學習、深度學習在圖像處理中的實踐技術應用
    因此,為了幫助廣大科研人員更加系統地學習圖像處理、機器學習和深度學習的基礎理論知識及對應的代碼實現方法,Ai尚研修特舉辦「MATLAB圖像處理與機器學習技術應用培訓班」 培訓班,旨在幫助學員掌握圖像處理的基礎知識,以及經典機器學習算法和最新的深度神經網絡、遷移學習、對抗生成網絡等算法的基本原理及其MATLAB編程實現方法。
  • 「人工智慧師資班」(Python機器學習,圖像識別與深度學習,深度學習與NLP,知識圖譜,強化學習)
    本次培訓分為Python機器學習,圖像識別與深度學習,深度學習與NLP,知識圖譜和強化學習五大專題。本次培訓由權威專家主講,提供實驗環境及實驗數據,並提供配套資料,通過剖析工程案例展現機器學習、深度學習落地全過程。培訓暫定2021年1月5日開始,每個專題6天左右,一共28天,直播集訓。本次培訓由淺入深,面向0基礎、不懂機器學習、不具備任何Python基礎的老師和同學。
  • 算法應用|機器學習python應用,初識機器學習是怎樣滴感受?
    本系列文章主要介紹機器學習在實踐中的應用,介紹利用 Python 的生態環境,使用機器學習的算法來解決工程實踐中的問題,而不是介紹算法本身。本系列文章參考了《機器學習Python實踐》,會通過例子一步一步地引導大家使用機器學習來處理和分類與回歸模型相關的問題。
  • python深度學習---帶你從入門到精通
    為輔助提高廣大科研工作者的使用python深度學習技術,我們舉辦了本次《python深度學習實踐技術及應用線上培訓》,利用大量的案例講解與實操練習讓大家更深入便捷的運用到工作學習中,也方便各個領域可以更好地交叉融合、擴展應用。
  • 算法應用|機器學習python應用,簡單機器學習項目實踐
    上一篇文章中介紹了機器學習的簡單知識,還有python中進行機器學習實踐需要的生態環境,接下來將會通過鳶尾花分類這個例子對機器學習做一個簡要的介紹。通過一步一步地實現這個項目來介紹以下內容。導入和使用python中機器學習的各個方面的類庫。
  • 常見面試算法:k-近鄰算法原理與python案例實現
    定義: 監督學習? 非監督學習?KNN 是一個簡單的無顯示學習過程,非泛化學習的監督學習模型。在分類和回歸中均有應用。>【項目.源碼】深度學習視覺計算輔助良品檢驗,如何做布匹疵點識別?老司機帶帶你:用GAN去除(愛情)動作片中的馬賽克和衣服《21個項目玩轉深度學習:基於TensorFlow的實踐詳解》完整版PDF+附書代碼爬取百萬github用戶數據
  • python機器學習預測分析核心算法.pdf
    本書為不具備數學或統計背景的讀者量身打造,詳細介紹了如何:  ● 針對任務選擇合適算法;● 對不同目的應用訓練好的模型;  ● 學習數據處理機制,準備數據;● 評估模型性能以保證應用效果;  ● 掌握Python 機器學習核心算法包;● 使用示例代碼設計和構建你自己的模型;  ● 構建實用的多功能預測模型。
  • 資源│機器學習、深度學習、算法工程師等 AI 相關崗位面試需要知識
    資料圖解李金洪的《深度學習之TensorFlow 入門、原理與進階實戰》深度神經網絡實戰技巧深度學習從入門到進階的 12 個經典問題及解答計算機視覺知識點總結https://zhuanlan.zhihu.com/p/58776542圖解人工智慧https://okai.brown.edu
  • Python最佳經典學習路線
    如何學習Python python語言基礎:(帶你熟悉python語言的特性,學會使用python開發環境,使用python開發一些簡單的案例) (1)Python3入門,數據類型,字符串 (2)判斷/循環語句,函數,
  • 大數據機器學習庫spark mllib基礎及應用案例
    近日,飛馬網邀請業內資深大數據研發專家董西成為大家在線講解了大數據機器學習庫spark mllib基礎及應用案例。
  • 《機器學習-原理、算法與應用》出版了
    機器學習和深度學習最近幾年發展很快,新方法和理論層出不窮。若非頻繁的更新,經典的教材要跟上時代的步伐絕非易事。另外,由於作者自己的知識面和偏好,能夠全面覆蓋機器學習和深度學習主要算法的書屈指可數。當然,是否要在一本書裡同時講機器學習和深度學習也是有爭議的。2.表述是否淺顯易懂而又不失深度。在這方面,PRML堪稱優秀代表,作者語言樸實易懂,將各種算法和理論闡述的非常清晰。
  • Python視頻教程網課編程零基礎入門數據分析網絡爬蟲全套Python...
    ,然後再根據自 己的需求和規劃選擇學習其他方向課程,學完後一定要多實踐 總目錄 零基礎全能篇(4套課程) 實用編程技巧進價(1套課程) 數據分析與挖掘(8套課程) 辦公自動化(3套課程) 機器學習與人工智慧(7套課程) 開發實戰篇(4套課程) 量化投資(2套課程) 網絡爬蟲(
  • 機器學習實踐指南
    當然,看書是一件非常平靜的事情,可能不符合你的學習風格。 不過,請嘗試閱讀下列書籍,看看它是否適合你:◈ 機器學習教程Machine Learning textbook[20], Tom Mitchell 著,書可能比較舊,但是卻很經典。這本書很好的解釋介紹了機器學習中最重要的課題,步驟詳盡,逐層深入。◈
  • AI | 怎樣快速入門機器學習和深度學習?
    機器學習算法書籍:《統計學習方法》:李航博士的經典教材。用最精煉的語言描述機器學習算法,轉行AI必讀書籍《機器學習》:周志華教授的西瓜書。統計學習方法涵蓋面太窄,配合西瓜書來擴展寬度。《python機器學習及實現》:適合入門,學習曲線平滑,理論書看累了,就跟著這本書打一遍代碼,對kaggle就會大致的了解。
  • 機器喵大作戰 | 解剖人工智慧、機器學習和深度學習
    ,將高度抽象的數學、算法與應用,與現實生活中的案例和事件一一做了關聯,將源自生活的抽象還原出來,幫助讀者理解後,又帶領大家將這些抽象的規律與算法應用於實踐,貼合讀者需求。同時,本書不是割裂講解大數據與機器學習的算法和應用,還講解了其生態環境與關聯內容,讓讀者更全面地知曉淵源與未來,是系統學習大數據與機器學習的不二之選。 推薦語:以降低學習曲線和閱讀難度為宗旨,重點講解了統計學、數據挖掘算法、實際應用案例、數據價值與變現,以及高級拓展技能,清晰勾勒出大數據技術路線與產業藍圖。
  • 軟體應用丨吐血推薦,B站最強學習資源匯總(數據科學,機器學習,python)
    強調在知識的廣度、深度和趣味性之間尋找最佳平衡點,在生動幽默中講述數據挖掘的核心思想、關鍵技術以及一些在其它相關課程和教科書中少有涉及的重要知識點,適合對大數據和數據科學感興趣的各專業學生以及工程技術人員學習。
  • 2020暑期第13屆全國高校師資班(線上)—深度學習、Python、計算機視覺、區塊鏈、自然語言處理、大數據
    學習完這些基礎內容之後,重點學習文本文件操作、json文件操作、CSV文件操作、Word文件操作、Excel文件操作、網絡爬蟲原理與應用、numpy數組運算與矩陣運算、pandas數據分析、matplotlib數據可視化以及sklearn機器學習等方面的內容。課程特點1)報名贈送全部PPT和案例原始碼、實驗錄播課及實驗手冊等資源。
  • 推薦:機器學習培訓20節+大量實戰案例+5大福利
    4位講師,共同為大家打造了這門「機器學習在線培訓直播課程」,本課程涵蓋了基礎複習,算法講解,案例應用,工程經驗分享,工作指導等方面內容,從理論到實踐詳細講述機器學習相關內容,更有來自矽谷的大數據科學家乾貨分享。
  • 《Python 機器學習》-Python Machine Learning(附電子版 pdf)
    全書共16章,除了簡要介紹機器學習及Python在機器學習中的應用,還系統講述了數據分類、數據預處理、模型優化、集成學習、回歸、聚類、神經網絡、深度學習等內容。本書將機器學習背後的基本理論與應用實踐聯繫起來,通過這種方式讓讀者聚焦於如何正確地提出問題、解決問題。本書講解了如何使用Python的核心元素以及強大的機器學習庫,同時還展示了如何正確使用一系列統計模型。