學好機器學習,這裡有你需要的一切

2021-03-02 機器學習算法工程師

課程大綱

第一課:機器學習的數學基礎1 - 數學分析

 

1.  機器學習的一般方法和橫向比較

2.  數學是有用的:以SVD為例

3.  機器學習的角度看數學

4.  複習數學分析

5.  直觀解釋常數e

6.  導數/梯度

7.  隨機梯度下降

8.  Taylor展式的落地應用

9.  gini係數

10. 凸函數

11. Jensen不等式

12. 組合數與信息熵的關係

 

第二課:機器學習的數學基礎2 - 概率論與貝葉斯先驗

 

1.  概率論基礎

2.  古典概型

3.  貝葉斯公式

4.  先驗分布/後驗分布/共軛分布

5.  常見概率分布

6.  泊松分布和指數分布的物理意義

7.  協方差(矩陣)和相關係數

8.  獨立和不相關

9.  大數定律和中心極限定理的實踐意義

10.  深刻理解最大似然估計MLE和最大後驗估計MAP

11.  過擬合的數學原理與解決方案

 

第三課:機器學習的數學基礎3 - 矩陣和線性代數

 

1.  線性代數在數學科學中的地位

2.  馬爾科夫模型

3.  矩陣乘法的直觀表達

4.  狀態轉移矩陣

5.  矩陣和向量組

6.  特徵向量的思考和實踐計算

7.  QR分解

8.  對稱陣、正交陣、正定陣

9.  數據白化及其應用

10.  向量對向量求導

11.  標量對向量求導

12.  標量對矩陣求導

 

第四課:Python基礎1 - Python及其數學庫

 

1.  解釋器Python2.7與IDE:Anaconda/Pycharm

2.  Python基礎:列表/元組/字典/類/文件

3.  Taylor展式的代碼實現

4.  numpy/scipy/matplotlib/panda的介紹和典型使用

5.  多元高斯分布

6.  泊松分布、冪律分布

7.  典型圖像處理

8.  蝴蝶效應

9.  分形與可視化

 

第五課:Python基礎2 - 機器學習庫

 

1.  scikit-learn的介紹和典型使用

2.  損失函數的繪製

3.  多種數學曲線

4.  多項式擬合

5.  快速傅立葉變換FFT

6.  奇異值分解SVD

7.  Soble/Prewitt/Laplacian算子與卷積網絡

8.  卷積與(指數)移動平均線

9.  股票數據分析

 

第六課:Python基礎3 - 數據清洗和特徵選擇

 

1.  實際生產問題中算法和特徵的關係

2.  股票數據的特徵提取和應用

3.  一致性檢驗

4.  缺失數據的處理

5.  環境數據異常檢測和分析

6.  模糊數據查詢和數據校正方法、算法、應用

7.  樸素貝葉斯用於鳶尾花數據

8.  GaussianNB/MultinomialNB/BernoulliNB

9.  樸素貝葉斯用於18000+篇/Sogou新聞文本的分類

 

第七課: 回歸

 

1.  線性回歸

2.  Logistic/Softmax回歸

3.  廣義線性回歸

4.  L1/L2正則化

5.  Ridge與LASSO

6.  Elastic Net

7.  梯度下降算法:BGD與SGD

8.  特徵選擇與過擬合

 

第八課:Logistic回歸

 

1.  Sigmoid函數的直觀解釋

2.  Softmax回歸的概念源頭

3.  Logistic/Softmax回歸

4.  最大熵模型

5.  K-L散度

6.  損失函數

7.  Softmax回歸的實現與調參

 

第九課:回歸實踐

 

1.  機器學習sklearn庫介紹

2.  線性回歸代碼實現和調參

3.  Softmax回歸代碼實現和調參

4.  Ridge回歸/LASSO/Elastic Net

5.  Logistic/Softmax回歸

6.  廣告投入與銷售額回歸分析

7.  鳶尾花數據集的分類

8.  交叉驗證

9.  數據可視化

 

第十課:決策樹和隨機森林

 

1.  熵、聯合熵、條件熵、KL散度、互信息

2.  最大似然估計與最大熵模型

3.  ID3、C4.5、CART詳解

4.  決策樹的正則化

5.  預剪枝和後剪枝

6.  Bagging

7.  隨機森林

8.  不平衡數據集的處理

9.  利用隨機森林做特徵選擇

10. 使用隨機森林計算樣本相似度

11. 數據異常值檢測

 

第十一課:隨機森林實踐

 

1.  隨機森林與特徵選擇

2.  決策樹應用於回歸

3.  多標記的決策樹回歸

4.  決策樹和隨機森林的可視化

5.  葡萄酒數據集的決策樹/隨機森林分類

6.  波士頓房價預測

 

第十二課:提升

 

1.  提升為什麼有效

2.  梯度提升決策樹GBDT

3.  XGBoost算法詳解

4.  Adaboost算法

5.  加法模型與指數損失

 

第十三課:提升實踐

 

1.  Adaboost用於蘑菇數據分類

2. Adaboost與隨機森林的比較

3.  XGBoost庫介紹

4.  Taylor展式與學習算法

5.  KAGGLE簡介

6.  泰坦尼克乘客存活率估計

 

第十四課:SVM

 

1.  線性可分支持向量機

2.  軟間隔的改進

3.  損失函數的理解

4.  核函數的原理和選擇

5.  SMO算法

6.  支持向量回歸SVR

 

第十五課:SVM實踐

 

1.  libSVM代碼庫介紹

2.  原始數據和特徵提取

3.  葡萄酒數據分類

4.  數字圖像的手寫體識別

5.  SVR用於時間序列曲線預測

6.  SVM、Logistic回歸、隨機森林三者的橫向比較

 

第十六課:聚類(上)

 

1.  各種相似度度量及其相互關係

2.  Jaccard相似度和準確率、召回率

3.  Pearson相關係數與餘弦相似度

4.  K-means與K-Medoids及變種

5.  AP算法(Sci07)/LPA算法及其應用

 

第十七課:聚類(下)

 

1.  密度聚類DBSCAN/DensityPeak(Sci14)

2.  DensityPeak(Sci14)

3.  譜聚類SC

4.  聚類評價AMI/ARI/Silhouette

5.  LPA算法及其應用

 

第十八課:聚類實踐

 

1.  K-Means++算法原理和實現

2.  向量量化VQ及圖像近似

3.  併查集的實踐應用

4.  密度聚類的代碼實現

5.  譜聚類用於圖片分割

 

第十九課:EM算法

 

1.  最大似然估計

2.  Jensen不等式

3.  樸素理解EM算法

4.  精確推導EM算法

5.  EM算法的深入理解

6.  混合高斯分布

7.  主題模型pLSA

 

第二十課:EM算法實踐

 

1.  多元高斯分布的EM實現

2.  分類結果的數據可視化

3.  EM與聚類的比較

4.  Dirichlet過程EM

5.  三維及等高線等圖件的繪製

6.  主題模型pLSA與EM算法

 

 第二十一課:主題模型LDA

 

1.  貝葉斯學派的模型認識

2.  Beta分布與二項分布

3.  共軛先驗分布

4.  Dirichlet分布

5.  Laplace平滑

6.  Gibbs採樣詳解

 

第二十二課:LDA實踐

 

1.  網絡爬蟲的原理和代碼實現

2.  停止詞和高頻詞

3.  動手自己實現LDA

4.  LDA開源包的使用和過程分析

5.  Metropolis-Hastings算法

6.  MCMC

7.  LDA與word2vec的比較

8.  TextRank算法與實踐

 

第二十三課:隱馬爾科夫模型HMM

 

1.  概率計算問題

2.  前向/後向算法

3.  HMM的參數學習

4.  Baum-Welch算法詳解

5.  Viterbi算法詳解

6.  隱馬爾科夫模型的應用優劣比較

 

第二十四課:HMM實踐

 

1.  動手自己實現HMM用於中文分詞

2.  多個語言分詞開源包的使用和過程分析

3.  文件數據格式UFT-8、Unicode

4.  停止詞和標點符號對分詞的影響

5.  前向後向算法計算概率溢出的解決方案

6.  發現新詞和分詞效果分析

7.  高斯混合模型HMM

8.  GMM-HMM用於股票數據特徵提取

相關焦點

  • 學好機器學習,這裡有你想要的一切
    同時在IT工業界做機器學習、大數據、人工智慧等專業技術諮詢工作。 1.  本課程的教學重心是從數學層面理解並掌握推導經典的機器學習算法,從歷史到細節深入了解機器學習的基本思想和各種算法的具體思路與方法。2.  強化數學、概率論、數理統計的基礎知識,夯實機器學習的基礎必備知識。
  • 學好英語你需要知道的幾件事
    毫不誇張地說,每個同學都逃不掉來自英語的鞭撻,那麼如何學好英語就成了廣大學生最為關心的事情,鼬老師將結合自己複習考研英語和雅思的經歷,與大家分享3點需要注意的小Tips。1 培養語感不要背單詞書!不要背單詞書!不要背單詞書!
  • 送你一份機器/深度學習自學指南(附視頻&速成方案)
    回答這個問題,最先要考慮的問題是:你有多少時間?準備用三個月入門,和想要一個月速成,肯定是截然不同的路徑。當然我建議大家穩紮穩打,至少可以拿出五個月的時間來學好機器學習的基礎知識。基礎很重要,知其所以然很重要。
  • 如何自學機器學習?
    當看完這些教程之後,你就對機器學習有了清晰的認知。接下來,你可以感性的認識一下深度學習,我同樣推薦Andrew的課。https://www.bilibili.com/video/av49445369這門課同樣不難,不需要高深的數學知識,同樣是為新手們準備的。
  • 想要學好日語,需要具備的6種學習態度,你都有了嗎?
    學習日語之前,一定要明確我們的學習態度:1.學習日語離不開堅持如果讓毫無興趣的人去學習,我相信那肯定是一種煎熬,所以對日語產生學習興趣,其實非常難得,請不要讓自己放棄這項愛好,既然已經打算開始了,那就請你好好地堅持下去。
  • 面向未來,孩子最需要培養的不是英語,而是人類機器智商.
    你看黃磊的女兒多多英語多好,已經可以流利的跟外國人聊天了。學好英語以後一定有用。我說:I don't think so。英語肯定要學好,但是我不想讓Harry發展英語作為特長。然後,我闡述我的觀點。我覺得選擇很重要,選對比努力更加重要。那麼以什麼標準去選擇呢?
  • 常見機器學習用例TOP 7,在你身邊無處不在!
    一切都必須按計劃進行,否則就會功虧一簣。所以,你告訴智能小助手:• 定一個明天早上7點的鬧鐘• 在Uber上預約一個直達面試地點的快車,早上8:30來接我• 計算一下車費• 在谷歌地圖上看看路上要花多長時間• 最後列出面試前還需要再多看幾眼的資料這樣的好處是什麼?
  • 韓語學習:你有沒有過忽然很想學好韓語的瞬間?
    學習的態度!你有沒有過忽然很想學好韓語的瞬間?flag總是雷聲大雨點小學到難記的知識點就想先跳過去一想到推進學習計劃就提不起精神反反覆覆陷入拖延魔咒不能自拔你有沒有過忽然很想學好韓語的瞬間?你有沒有過忽然很想學好韓語的瞬間?勇敢一些,想學韓語學就完了!
  • 【機器視覺】學習機器視覺需要哪些知識?
    要回答這個問題,我們可以分解一下機器視覺系統,來逐個分析。一套最簡單的機器視覺系統包括1.
  • 教你搭建你自己的「深度學習」機器
    目前,我們已經可以很快的處理超大計算量的問題——這多虧了GPU,GPU最初就是用於快速生成高解析度計算機圖像,由於它的計算效率使得其非常適合用於深度學習算法。原先需要用好幾周才能分析出來的結果,現在幾天時間就能完成。雖然現在的計算機都有GPU,但是並不是所有的GPU都適合用來進行深度學習。
  • 如何搭建你自己的「深度學習」機器?
    目前,我們已經可以很快的處理超大計算量的問題——這多虧了GPU,GPU最初就是用於快速生成高解析度計算機圖像,由於它的計算效率使得其非常適合用於深度學習算法。原先需要用好幾周才能分析出來的結果,現在幾天時間就能完成。雖然現在的計算機都有GPU,但是並不是所有的GPU都適合用來進行深度學習。
  • 歐洲核子研究中心:這裡有詩意的機器 看不見的舞蹈
    歐洲核子研究中心:這裡有詩意的機器   義大利導演瓦雷裡奧·加隆果(Valerio Jalongo)還記得自己在大學哲學系時,曾讀過古希臘哲學家赫拉克利特的一句話,「自然喜歡隱藏」。這句話是什麼意思?就是說,支配我們所見的一切的法則是我們肉眼看不見的?還是說,每件清楚呈現在眼前的事情,同時也在躲藏我們?
  • 做機器學習相關工作,需要哪些技能 ?(附資源連結)
    本文摘編了兩位網友的回答解讀機器學習有關工作所備的技能有哪些!一、Jonathan A. Cox(機器學習和應用物理研究人員)的回答:這裡有很多回復都提到了一些創業公司常用的工具。以下是值得考慮的算法:另外一個很有前景的領域是強化學習,尤其是 Deep Mind 的 Q-learning。當你用到延遲獎勵功能(比如玩 Atari 遊戲時的得分),並且不能在你的網絡中直接計算參數梯度時,你會用到強度學習。當你熟悉了上述的算法之後,你大約會想探索一下這個領域。這個領域跟機器人以及,更現實一點,關於人和動物是怎麼學習的模擬,很有關聯。
  • 數學的神奇,人工智慧機器為什麼能學習,到底怎麼做的?
    自從有了計算機以來,信息處理的方式就不斷地產生新的變化。最近這幾年,人工智慧這個領域特別引人注目,它能讓機器自己學習知識並增長其智力,處理視覺圖像信息,並最終輸出人們所需要的結果。機器為什麼能學習? 它究竟是怎麼學的? 這一切都要回歸到數學。簡單一句話,按規則大量調整數學模型裡面的各個參數,使計算輸出最貼近實際的結果。
  • 初中英語,學好語法,這裡教你好方法!
    怎樣才能愛上英語語法,來幫助我們學好英語呢?方法特別簡單,只是很少同學能夠長久的堅持。和我們學習一樣,你堅持了,那你就是贏家。這個方法就是從閱讀中領悟語法,再以語法書鞏固領悟。那麼具體應該怎麼學呢?知識的積累就是需要一個過程,堅持幾天,你就會發現,你找到的知識點,語法點會越來越多。不需要可以去背,你是在完全自然的情況下便學會了使用。這絕對是很輕鬆的過程。3、讀!讀!讀!要知道學好語法,語感比規則更重要。語感怎麼來的?那是讀出來的。
  • 要想學好英語,你必須:臉皮厚+嚴格執行每天學習計劃+......
    常常有同學問小希老師怎樣才能學好英語,我往往會反問他們,你對自己夠狠嗎?這裡的狠並不是讓他們做什麼傷害自己的事,而是希望他們可以反思自己真的有學好英語的決心和毅力嗎?如果你有學不好英語誓不罷休的狠勁,那麼看完本文你一定會有所收穫!
  • 想入門機器學習?機器之心為你準備了一份中文資源合集
    如果你是一名計算機工程師,每天使用 UML、ORM、設計模式及其他軟體工程工具/技術,那麼請閉眼一秒鐘,忘掉一切。這並不是說這些概念不重要,絕不是!但是機器學習需要一種不同的方法。如今 Python 如此流行的原因之一是其「原型設計速度」。在機器學習中,一種使用幾行代碼即可建模算法的語言絕對是必要的。微積分、線性代數、概率論在機器學習幾乎所有算法中不可或缺。
  • 001 機器不學習 | 介紹(一)
    ,解決一些原本需要人類智慧才能完成的複雜問題。而且要實現這樣的聊天機器人需要大量人力去編寫規則,問題沒有簡化反而變得更加複雜了。在聊天機器人的例子中,設定規則就像是人類給機器設定好的本能。但是,我們希望機器能擁有自己學習的能力,也就是說我們應該寫一個程序讓機器進行學習!什麼是機器學習?先用比較形象的方式來描述一下什麼是機器學習。假設你已經寫好一個能讓機器學習的程序,那麼就要讓機器開始學習了!
  • 給畢業生:你應該選機器學習還是數據科學?
    本文首先分析了數據科學行業的總體發展趨勢,然後深入地比較了機器學習領域中幾個不同名稱的職位的職能,對尋找數據科學和機器學習類工作的畢業生非常有指導意義。 在 Metis 訓練營,本文作者給學生們演講之後的合影(圖片來源:本文作者)。大家好,我是傑森。我在矽谷工作,是一名數據科學家(關於這個名詞,我們將在本文後面進一步定義),我熱愛學習一切新事物!
  • 學好了日語有什麼用?學習日語的好處
    現在好多小夥伴喜歡動漫,所以有不少的同學有過學習日語的想法,但是父母都是不願意,因為感覺為了動漫學習日語,沒有多大用途,那麼學習日語到底有什麼作用呢?難道只能滿足自己的一個小小興趣嗎,學好日語將來有什麼好處呢?