新智元報導
來源:專知
編輯:SF
【新智元導讀】自2012年發行以來就奉為經典機器學習書目,最近作者在Github上發布了關於本書的Python代碼,更加方便使用!
隨著電子形式的數據量的不斷增加,對數據分析的自動化方法的需求也在不斷增長。機器學習的目標是開發能夠自動檢測數據模式的方法,然後使用未發現的模式來預測未來的數據或其他感興趣的結果。
因此,機器學習與統計和數據挖掘領域密切相關,但在其重點和術語方面略有不同。
這本書提供了該領域的詳細介紹,並包括從應用領域,如分子生物學,文本處理,計算機視覺和機器人的工作示例。
機器學習:一種概率視角
本書採用了這樣一種視角,即創造能從數據中學習的機器的最好方法是使用概率論的工具,幾個世紀以來,概率論一直是統計學和工程學的支柱。概率論可以應用於任何涉及不確定性的問題。
在機器學習中,不確定性有多種形式: 給定一些數據,什麼是最好的預測(或決策)?給定數據的最佳模型是什麼?接下來我應該執行什麼度量?等。
概率推理系統地應用於所有的推理問題,包括統計模型的推理參數,有時被稱為貝葉斯方法。然而,這個詞往往會引起非常強烈的反應(積極或消極,取決於你問誰),所以我們更喜歡中性的術語「概率方法」。
此外,我們將經常使用最大似然估計等技術,它們不是貝葉斯方法,但肯定屬於概率範式。
這本書並沒有描述一本關於不同啟發式方法的烹飪書,而是強調了一種基於模型的機器學習方法。對於任何給定的模型,通常可以應用多種算法。
相反,任何給定的算法通常都可以應用於各種模型。這種模塊化,即模型與算法的區別,是一種很好的教學方法,也是一種很好的工程技術。
我們將經常使用圖模型的語言以一種簡潔和直觀的方式來指定我們的模型。我們將看到,除了幫助理解之外,圖結構還有助於開發有效的算法。然而,這本書主要不是關於圖形模型的,它是關於概率建模的。
目錄
Chapter 1:引言 Introduction
Chapter 2:概率 Probability
Chapter 3:面向離散數據的生成式模型 Generative models for discrete data
Chapter 4:高斯模型 Gaussian models
Chapter 5:貝葉斯統計 Bayesian statistics
Chapter 6:頻率統計 Frequentist statistics
Chapter 7:線性回歸 Linear regression
Chapter 8:邏輯回歸 Logistic regression
Chapter 9:廣義線性模型和指數族 Generalized linear models and the exponential family
Chapter 10:有向圖模型(貝葉斯網絡) Directed graphical models (Bayes nets)
Chapter 11:混合模型與EM算法 Mixture models and the EM algorithm
Chapter 12:隱式線性模型 Latent linear models
Chapter 13:稀疏線性模型 Sparse linear models
Chapter 14:核方法 Kernels
Chapter 15:高斯過程 Gaussian processes
Chapter 16:自適應基函數模型 Adaptive basis function model
Chapter 17:馬爾可夫模型和隱馬爾可夫模型 Markov and hidden Markov Models
Chapter 18:狀態空間模型 State space models
Chapter 19:無向圖模型(馬爾可夫隨機域) Undirected graphical models (Markov random fields)
Chapter 20:圖模型精準推斷 Exact inference algorithms for graphical models
Chapter 21:變分推斷 Variational inference
Chapter 22:更進變分推斷 More variational inference
Chapter 23:蒙特卡洛推斷 Monte Carlo inference algorithms
Chapter 24:馬爾科夫鏈蒙特卡洛推斷 MCMC inference algorithms
Chapter 25:聚類 Clustering
Chapter 26:圖模型結構學習 Graphical model structure learning
Chapter 27:因變量 Latent variable models for discrete data
Chapter 28:深度學習 Deep learning
Python配套代碼
《機器學習:概率視角》第二版的Python 3代碼。這是正在進行的工作。
https://github.com/probml/pyprobml
Foundations
Introduction
Linear algebra
Calculus
Probability
Information theory
Bayesian statistics
Frequentist statistics
Statistical models
Algorithms
Optimization
Graphical model inference
Variational inference
Monte Carlo inference
Models
Generalized linear models
Deep neural networks
Graphical models
Visible generative models
Latent generative models
Gaussian processes
Models for graphs, manifolds and clusters
Reinforcement learning
習題解答(中文版)