本文多圖,建議閱讀5分鐘
這本書奠定了數據分析、模式挖掘、聚類、分類和回歸的基礎,集中在算法和潛在的代數、幾何和概率概念上。
數據挖掘和機器學習的基本算法構成了數據科學的基礎,利用自動化方法分析各種數據的模式和模型,應用範圍從科學發現到商業分析。本教材面向本科和研究生課程,全面深入地介紹了數據挖掘、機器學習和統計學,為學生、研究人員和實踐者提供了堅實的指導。這本書奠定了數據分析、模式挖掘、聚類、分類和回歸的基礎,集中在算法和潛在的代數、幾何和概率概念上。新的第二版是一個完整的部分致力於回歸方法,包括神經網絡和深度學習。包含了經過類測試的例子和練習,允許課程設計的靈活性和現成的參考數據挖掘和機器學習使人能夠從數據中獲得基本的見解和知識。它們允許發現深刻的、有趣的和新穎的模式,以及從大規模數據中描述的、可理解的和可預測的模型。在這個領域有幾本好書,但其中很多不是太高級就是太高級。這本書是一個介紹性的文本,奠定了機器學習和數據挖掘的基本概念和算法的基礎。重要的概念在第一次遇到時就會被解釋,並附有詳細的步驟和推導。本書的主要目標是通過對數據和方法的幾何、(線性)代數和概率解釋的相互作用,建立公式背後的直覺。這第二版在回歸上增加了一個完整的新部分,包括線性和邏輯回歸,神經網絡,和深度學習。其他章節的內容也進行了更新,已知的勘誤表也得到了修正。本書的主要部分包括數據分析基礎、頻繁模式挖掘、聚類、分類和回歸。這些課程涵蓋了核心方法以及尖端主題,如深度學習、核方法、高維數據分析和圖分析。深度學習,核方法,高維數據分析,圖分析。這本書包括許多例子來說明概念和算法。它也有結束語練習,在課堂上使用過。書中所有的算法都是由作者實現的。為了幫助實際理解,我們建議讀者自己實現這些算法(例如,使用Python或R)。如幻燈片、數據集和視頻等補充資源可以在該書的同伴站點在線獲得:http://dataminingbook.infoPART I. DATA ANALYSIS FOUNDATIONS1 Data Mining and Analysis7 Dimensionality ReductionPART II. FREQUENT PATTERN MINING12 Pattern and Rule Assessment13 Representative-based Clustering14 Hierarchical Clustering15 Density-based Clustering16 Spectral and Graph Clustering18 Probabilistic Classification19 Decision Tree Classifier20 Linear Discriminant Analysis21 Support Vector Machines22 Classification AssessmentPART I. DATA ANALYSIS FOUNDATIONS1 Data Mining and Analysis: Chap1 PDF, Chap1 PPT2 Numeric Attributes: Chap2 PDF, Chap2 PPT3 Categorical Attributes: Chap3 PDF, Chap3 PPT4 Graph Data: Chap4 PDF, Chap4 PPT5 Kernel Methods: Chap5 PDF, Chap5 PPT6 High-dimensional Data: Chap6 PDF, Chap6 PPT7 Dimensionality Reduction: Chap7 PDF, Chap7 PPTPART II. FREQUENT PATTERN MINING8 Itemset Mining: Chap8 PDF, Chap8 PPT9 Summarizing Itemsets: Chap9 PDF, Chap9 PPT10 Sequence Mining: Chap10 PDF, Chap10 PPT11 Graph Pattern Mining: Chap11 PDF, Chap11 PPT12 Pattern and Rule Assessment: Chap12 PDF, Chap12 PPT13 Representative-based Clustering: Chap13 PDF, Chap13 PPT14 Hierarchical Clustering: Chap14 PDF, Chap14 PPT15 Density-based Clustering: Chap15 PDF, Chap15 PPT16 Spectral and Graph Clustering: Chap16 PDF, Chap16 PPT17 Clustering Validation: Chap17 PDF, Chap17 PPT18 Probabilistic Classification: Chap18 PDF, Chap18 PPT19 Decision Tree Classifier: Chap19 PDF, Chap19 PPT20 Linear Discriminant Analysis: Chap20 PDF, Chap20 PPT21 Support Vector Machines: Chap21 PDF, Chap21 PPT22 Classification Assessment: Chap22 PDF, Chap22 PPT23 Linear Regression: Chap23 PDF, Chap23 PPT24 Logistic Regression: Chap24 PDF, Chap24 PPT25 Neural Networks: Chap25 PDF, Chap25 PPT26 Deep Learning: Chap26 PDF, Chap26 PPT27 Regression Evaluation: Chap27 PDF, Chap27 PPT