機器學習經典書籍28本,初、中、高級進階全攻略!

2021-02-08 經管之家

來源:中國統計網

作者:Python中文社區(中國統計網特邀認證作者)




 

作者吳軍大家都很熟悉。以極為通俗的語言講述了數學在機器學習和自然語言處理等領域的應用。


2.《Programming Collective Intelligence》(《集體智慧編程》)         


這本書最大的優勢就是裡面沒有理論推導和複雜的數學公式,是很不錯的入門 書。目前中文版已經脫銷,對於有志於這個領域的人來說,英文的pdf是個不錯的選擇,因為後面有很多經典書的翻譯都較差,只能看英文版,不如從這個入手。

還有,這本書適合於快速看完,因為據評論,看完一些經典的帶有數學推導的書後會發現這本書什麼都沒講,只是舉了很多例子而已。


3.《Algorithms of the Intelligent Web》(《智能web算法》)

 

作者Haralambos Marmanis、Dmitry Babenko。這本書中的公式比《集體智慧編程》要略多一點,裡面的例子多是網際網路上的應用,看名字就知道。不足的地方在於裡面的配套代碼是 BeanShell而不是python或其他。總起來說,這本書還是適合初學者,與上一本一樣需要快速讀完,如果讀完上一本的話,這一本可以不必細看代 碼,了解算法主要思想就行了。
 

4.《統計學習方法》
 

作者李航,是國內機器學習領域的幾個大家之一,曾在MSRA任高級研究員,現在華為諾亞方舟實驗室。書中寫了十個算法,每個算法的介紹都很乾脆,直接上公式,是徹頭徹尾的「乾貨書」。每章末尾的參考文獻也方便了想深入理解算法的童鞋直接查到經典論文;本書可以與上面兩本書互為輔助閱讀。
 

5.《Machine Learning》(《機器學習》)
 

作 者Tom Mitchell是CMU的大師,有機器學習和半監督學習的網絡課程視頻。這本書是領域內翻譯的較好的書籍,講述的算法也比《統計學習方法》的範圍要大很多。據評論這本書主要在於啟發,講述公式為什麼成立而不是推導;不足的地方在於出版年限較早,時效性不如PRML。但有些基礎的經典還是不會過時的,所以這本書現在幾乎是機器學習的必讀書目。


6.《Mining of Massive Datasets》(《大數據》)
  

作 者Anand Rajaraman、Jeffrey David Ullman,Anand是Stanford的PhD。這本書介紹了很多算法,也介紹了這些算法在數據規模比較大的時候的變形。但是限於篇幅,每種算法都 沒有展開講的感覺,如果想深入了解需要查其他的資料,不過這樣的話對算法進行了解也足夠了。還有一點不足的地方就是本書原文和翻譯都有許多錯誤,勘誤表比較長,讀者要用心了。

7.《Data Mining: Practical Machine Learning Tools and Techniques》(《數據挖掘:實用機器學習技術》)
 

作者Ian H. Witten 、Eibe Frank是weka的作者、紐西蘭懷卡託大學教授。他們的《ManagingGigabytes》[4]也是信息檢索方面的經典書籍。這本書最大的特點 是對weka的使用進行了介紹,但是其理論部分太單薄,作為入門書籍還可,但是,經典的入門書籍如《集體智慧編程》、《智能web算法》已經很經典,學習的話不宜讀太多的入門書籍,建議只看一些上述兩本書沒講到的算法。
 

 8.《機器學習及其應用》

 

周志華、楊強主編。來源於「機器學習及其應用研討會」的文集。該研討會由復旦大學智能信息處理實驗室發起,目前已舉辦了十屆,國內的大牛如李航、項亮、王海峰、劉鐵巖、餘凱等都曾在該會議上做過講座。這本書講了很多機器學習前沿的具體的應用,需要有基礎的才能看懂。如果想了解機器學習研究趨勢的可以瀏覽一下這本書。關注領域內的學術會議是發現研究趨勢的方法嘛。


9.《Managing Gigabytes》(深入搜尋引擎)


 

信息檢索不錯的書。

 

10.《Modern Information Retrieval》


Ricardo Baeza-Yates et al. 1999。貌似第一本完整講述IR的書。可惜IR這些年進展迅猛,這本書略有些過時了。翻翻做參考還是不錯的。另外,Ricardo同學現在是Yahoo Research for Europe and Latin Ameria的頭頭。

 

11.《推薦系統實踐》

 

項亮,不錯的入門讀物 





1.《Pattern Classification》(《模式分類》第二版) 


作者Richard O. Duda[5]、Peter E. Hart、David。模式識別的奠基之作,但對最近呈主導地位的較好的方法SVM、Boosting方法沒有介紹,被評「掛一漏萬之嫌」。


2.《Pattern Recognition And Machine Learning》


作 者Christopher M. Bishop[6];簡稱PRML,側重於概率模型,是貝葉斯方法的扛鼎之作,據評「具有強烈的工程氣息,可以配合stanford 大學 Andrew Ng 教授的 Machine Learning 視頻教程一起來學,效果翻倍。」


3.《The Elements of Statistical Learning : Data Mining, Inference, andPrediction》,(《統計學習基礎:數據挖掘、推理與預測》第二版)


作 者RobertTibshirani、Trevor Hastie、Jerome Friedman。「這本書的作者是Boosting方法最活躍的幾個研究人員,發明的Gradient Boosting提出了理解Boosting方法的新角度,極大擴展了Boosting方法的應用範圍。


這本書對當前最為流行的方法有比較全面深入的介紹,對工程人員參考價值也許要更大一點。另一方面,它不僅總結了已經成熟了的一些技術,而且對尚在發展中的一些議題也有簡明扼要的論述。讓讀者充分體會到機器學習是一個仍然非常活躍的研究領域,應該會讓學術研究人員也有常讀常新的感受。」


4.《Data Mining:Concepts andTechniques》(《數據挖掘:概念與技術》第三版)


作 者(美)Jiawei Han[8]、(加)Micheline Kamber、(加)Jian Pei,其中第一作者是華裔。本書毫無疑問是數據挖掘方面的的經典之作,不過翻譯版總是被噴,沒辦法,大部分翻譯過來的書籍都被噴,想要不吃別人嚼過的東 西,就好好學習英文吧。


5.《AI, Modern Approach 2nd》


Peter Norvig,無爭議的領域經典。


6.《Foundations of Statistical Natural Language Processing》


自然語言處理領域公認經典。


7.《Information Theory:Inference and Learning Algorithms》


8.《Statistical Learning Theory》 


Vapnik的大作,統計學界的權威,本書將理論上升到了哲學層面,他的另一本書《The Nature ofStatistical Learning Theory》也是統計學習研究不可多得的好書,但是這兩本書都比較深入,適合有一定基礎的讀者。 




1.《矩陣分析》 


Roger Horn。矩陣分析領域無爭議的經典


2.《概率論及其應用》 


威廉·費勒。極牛的書,可數學味道太重,不適合做機器學習的


3.《All Of Statistics》


機器學習這個方向,統計學也一樣非常重要。推薦All of statistics,這是CMU的一本很簡潔的教科書,注重概念,簡化計算,簡化與Machine Learning無關的概念和統計內容,可以說是很好的快速入門材料。


4.《Nonlinear Programming, 2nd》


最優化方法,非線性規劃的參考書。


5.《Convex Optimization》


Boyd的經典書籍,被引用次數超過14000次,面向實際應用,並且有配套代碼,是一本不可多得的好書。


6.《Numerical Optimization》


第二版,Nocedal著,非常適合非數值專業的學生和工程師參考,算法流程清晰詳細,原理清楚。


7.《Introduction to Mathematical Statistics》 


第六版,Hogg著,本書介紹了概率統計的基本概念以及各種分布,以及ML,Bayesian方法等內容。


8.《An Introduction to Probabilistic Graphical Models》


Jordan著,本書介紹了條件獨立、分解、混合、條件混合等圖模型中的基本概念,對隱變量(潛在變量)也做了詳細介紹,相信大家在隱馬爾科夫鏈和用Gaussian混合模型來實現EM算法時遇到過這個概念。


9.《Probabilistic Graphical Models-Principles and Techniques》 


Koller著,一本很厚很全面的書,理論性很強,可以作為參考書使用



相關焦點

  • 機器學習經典書籍
    這本書中的公式比《集體智慧編程》要略多一點,裡面的例子多是網際網路上的應用,看名字就知道。不足的地方在於裡面的配套代碼是BeanShell而不是python或其他。總起來說,這本書還是適合初學者,與上一本一樣需要快速讀完,如果讀完上一本的話,這一本可以不必細看代碼,了解算法主要思想就行了。
  • 經典機器學習書籍推薦
    這本書中的公式比《集體智慧編程》要略多一點,裡面的例子多是網際網路上的應用,看名字就知道。不足的地方在於裡面的配套代碼是BeanShell而不是python或其他。總起來說,這本書還是適合初學者,與上一本一樣需要快速讀完,如果讀完上一本的話,這一本可以不必細看代碼,了解算法主要思想就行了。
  • 66本計算機專業必讀經典書籍
    二胖精心整理匯總66本計算機專業必讀經典書籍;書單中包含了之前推薦給大家的《深入理解計算機系統(原書第3版)》和《數據密集型應用系統設計》。下面是書籍截圖及目錄。66本計算機經典目錄:>(28)電腦程式設計藝術 卷1:基本算法.pdf(28)電腦程式設計藝術 卷2:半數值算法.pdf(29)電腦程式設計藝術 卷3:排序與查找.pdf(30)算法(第4版)中文版.pdf(1)深入理解計算機系統(原書第3版).pdf
  • 66本計算機專業必讀經典書籍
    二胖精心整理匯總66本計算機專業必讀經典書籍;書單中包含了之前推薦給大家的《深入理解計算機系統(原書第3版)》和《數據密集型應用系統設計》。下面是書籍截圖及目錄。目錄:(28)電腦程式設計藝術 卷1:基本算法.pdf
  • Python 從入門到進階經典書籍,你看過幾本?
    自動化可以看的書籍Python 機器學習可以看大的書籍確實一些好的 Python 書籍確實對我們自身有所幫助,但是 Python 書籍琳琅滿目,有什麼質量比較高的 Python 書籍適合閱讀學習呢?3.3 、 Python數據科學手冊這本書把 Python 中常會使用到的數據分析庫講了下,其中也涉及到了數據的操作和可視化的運用,最後還提供了一些機器學習的算法,算是數據分析書籍中的一個亮點。使用 Python 也適合用來開發web,提供了很多框架給我們使用,比較常見的就有 Flask、Django、bottle 等。
  • 7本最經典的Python書籍,你都讀過了麼?
    如果你想學習Python,市場上有許多可用的資源,本文我們為廣大初學者們推薦7本最經典的Python書籍,這些書籍都非常受歡迎,你可以根據自己的需求選擇:本書介紹了Python應用在各個領域中的一些使用技巧和方法,從最基本的字符、文件序列、字典和排序,到進階的面向對象編程、資料庫和數據持久化、 XML處理和Web編程,再到比較高級和抽象的描述符、裝飾器、元類、迭代器和生成器,均有涉及
  • 【薦書】5 本深度學習和 10 本機器學習書籍(下載)
    簡歷投遞:jobs@aiera.com.cn    HR 微信:13552313024【新智元導讀】>來源於datasciencecentral.com的深度學習和機器學習書籍資源推薦。Du and M.N.s.
  • 機器學習最佳統計書籍推薦
    幾乎每一個機器學習項目中都離不開統計方法。所以需要基礎的統計相關基礎知識和方法對機器學習和AI必不可少。我們說AI不是神話,AI是數學算法,說明紮實數學基礎是做AI的必須,而統計學知識尤其是如此。有很多關於統計學的大眾科普書籍,在我推薦三本:1、赤裸裸的統計:消除數據中的恐懼《Naked Statistics: Stripping the Dread from the Data》
  • 10本機器學習和數據科學的必讀書籍推薦
    需要提前說明的是,這份書單大致以由淺入深的順序排列:首先是關於數據統計,接著是機器學習,最後是一些綜合性的更宏觀的書籍。所有書籍均為英文原著,有中文譯本的我們也都給出了相關連結。以下是書籍清單和簡單介紹:Think Stats: Probability and Statistics for Programmers作者:Allen B.
  • 5本Python經典書籍推薦,你都讀過嗎?
    本文我就為大家推薦5本經典的Python書籍,這些書籍都非常受歡迎,你可以根據自己的需求選擇:1、《Python 簡明教程》短小精湛、久負盛名的 Python 入門教程,英文原名《A Byte of Python》,最簡潔易懂的 Python 的書籍了,傳說中最好的 Python 入門書籍,名不虛傳
  • 適用於初學者和高級程式設計師的10本最佳SQL書籍
    這就是為什麼我們選擇了十大SQL書籍來幫助您從零開始學習SQL的原因。 我們為初學者,中級和高級SQL用戶提供了很多書籍,以及專門滿足數據科學要求的書籍。最佳SQL書籍您可能會看到許多最好的SQL書籍,聲稱它們可以在10分鐘或10天之內幫助您學習SQL。
  • 【書單推薦】機器學習入門書單
    這本書中的公式比《集體智慧編程》要略多一點,裡面的例子多是網際網路上的應用,看名字就知道。不足的地方在於裡面的配套代碼是BeanShell而不是python或其他。總起來說,這本書還是適合初學者,與上一本一樣需要快速讀完,如果讀完上一本的話,這一本可以不必細看代碼,了解算法主要思想就行了。
  • 書籍推薦丨PHP初學者必看的4本經典書
    以下4本你就可以好好讀讀。PHP入門的經典,內容詳實易懂,全面涵蓋了web開發的所需的知識內容。是一本從入門到精通PHP技術的首選教材。光看書本你不會學到太多,因為編程是要在實際寫代碼的過程中才會深刻體會到理論。但是書上的內容可以給你先在腦海中對php是怎麼一回事形成一個大概的印象。歡迎在留言區跟大家分享你的書單哦~
  • 學習Linux經典書籍推薦
    但是,回歸書籍並不代表說什麼書都看,現在市面上充斥了非常多質量比較一般的書,對我們幫助並不大,甚至可能會起到誤導的作用。而且我們的時間、精力都很有限,所以要看一定就要經典書籍!下面,我就介紹Linux方向的一些經典書籍,供大家學習參考。首先是Linux入門書籍的推薦。
  • 每周贈書 | 五本NLP書籍,從入門到進階都齊了
    :通過C語言模擬5、Java自然語言處理本期贈書福利由華章計算機 (微信ID:hzbook_jsj) 提供贊助以實戰為導向,繞開各種複雜數學公式與證明,確保讀者零基礎入門,詳細講解自然語言處理 的各種核心技術、方法論和經典算法。
  • 這可能是全網最受推薦的25本Python書籍
    最近一位名為Pierre de Wulf 的網友為了找出那些在「最佳編程書籍」列表出現次數最多的書籍,用Python編寫了腳本,拉取了大量的相關數據,總結了最受推薦的編程書籍、Python書籍、Java書籍和JavaScript書籍,以下是Python書籍榜單:本書將複雜的編程概念分解成簡單的步驟,簡單易懂。作者通過多年的教學經驗精心挑選出了有特點的例子,手把手地實例教學。
  • 前端高級進階13本經典書籍
    1.2萬前端開發已關注39個好友已關注一轉眼,做前端開發整整10個年頭了,從最初剛出校門的懵懂小白,到現在的所謂技術大牛,從攜程到華為再到現在的京東,看的前端技術方面的書,算了下,也不下百本了,先來曬曬工牌。
  • 推薦 九本不容錯過的深度學習和神經網絡書籍
    針對 30 多本深度學習和神經網絡書籍,我們(AI Optify 數據團隊)使用不同指標(比如,在線評價、打分、所涉主題、作者影響力、出版年份、
  • 95後數據科學家教你從零自學機器學習,這有3本入門必看書籍
    最近一位22歲的數據科學家Dario,以自學經歷中用到的資源告訴你,如何從零開始學習數據科學。所謂從零開始自學,是針對那些可以自主學習在線課程和閱讀書籍,卻沒有上班之餘接受課堂教育的人士。三本優秀的入門必看書如果你更喜歡讀書,Dario還推薦了3本入門數據科學的優秀教材。第一本是《Python數據科學手冊》。這本書從Jupyter Notebook入手,內容涵蓋了Numpy、Pandas,、Matplotlib和Scikit-Learn等數據科學中最重要的部分。
  • 學習C語言必看的最經典書籍
    來源:互動出版網學習c語言必看的最經典書籍推薦一:《新概念51單片機C語言教程--入門