免費!10本機器學習和數據科學的必讀書籍推薦

2020-12-27 雷鋒網

雷鋒網按:Matthew Mayo 是知名數據科學網站 KDnuggets 的副主編,同時也是一位資深的數據科學家、深度學習技術愛好者,在機器學習和數據科學領域具有豐富的科研和從業經驗。近日,他在 KDnuggets 上推薦了一份機器學習和數據科學相關的免費必讀書單,雷鋒網特來與大家分享。

需要提前說明的是,這份書單大致以由淺入深的順序排列:首先是關於數據統計,接著是機器學習,最後是一些綜合性的更宏觀的書籍。所有書籍均為英文原著,有中文譯本的我們也都給出了相關連結。

以下是書籍清單和簡單介紹:

Think Stats: Probability and Statistics for Programmers

作者:Allen B. Downey

本書中文名為:《統計思維:程式設計師數學之概率統計》。從書名就能看出來,這本書是為程式設計師群體量身定製的統計學內容介紹,具體內容基於 Python 語言。

本書著重介紹了許多可以用來探索真實數據集的簡單技術,同時還能利用這些技術回答許多非常有趣的統計問題。該書的樣例基於美國國家衛生研究院的真實資料庫,並鼓勵讀者基於真實的數據進行相關研究。

本書有中文譯本,目前英文原版也已經上線了第二版,連結如下:

英文地址: http://greenteapress.com/wp/think-stats-2e/

中文地址: https://www.gitbook.com/book/jobrest/statistical-thinking/details

Probabilistic Programming & Bayesian Methods for Hackers

作者:Cam Davidson-Pilon

本書中文名為《貝葉斯方法:概率編程與貝葉斯推斷》,以計算/理解為主,數學內容為輔,重點介紹了貝葉斯方法理論和概率編程。

作為推斷中最自然和常見的方法,貝葉斯推斷一般以晦澀難懂的數學分析理論為大家所熟知。按照一般的模式,在介紹貝葉斯之前,通常都要先介紹兩到三章的概率論的相關內容。等到概率論介紹完,又常常由於貝葉斯模型的數學複雜度太高,因此只能向讀者展示一些最簡單和粗糙的貝葉斯樣例,於是給讀者造成了一種「貝葉斯似乎也沒什麼用」的錯覺。本書則另闢蹊徑,以簡單通俗的講述開始,由淺入深地介紹了貝葉斯理論在黑客和概率編程中的應用。

中文購買地址: http://dwz.cn/5Kedr9

英文地址: http://t.cn/zQZ1p2m

Understanding Machine Learning: From Theory to Algorithms

作者:Shai Shalev-Shwartz 和 Shai Ben-David

深入理解機器學習:從原理到算法》,書中從原理性的內容出發,介紹了機器學習的基本理論和算法範例,同時給出了將這些基礎理論轉化為實際算法的數學推導過程。介紹完這些基礎理論之後,本書又介紹了許多其他相關書籍很少涉及的核心內容,包括:模型訓練的計算複雜度,穩定性和凸性(convexity)的概念,隨機梯度下降、神經網絡等算法範例,以及 PAC-Bayes 和 compression-based bounds 等新概念。

英文地址: http://www.cs.huji.ac.il/~shais/UnderstandingMachineLearning/

中文購買地址: http://dwz.cn/5Ke6ne

The Elements of Statistical Learning

作者:Trevor Hastie, Robert Tibshirani 和 Jerome Friedman

本書在一些通用概念框架的基礎上介紹了統計學的一些重要思想。雖然書中的許多方法都是基於統計學的,並提供了樣例說明和彩色配圖,但核心思想是在向讀者闡述概念和思想,而並非數學知識。除了統計學概念之外,書中還涉及了神經網絡、監督學習、支持向量機、分類、預測和非監督學習等非常豐富的內容。適合於對行業數據挖掘感興趣的統計人員和所有對新興科技感興趣的朋友。

中文地址: http://www.loyhome.com/elements_of_statistical_learining_lecture_notes/

英文地址: http://statweb.stanford.edu/~tibs/ElemStatLearn/

An Introduction to Statistical Learning with Applications in R

作者:Gareth James, Daniela Witten, Trevor Hastie 和 Robert Tibshirani

統計學習導論:基於R應用》,書中以 R 語言為基礎,詳細介紹了統計學習的核心方法和應用,內容涉及線性回歸、分類、再抽樣方法、壓縮方法、樹方法、聚類、支持向量機等。同時,書中提供了大量基於現實數據的樣例,這些數據來自近 20 年來生物學、金融學、市場營銷學和天體物理學等諸多領域。本書主要面向非數學專業的高年級本科生、碩士研究生和博士生。

中文購買地址: http://dwz.cn/5Ke5dE

英文地址:http://www-bcf.usc.edu/~gareth/ISL/

Foundations of Data Science

作者:Avrim Blum, John Hopcroft 和 Ravindran Kannan

雖然計算機科學的傳統領域仍然非常重要,但是現在已經有越來越多的研究員開始著眼於如何使用計算機來理解和挖掘潛藏在大量數據中的有用信息,而不僅僅是用計算機來解決實際的應用問題。本書詳細介紹了數據科學的基礎理論和應用,作者在前言中指出:「我們希望讀者可以從本書中學到在未來 40 年仍然有用的數據科學基礎知識,正如自動化相關的理論和算法在 40 年前做的一樣。」

英文地址: https://www.cs.cornell.edu/jeh/book.pdf

A Programmer's Guide to Data Mining: The Ancient Art of the Numerati

作者:Ron Zacharski

本書是一個以實踐操作為主的循序漸進式的編程參考,主要以 Python 代碼為基礎,面向數據挖掘的相關使用場景。作者在介紹中表示:「我希望你能參考書中給出的代碼,積極參與數據挖據技術的實踐編程,當你完成全書的所有內容時,實際上已經為數據挖掘技術奠定了堅實的基礎。」

英文地址:http://guidetodatamining.com/

Mining of Massive Datasets

作者:Jure Leskovec, Anand Rajaraman 和 Jeff Ullman

大數據:網際網路大規模數據挖掘與分布式處理》,由史丹福大學 CS246: Mining Massive Datasets 和 CS345A: Data Mining 課程的內容總結而成,主要關注極大規模數據的挖掘。主要內容包括分布式文件系統、相似性搜索、搜尋引擎技術、頻繁項集挖掘、聚類算法、廣告管理及推薦系統。大部分章節後都配有對應的習題,以及豐富的擴展閱讀推薦,用以鞏固所講解的內容。據官網介紹,本書的內容不涉及任何預備知識,任何人都可以直接學習。

中文地址: http://bestcbooks.com/B009HEK8SO/

英文地址: http://mmds.org/

Deep Learning

作者:Ian Goodfellow, Yoshua Bengio 和 Aaron Courville

本書為 Yoshua Bengio 和 Ian Goodfellow 等大神合著的深度學習教科書,該書主要分為三個部分:機器學習和數學基礎,深度學習的基礎實踐,深度學習的進一步研究。全書內容紮實、講解細緻、深入淺出,特別適合深度學習的初學者通過這本書正式入門機器學習領域的研究。

中文地址: https://github.com/exacity/deeplearningbook-chinese

英文地址:http://www.deeplearningbook.org/

Machine Learning Yearning

作者:吳恩達(Andrew Ng)

這是大神 Andrew Ng 的一本書,官網描述稱:

AI,機器學習和深度學習正在改變眾多的行業。但如何搭建一個真正的機器學習系統,首先需要解決如下幾個問題:

應該收集更多的訓練數據嗎?

應該使用端到端的深度學習嗎?

如何處理與測試集不匹配的訓練集?

等等。

此前,關於如何解決這些問題的唯一途徑是研究生課程或諮詢公司。現在我正在寫一本相關的書籍,希望能幫助各位朋友解決類似的問題,幫助大家更好地搭建 AI 系統。

英文地址: http://www.mlyearning.org/

來源:,雷鋒網編譯kdnuggets

雷鋒網相關閱讀:

機器學習漫遊指南 最完整的入門書單(外文版)

原版教材太貴?這幾本機器學習好書其實不需要花錢

免費教材資源第二彈!這回側重數據科學

相關焦點

  • 95後數據科學家教你從零自學機器學習,這有3本入門必看書籍
    最近一位22歲的數據科學家Dario,以自學經歷中用到的資源告訴你,如何從零開始學習數據科學。所謂從零開始自學,是針對那些可以自主學習在線課程和閱讀書籍,卻沒有上班之餘接受課堂教育的人士。Dario首先推薦的是Udemy的《數據科學與機器學習Python訓練營》,這是他第一次接觸數據科學的時候學習的課程。課程中用Pandas和Numpy進行數據分析,並用Matplotlib和Seaborn進行一些數據可視化。雖然內容不多也不深入,但已經足夠入門數據科學了。
  • 送你10本機器學習和數據科學必讀書(附PDF下載)
    讓一系列免費的機器學習與數據科學書籍開啟你的夏日學習之旅吧!,同時出現了大量的源自不同領域的數據,例如醫療、生物、金融和市場營銷。目標讀者是有數學或計算機背景的並且希望在統計和數據科學領域中得以運用的學生。這本書在Github上以markdown文檔的形式免費提供。同時也以更便捷的形式(epub,mobi)在LeanPub和零售店提供。7.
  • 人工智慧,深度學習,數據科學的最新書籍推薦
    為了滿足廣大讀者的好奇心,我們曾整理過一系列人工智慧方面的書籍,如今我們又進行了更新,為大家帶來人工智慧、深度學習、數據科學的11本最新書籍。這些書都是知識性的作品,毫無虛構成分。以下介紹沒有特定的順序。1.
  • 年度最受推薦的10本Python書籍
    -best-python-books-for-beginners-and-advanced-programmerspython是一種通用的解釋型編程,主要用於Web開發、機器學習和複雜數據分析。Python對初學者來說是一種完美的語言,因為它易於學習和理解,隨著這種語言的普及,Python程式設計師的機會也越來越大。如果你想學習Python編程,市場上就有很多的書籍。近日,hackr社區推薦了10本最佳的Python書籍。是2018年最受編程社區成員推薦的Python書,該列表還包括一些為初學者準備的免費Python書籍。
  • 66本計算機專業必讀經典書籍
    二胖精心整理匯總66本計算機專業必讀經典書籍;書單中包含了之前推薦給大家的《深入理解計算機系統(原書第3版)》和《數據密集型應用系統設計》。下面是書籍截圖及目錄。半數值算法.pdf(29)電腦程式設計藝術 卷3:排序與查找.pdf(30)算法(第4版)中文版.pdf(1)深入理解計算機系統(原書第3版).pdf(2)計算機科學導論(第2版).pdf(3)計算機科學概論
  • 10本關於機器學習(AI)的必讀書籍
    深入閱讀這10本必須閱讀的免費書籍,以支持您的AI學習和工作。人工智慧一詞最早由史丹福大學的計算機科學家約翰·麥卡錫(John McCarthy)提出,他在達特茅斯會議上提出了這一建議。達特茅斯會議是第一個涵蓋該主題的學術會議,於1956年夏季舉行,為這一領域的發展奠定了基礎。
  • 50本品牌營銷必讀的書籍,喜歡就免費帶走!
    一、經管必讀14本書籍二、品牌營銷必讀的20本書籍三、戰略與商業模式必讀的10本書籍四、網際網路必讀的6本書籍品牌營銷必讀的50本書籍,電子版喜歡即可免費帶走,帶走要求:關注「職場導航」頭條號;轉發本篇文章至你的頭條號;轉發截圖並私信至頭條號;私信中回復「品牌」即可免費領取。
  • 150本R語言書籍推薦,涵蓋10來個不同專業方向,內附書籍簡單介紹
    R語言的書籍很多,今天推薦一本書,
  • 歷史最全語音增強必讀論文、數據集、工具包、書籍及應用整理分享
    本資源整理了語音增強(Speech Enhancement)相關綜述論文,相關的算法及最新的研究論文,語音增強的公開數據集,工具包,公共庫,免費課程、ppt、免費書等資源,需要的朋友自取。-《2020年人工智慧狀況報告》免費pdf分享機器學習必讀新書-《凸優化算法原理詳解》免費pdf分享機器學習基礎教材
  • 【薦書】5 本深度學習和 10 本機器學習書籍(下載)
    簡歷投遞:jobs@aiera.com.cn    HR 微信:13552313024【新智元導讀】>來源於datasciencecentral.com的深度學習和機器學習書籍資源推薦。Lewis深度學習基礎(Fundamentals of Deep Learning) by Nikhil Buduma神經網絡和統計學習(Neural networks and statistical learning) by K.-L. Du and M.N.s. S
  • 66本計算機專業必讀經典書籍
    二胖精心整理匯總66本計算機專業必讀經典書籍;書單中包含了之前推薦給大家的《深入理解計算機系統(原書第3版)》和《數據密集型應用系統設計》。下面是書籍截圖及目錄。(原書第3版).pdf(3)計算機科學概論(原書第5版).pdf(4)C程序設計語言(第2版 新版).pdf(9)C陷阱與缺陷(第1版)-人民郵電出版社.pdf(9)C陷阱與缺陷(第2版)-人民郵電出版社.pdf(13)More Effective C++.pdf(14)C++編程思想(兩卷合訂本).pdf
  • 資源 | 20本機器學習與數據科學必讀書籍
    d=RFII4v機器學習是計算機科學發展最快的領域之一,具有深遠的應用。本書的目的是以原則性的方式介紹機器學習及其提供的算法範例。本書提供了機器學習的基礎知識,以及將這些原理轉化為實際算法的數學推導的說明。在介紹基礎知識之後,本書還涵蓋了以前教科書沒有提到的大量重要的課題。
  • 機器學習最佳統計書籍推薦
    有很多關於統計學的大眾科普書籍,在我推薦三本:1、赤裸裸的統計:消除數據中的恐懼《Naked Statistics: Stripping the Dread from the Data》本書假定讀者擁有微積分和一點點線性代數的基礎。但無需概率論和統計學知識。本書還配有大量數據實例和練習以此培養讀者通過R語言快速掌握數據統計分析能力。本書適用於統計學、數學、計算機科學、機器學習與數據挖掘等領域的高年級本科生、研究生,對於相關領域的廣大科研工作者和實際工作者來說也不失為一本有價值的參考書。
  • 網際網路上20大免費數據科學、機器學習和人工智慧慕課
    、數據科學和編程學習中很有用的課程。機器學習專業化的數學——倫敦帝國理工學院這門課程是機器學習的數學專業,它涵蓋了你需要的所有數學知識,幫助更新你在學校可能已經忘記的所有概念和理論。最重要的是,這門課程教你計算機科學的應用,讓你對矩陣和回歸與機器學習和數據科學的關係有更直觀的認識。
  • 【乾貨薈萃】機器學習&深度學習知識資料大全集(二)(論文/教程/代碼/書籍/數據/課程等)
    【導讀】轉載來自ty4z2008(GItHub)整理的機器學習&深度學習知識資料大全薈萃,包含各種論文、代碼、視頻、書籍、文章、數據等等。是學習機器學習和深度學習的必備品!推薦MSRA的Frank Soong老師關於語音合成的深度學習方法的錄像和幻燈片與以及谷歌的LSTM-RNN合成介紹,論文  介紹:新書(可免費下載):數據科學的藝術
  • 經典機器學習書籍推薦
    以極為通俗的語言講述了數學在機器學習和自然語言處理等領域的應用。《Machine Learning》(《機器學習》) 作者Tom Mitchell是CMU的大師,有機器學習和半監督學習的網絡課程視頻。這本書是領域內翻譯的較好的書籍,講述的算法也比《統計學習方法》的範圍要大很多。據評論這本書主要在於啟發,講述公式為什麼成立而不是推導;不足的地方在於出版年限較早,時效性不如PRML。
  • HR必讀的十本書籍推薦,你看過幾本?
    HR必讀的十本書籍推薦,身為人力資源管理者必看哦,你都看過哪幾本呢?1、《人力資源管理必讀12篇》推薦理由:本人最喜歡的一本人力資源管理方面的書籍,其他平臺無售,只能從其官網購買,地址自已百度。如何通過科學的方法及人力資源機制有效激勵和管理員工,是每家企業都在面臨的人才挑戰。《人力資源必讀12篇》集結世界頂級人力資源管理大師經典,從激勵、員工、薪酬、績效、組織發展、招聘、培訓等面向與模塊入手,即充分體現人力資本管理的細枝末節又不失實戰高度,幫助企業破除組織人力資源頑疾,讓CHO(首席人力資源官)比肩CFO(財務長)。
  • AI工程師必讀的10本ML讀物(附PDF下載)
    本文為大家帶來3個方向共10本的機器學習讀物,附帶免費的書籍資源哦~微信後臺回復「學習讀物」獲取文章內的書籍資源介紹很多機器學習與數據科學書籍的價格都令人退避三舍。其實這也無可厚非,畢竟是作者嘔心瀝血、臥薪嘗膽換來的碩果。 然而,這些作者中也不乏善良仁愛之士,將其作品無償分享給他人。這對於那些有志成為數據科學家和AI工程師的人,似如獲至寶。  以下附上機器學習方向的電子書10本,均可免費獲取。
  • 機器學習經典書籍28本,初、中、高級進階全攻略!
    《Machine Learning》(《機器學習》) 作 者Tom Mitchell是CMU的大師,有機器學習和半監督學習的網絡課程視頻。這本書是領域內翻譯的較好的書籍,講述的算法也比《統計學習方法》的範圍要大很多。據評論這本書主要在於啟發,講述公式為什麼成立而不是推導;不足的地方在於出版年限較早,時效性不如PRML。
  • 2020年軟體開發者必讀10本好書推薦
    ^_^有鑑於此,我想藉此機會從我個人看的100本技術書籍中,挑選出10本好書和大家一起分享,只有我們自己成長了、強大了,別人看來的危機反而成為我們的機遇。推薦書單1.大數據工程師、軟體開發者必備圖書,每章都有一張思維導圖!狹義來說,IT的核心主要是信息計算、數據存儲和網絡互聯。如果計算是引擎,高性能計算和人工智慧是皇冠的話,在海量密集數據處理就是數據存儲的最高形式,也是IT的基石。這本書應該是技術開發者必讀書目,極力推薦。豆瓣 9.6的高分,已經說明一切!