免費!10本機器學習和數據科學的必讀書籍推薦

2021-01-10 雷鋒網

雷鋒網按:Matthew Mayo 是知名數據科學網站 KDnuggets 的副主編,同時也是一位資深的數據科學家、深度學習技術愛好者,在機器學習和數據科學領域具有豐富的科研和從業經驗。近日,他在 KDnuggets 上推薦了一份機器學習和數據科學相關的免費必讀書單,雷鋒網特來與大家分享。

需要提前說明的是,這份書單大致以由淺入深的順序排列:首先是關於數據統計,接著是機器學習,最後是一些綜合性的更宏觀的書籍。所有書籍均為英文原著,有中文譯本的我們也都給出了相關連結。

以下是書籍清單和簡單介紹:

Think Stats: Probability and Statistics for Programmers

作者:Allen B. Downey

本書中文名為:《統計思維:程式設計師數學之概率統計》。從書名就能看出來,這本書是為程式設計師群體量身定製的統計學內容介紹,具體內容基於 Python 語言。

本書著重介紹了許多可以用來探索真實數據集的簡單技術,同時還能利用這些技術回答許多非常有趣的統計問題。該書的樣例基於美國國家衛生研究院的真實資料庫,並鼓勵讀者基於真實的數據進行相關研究。

本書有中文譯本,目前英文原版也已經上線了第二版,連結如下:

英文地址: http://greenteapress.com/wp/think-stats-2e/

中文地址: https://www.gitbook.com/book/jobrest/statistical-thinking/details

Probabilistic Programming & Bayesian Methods for Hackers

作者:Cam Davidson-Pilon

本書中文名為《貝葉斯方法:概率編程與貝葉斯推斷》,以計算/理解為主,數學內容為輔,重點介紹了貝葉斯方法理論和概率編程。

作為推斷中最自然和常見的方法,貝葉斯推斷一般以晦澀難懂的數學分析理論為大家所熟知。按照一般的模式,在介紹貝葉斯之前,通常都要先介紹兩到三章的概率論的相關內容。等到概率論介紹完,又常常由於貝葉斯模型的數學複雜度太高,因此只能向讀者展示一些最簡單和粗糙的貝葉斯樣例,於是給讀者造成了一種「貝葉斯似乎也沒什麼用」的錯覺。本書則另闢蹊徑,以簡單通俗的講述開始,由淺入深地介紹了貝葉斯理論在黑客和概率編程中的應用。

中文購買地址: http://dwz.cn/5Kedr9

英文地址: http://t.cn/zQZ1p2m

Understanding Machine Learning: From Theory to Algorithms

作者:Shai Shalev-Shwartz 和 Shai Ben-David

深入理解機器學習:從原理到算法》,書中從原理性的內容出發,介紹了機器學習的基本理論和算法範例,同時給出了將這些基礎理論轉化為實際算法的數學推導過程。介紹完這些基礎理論之後,本書又介紹了許多其他相關書籍很少涉及的核心內容,包括:模型訓練的計算複雜度,穩定性和凸性(convexity)的概念,隨機梯度下降、神經網絡等算法範例,以及 PAC-Bayes 和 compression-based bounds 等新概念。

英文地址: http://www.cs.huji.ac.il/~shais/UnderstandingMachineLearning/

中文購買地址: http://dwz.cn/5Ke6ne

The Elements of Statistical Learning

作者:Trevor Hastie, Robert Tibshirani 和 Jerome Friedman

本書在一些通用概念框架的基礎上介紹了統計學的一些重要思想。雖然書中的許多方法都是基於統計學的,並提供了樣例說明和彩色配圖,但核心思想是在向讀者闡述概念和思想,而並非數學知識。除了統計學概念之外,書中還涉及了神經網絡、監督學習、支持向量機、分類、預測和非監督學習等非常豐富的內容。適合於對行業數據挖掘感興趣的統計人員和所有對新興科技感興趣的朋友。

中文地址: http://www.loyhome.com/elements_of_statistical_learining_lecture_notes/

英文地址: http://statweb.stanford.edu/~tibs/ElemStatLearn/

An Introduction to Statistical Learning with Applications in R

作者:Gareth James, Daniela Witten, Trevor Hastie 和 Robert Tibshirani

統計學習導論:基於R應用》,書中以 R 語言為基礎,詳細介紹了統計學習的核心方法和應用,內容涉及線性回歸、分類、再抽樣方法、壓縮方法、樹方法、聚類、支持向量機等。同時,書中提供了大量基於現實數據的樣例,這些數據來自近 20 年來生物學、金融學、市場營銷學和天體物理學等諸多領域。本書主要面向非數學專業的高年級本科生、碩士研究生和博士生。

中文購買地址: http://dwz.cn/5Ke5dE

英文地址:http://www-bcf.usc.edu/~gareth/ISL/

Foundations of Data Science

作者:Avrim Blum, John Hopcroft 和 Ravindran Kannan

雖然計算機科學的傳統領域仍然非常重要,但是現在已經有越來越多的研究員開始著眼於如何使用計算機來理解和挖掘潛藏在大量數據中的有用信息,而不僅僅是用計算機來解決實際的應用問題。本書詳細介紹了數據科學的基礎理論和應用,作者在前言中指出:「我們希望讀者可以從本書中學到在未來 40 年仍然有用的數據科學基礎知識,正如自動化相關的理論和算法在 40 年前做的一樣。」

英文地址: https://www.cs.cornell.edu/jeh/book.pdf

A Programmer's Guide to Data Mining: The Ancient Art of the Numerati

作者:Ron Zacharski

本書是一個以實踐操作為主的循序漸進式的編程參考,主要以 Python 代碼為基礎,面向數據挖掘的相關使用場景。作者在介紹中表示:「我希望你能參考書中給出的代碼,積極參與數據挖據技術的實踐編程,當你完成全書的所有內容時,實際上已經為數據挖掘技術奠定了堅實的基礎。」

英文地址:http://guidetodatamining.com/

Mining of Massive Datasets

作者:Jure Leskovec, Anand Rajaraman 和 Jeff Ullman

大數據:網際網路大規模數據挖掘與分布式處理》,由史丹福大學 CS246: Mining Massive Datasets 和 CS345A: Data Mining 課程的內容總結而成,主要關注極大規模數據的挖掘。主要內容包括分布式文件系統、相似性搜索、搜尋引擎技術、頻繁項集挖掘、聚類算法、廣告管理及推薦系統。大部分章節後都配有對應的習題,以及豐富的擴展閱讀推薦,用以鞏固所講解的內容。據官網介紹,本書的內容不涉及任何預備知識,任何人都可以直接學習。

中文地址: http://bestcbooks.com/B009HEK8SO/

英文地址: http://mmds.org/

Deep Learning

作者:Ian Goodfellow, Yoshua Bengio 和 Aaron Courville

本書為 Yoshua Bengio 和 Ian Goodfellow 等大神合著的深度學習教科書,該書主要分為三個部分:機器學習和數學基礎,深度學習的基礎實踐,深度學習的進一步研究。全書內容紮實、講解細緻、深入淺出,特別適合深度學習的初學者通過這本書正式入門機器學習領域的研究。

中文地址: https://github.com/exacity/deeplearningbook-chinese

英文地址:http://www.deeplearningbook.org/

Machine Learning Yearning

作者:吳恩達(Andrew Ng)

這是大神 Andrew Ng 的一本書,官網描述稱:

AI,機器學習和深度學習正在改變眾多的行業。但如何搭建一個真正的機器學習系統,首先需要解決如下幾個問題:

應該收集更多的訓練數據嗎?

應該使用端到端的深度學習嗎?

如何處理與測試集不匹配的訓練集?

等等。

此前,關於如何解決這些問題的唯一途徑是研究生課程或諮詢公司。現在我正在寫一本相關的書籍,希望能幫助各位朋友解決類似的問題,幫助大家更好地搭建 AI 系統。

英文地址: http://www.mlyearning.org/

來源:,雷鋒網編譯kdnuggets

雷鋒網相關閱讀:

機器學習漫遊指南 最完整的入門書單(外文版)

原版教材太貴?這幾本機器學習好書其實不需要花錢

免費教材資源第二彈!這回側重數據科學

相關焦點

  • 關於決策的書籍推薦,這本書科學決策必讀
    關於決策的書籍,我只推薦《決策必讀12篇》。《決策必讀12篇》絕對是我看過的最好的決策書籍,沒有之一。為什麼這麼說呢?首先,這本書是一本真正聚焦決策的書,裡面全是關於如何做好決策和科學決策的乾貨,沒有摻雜任何其他內容,是一本非常純粹的決策書籍。
  • 機器學習最佳統計書籍推薦
    然而,很不幸,許多計算機科學和軟體工程的必修課程中,並沒有並統計學。而統計學也是一門很注重理論,必須遵循以自下而上的,理論為先的學習路線,往往給人感覺就是找不著"北"。本文中,蟲蟲給你推薦一些關於數據統計的最佳入門書籍,讓你通過這些世界著名的教材幫你找到應用數據統計"北",從而打下一個很好的統計學基礎。
  • 網際網路上20大免費數據科學、機器學習和人工智慧慕課
    如何線上學習數據科學?最好的慕課 + 正確的學習方法 + 激情 + 項目所以在這篇文章中,我將介紹最好的慕課,它們是免費的,對於想成為數據科學家的人是非常有價值的。數據科學韋恩圖機器學習專業化的數學——倫敦帝國理工學院這門課程是機器學習的數學專業,它涵蓋了你需要的所有數學知識,幫助更新你在學校可能已經忘記的所有概念和理論。最重要的是,這門課程教你計算機科學的應用,讓你對矩陣和回歸與機器學習和數據科學的關係有更直觀的認識。這一專業分為三個主要課程:1. 線性代數2. 多元微積分3.
  • 10本理科生必讀的宇宙和量子力學科普書籍
    導讀:宇宙,量子力學科普書籍推薦。1.世界物理奇遇記。這本書用很詼諧的方式講述了經典物理和量子力學的碰撞,喜歡量子世界的粉絲必讀作品。《上帝擲骰子嗎》是2006年01月01日遼寧教育出版社出版的圖書,作者是曹天元。 該書講述的是關於量子論的故事。量子論是一個極為奇妙的理論。
  • 北大清華推薦書單:大學生必讀的10本經典書籍
    作為猶太人,他的家人都被關進奧斯維辛集中營,最後只有他和妹妹倖存下來。作者不但超越了煉獄般的痛苦,更是將自己的經驗與學術相結合,開創了意義療法,幫助人們找到絕處再生的意義。這本書不僅適合心理學愛好者,也適合正面臨挑戰,希望找到生活的意義的人們。
  • 免費教材資源第二彈!這回側重數據科學
    這次,雷鋒網再為大家呈上數據科學領域的相關圖書、教程。仍然是正版免費,仍然是英文原著,部分有漢語譯本。本列表不分先後次序。█《Foundations of Data Science》作者:John Hopcroft, Ravindran Kannan未出版的教學筆記。正在學習數據科學理論課程的童鞋,這本書是一個不錯的補充。
  • 10本經典的管理學書籍推薦,關於管理學的書都在這裡了
    3、作為簡道雲的運營,我主要推薦企業管理和工作管理的書籍,大都是看過或覺得的確還不錯的。4、我希望你不是:一波點讚收藏感謝完,告訴自己記得看,然後再也不看(手動狗頭)好了,開始看推薦吧!------------------------一條正經的分割線----------------------一、《管理者必讀12篇》一本淺顯易懂的管理學教材,涉及到企業管理的方方面面,即有理論高度又不失實戰價值。
  • 推薦| 九本不容錯過的深度學習和神經網絡書籍
    選自aioptify機器之心編譯參與:微胖、李亞洲、蔣思源針對 30 多本深度學習和神經網絡書籍,我們(AI Optify 數據團隊)使用不同指標(比如,在線評價、打分、所涉主題、作者影響力、出版年份、社交媒體是否提及等)訓練機器學習算法,為每本書打分、排名。讀者可能會喜歡我們的推薦,因為這份榜單基於數據並且客觀。排名靠前的九本書如下。1.
  • 大師兄的10本醫學影像技術類書籍 (含MRI/PET-MRI/腦科學等)
    其一,單一技術的複雜程度已夠深究一輩子,比如MRI,堪稱醫學影像技術的顛覆之作;其二,多種影像技術撲面而來,對臨床問題的解釋與回答,我們需要的是一個合理的解決方案;其三,多學科交叉對醫學影像帶來的技術衝擊,比如AI,比如腦科學計劃等。 這裡,為了幫助大家一起來全面的學習醫學影像類技術,推薦以下書籍,有入門,有難度,有挑戰。
  • 10本宇宙科普書籍推薦
    一《大眾天文學》(弗拉馬裡翁)推薦理由:一本迄今為止,內容最全、篇幅最大、插圖最多的一部天文學科普名著.自它問世以來,一直受到廣泛歡迎,被譯成十幾種文字,影響一代又一代的讀者,許多人因這本書愛上天文學,甚至因此從事天文研究工作
  • 人際關係書籍推薦:兩本書教你玩轉社交
    要想提高人際關係和社交能力,閱讀確實不失為一個好辦法。但是問題是該看什麼書呢?有哪些人際關係書籍推薦值得推薦?筆者強烈推薦《情商必讀12篇》和《溝通與說服必讀12篇》這兩本書。建議你能把這兩本書都完完整整、一字不漏地看完,一定會對你的人際關係與社交能力大有助益。注意,這兩本書都只從12Reads官網獲得,避免廣告,請自行百度書名。
  • 十二本大學生必讀的政治學經典書籍,老師的私藏版
    言言今天給大家推薦的是政治學的經典書籍,這個書單是我們的政治學老師分享給我們的,都是非常經典的書本,希望對大家有所幫助。十二本大學生必讀的政治學經典書籍,分享給大家:亞里斯多德:《政治學》柏拉圖:《理想國》盧梭:《社會契約論》洛克:《政府論》
  • AI專家們推薦的「必讀」論文
    這次推薦的論文依然是分量十足、誠意滿滿,各位推薦者都認為自己推薦的論文是AI人員必讀的經典之作,不知各位讀者怎麼看。現在,我們來看看這次入選的是哪些論文吧!不過在這之前,我還是向您推薦我們之前的那一篇文章,那篇文章也絕對值得一讀。
  • 一本100頁的機器學習書籍近日大受好評
    一本100頁的機器學習書籍近日大受好評 李倩 發表於 2018-11-20 09:27:37 這是一本只有100頁,任何只要有基礎數學知識的人都能看懂的機器學習書籍。
  • 數據科學和機器學習的最佳Python庫
    數據科學和機器學習是該時代最需求的技術,這一需求促使每個人都學習不同的庫和軟體包以實現它們。這篇博客文章將重點介紹用於數據科學和機器學習的Python庫。這些是您掌握市場上最被炒作的兩項技能的庫。以下是此博客中將涉及的主題列表:數據科學與機器學習導論為什麼要使用Python進行數據科學和機器學習?
  • 2020年 Top 20 機器學習和數據科學網站
    每天我都能看到瘋狂的信息流,不幸的是,有很多虛假或毫無價值的東西,尤其是在數據科學和ML上。哪裡可以找到所有相關和有用的材料?-這就是問題所在。和大家分享我整理的機器學習和數據科學網站。#8 Data Science Central數據科學中心也許是網絡上最好的獨立數據科學博客。該網站專為大數據從業者設計,提供社區體驗,包括擴展的編輯平臺、社交互動、基於論壇的技術支持、最新的技術、工具和趨勢,以及行業就業機會分類部分。Data Science Central還提供網絡研討會和獨特的會員套餐,可免費訪問網站上的所有內容。
  • 自然語言處理必讀:5本平衡理論與實踐的書籍
    即使是在找一本關於某個主題的書,也會很快發現這樣的書太多了,無法快速判斷哪一本最適合自己。為了幫助你解決問題,我幫你選擇5本關於自然語言處理的書,不像其他的書單,除了第一本之外,這些書都不是免費的,但事實證明它們是值得投資的,希望能對大家有所幫助。
  • 關於人際關係的書籍推薦,如何提高人際交往能力?
    人際關係最重要的就是溝通、說服、情商與影響力,這方面的書籍比較推薦《情商必讀12篇》或者《溝通與說服必讀12篇》也可以,12Reads系列的書都不錯,品質最起碼有保障。關鍵要看你自己人際關係能力的短板在哪裡,但溝通和情商一般情況下都是良好人際交往的基礎。
  • 適用於初學者和高級程式設計師的10本最佳SQL書籍
    無論您是全職開發人員還是數據科學愛好者,您都必須在職業生涯中的某個時候與SQL握手。 SQL將幫助您快速分析數據,編寫查詢以高效地準備,過濾,排序,組織數據等等。作者 | 大唐小志學習SQL的最佳方法是通過練習,還有什麼比讀書和一起工作更好的練習方法! 這就是為什麼我們選擇了十大SQL書籍來幫助您從零開始學習SQL的原因。
  • 豆瓣高分推薦,年輕人必讀的10本書!你讀過嗎?
    在這個知識信息爆炸的時代,有數以億計紙質書籍和電子書資源,如果我們不對閱讀書籍進行篩選和整理,最後這些書籍只會成為堆滿我們儲物空間和佔滿Kindle內存的雜物。我們不僅要多讀書,還要學會讀好書。結合豆瓣TOP100高分書籍和知乎萬贊回答推薦書籍,書香君為你精選了年輕人必讀的10本書。每一本都值得你認真咀嚼,它們最終將會內化為你人格的一部分,並對你的一生產生巨大影響。