資源| 自學數據科學&機器學習?19個數學和統計學公開課推薦

2020-12-05 機器之心Pro

選自analyticscvidhya機器之心編譯

在創造萬物之前,上帝只是在做純理論的數學。後來他想,做點應用數學應該是個有趣的變化。——數學家 John Edensor Littlewood

數學和統計學是數據科學和機器學習的基礎。就我所知,大多數成功的數據科學家都來自這些領域——計算機科學、應用數學和統計學、經濟學。如果你想掌握數據科學,你就必須要對基本代數和統計學有很好的了解。

但是,對於沒有數學背景的人來說,起步之路可能會舉步維艱。首先,你必須要搞明白哪些必須學,哪些沒有必要——其中可能包含了線性代數、微積分、概率學、統計學、離散數學、回歸、優化等許多主題。你需要多麼深入這些主題?自學的話很難單靠自己把這一切都把握好。

如果你正面臨著這樣的難題,不要驚慌,現在我已經把這項艱辛的工作幫你完成了。這份列表推薦了來自 Coursera、edX、Udemy 和 Udacity 的最受歡迎的數據科學數學基礎公開課。這份列表經過了精心的編排,讓你可以結構化地自學數據科學所需的數學概念。

現在就開始學習吧!

什麼樣的課程適合你?

為了幫助你瀏覽這些課程,我將課程分為初級、中級以及高級三類,分別針對不同學習者。在深入學習前,請選擇你的數學專業水平。我添加了修習每個課程之前必須做的功課,以資參考。

學習完預備課程才能更好地理解後續課程,這樣的課程很少。所以,你一定要確定了解這些課程主題或者上過這些課。

接著讀,找到適合你的課程!

內容目錄:

初級數學水平/統計學

數據科學數學技巧描述統計學入門推論統計學入門概率和數據入門無處不在的數學:有限數學應用概率:基礎概念&離散隨機變量數學生物統計學訓練營 1線性代數應用 第一部分數學思維入門

中級數學水平/統計學

貝葉斯統計學:從概念到數據分析博弈論 1博弈論 2 :高級應用數據科學的高級線性模型 1:最小二乘數據科學的高級線性模型 2:統計線性模型線性模型和矩陣代數入門運動中的數學

高級數學水平/統計學

離散優化基因組數據科學統計學大數據應用的生物統計學

初級水平的數學和統計學

1. 數據科學數學技巧(Data Science Maths Skills)

地址:https://www.coursera.org/learn/datasciencemathskills

課程周期:4 周

授課:杜克大學(Coursera)

如果你是個初學者,數學知識十分有限,那麼,這個課程很適合你。課程中,你會了解許多代數概念,比如集合論、不等式、函數、坐標幾何、對數以及概率等等。

這個課程會帶你瀏覽數學科學所需的所有基礎數學技能並打下堅實基礎。

課程開始時間為 2017 年 1 月 9 日,授課老師來自杜克大學。

預備知識:基礎數學知識

2. 描述統計學入門(Intro to Descriptive Statistics)

地址:https://www.udacity.com/course/intro-to-descriptive-statistics--ud827

課程周期:8 周

授課:Udacity (Coursera)

對於想要學習統計學的初學者來說,Udacity 的這門課是非常好的入門指南。內容有趣、實用,而且有很多實例。描述統計學首先會讓你熟悉各種統計學和定義。然後教授統計學概念,比如集中趨勢(central tendency)、可變性(variability)、標準正態分布以及取樣分布。這門課並不需要你提前掌握一些統計學知識,現開放註冊。

預備知識:無

3. 推論統計學入門(Intro to Inferential Statistics)

地址:https://www.udacity.com/course/intro-to-inferential-statistics--ud201

課程周期:8 周

授課:Udacity(Coursera)

學完描述統計學後,就該學習推論統計學了。本課程仍然延續了實用的授課方式。

課程中,你會學到諸如估算(estimation)、假設檢驗、t 檢驗、卡方檢驗、單向方差分析、雙向方差分析以及相關、回歸等統計概念。

每個主題後面還配有習題集和小測試。課程結束後,你還能在真實數據組上測試學習情況。課程已開放註冊。

預備知識:完全理解描述統計學(Descriptive Statistics,即上面的第 2 個推薦)

替代課程:《統計學:打開數據世界之門(Statistics: Unlocking the World of Data)》,一個為期 6 周的匹茲堡大學的課程(edX)。地址:https://www.edx.org/course/statistics-unlocking-world-data-edinburghx-statsx#!

4. 概率和數據入門(Introduction to Probability and Data)

地址:https://www.coursera.org/learn/probability-intro

課程周期:5 周

授課:杜克大學(Coursera)

本課會帶你使用 R 和 RStudio 接觸數據視覺化和數值統計。

首先帶你掌握概率和數據挖掘基本概念,開始對課程有個基本了解。然後,分別解釋不同主題下的各個概念。最後會使用真實數據集,通過一個數據分析項目測試你的學習情況。

授課人是來自杜克大學的統計學教授,也需要你預先掌握專門的 R 統計學知識。如果希望為了研究數學科學而學習 R,那麼,這門課程不容錯過。課程已開放註冊。

預備知識:基礎統計學和 R 知識。

5. 無處不在的數學:有限數學應用(Math is Everywhere: Applications of Finite Math)

地址:https://www.udemy.com/math-is-everywhere-applications-of-finite-math/

授課周期:1 周

授課:戴維森分校(Udemy)

課如其名,講授無處不在的數學,從憤怒的小鳥到谷歌。以有趣的方式講授應用中的數學概念。

課程中,你會學到如何使用線式方程(equation of lines)來創造計算機字體、圖論如何在憤怒的小鳥中扮演重要角色、線性系統如何為一個運動團隊的表現建模以及谷歌如何使用概率和模擬來保持在搜尋引擎上的領先優勢。

授課人系戴維斯分校的數學教授,開放註冊。

預備知識:要懂線性代數和編程。

6. 概率論:基本概念和離散型隨機變量(Probability: Basic Concepts & Discrete Random Variables)

地址:https://www.edx.org/course/probability-basic-concepts-discrete-purduex-416-1x

課程周期:6 周

授課:普渡大學(Purdue University)

本課程是為謀求有關數據科學和信息科學職業者所設計。其涵蓋了數學概率論的基本要素。

在本課程中,你將學習到概率論、隨機變量、分布、貝葉斯定理概率質量函數和 CDF、聯合分布律和期望值等基本概念。

一旦你熟悉了這些基礎知識,就可以研究更加深入的概念,如伯努力和二項式分布、幾何分布、負二項式分布、泊松分布、超幾何分布和離散均勻分布。

在學習本課程之後,你將對日常生活中的概率應用有一個深入了解。本課程已開放註冊。

預備知識:基本統計學知識。

7. 數學生物統計學訓練營 1(Mathematical Biostatistics Boot Camp 1)

地址:https://www.coursera.org/learn/biostatistics

課程周期:4 周

授課:約翰霍普金斯大學(Johns Hopkins University)

實際上,「生物統計學」裡面的「生物」是個誤導。本課程全是用於數據分析的概率論和統計學技術基礎。

該課程包含概率、期望、條件概率、分布、置信區間、bootstrapping、二項式分布(binomial proportions)和對數分布(logs)。

線性代數和編程的背景知識對本課程很有幫助,但不是強制需要的預備知識。該課程從 2017 年 1 月 16 日開始,由約翰霍普金斯大學的生物統計學教授授課。

該課程進度合理並會對數理統計進行完整的剖析。

預備知識:基本線性代數、微積分和實用編程(非強制)。

8. 線性代數的應用(第一部分)(Applications of Linear Algebra Part 1)

地址:https://www.edx.org/course/applications-linear-algebra-part-1-davidsonx-d003x-1

課程周期:5 周

授課:戴維森學院(Davidson College (edX))

這是一門講述線性代數在數據科學中應用的有趣課程。

本課程將首先介紹線性代數的基本知識。然後將向你介紹線性代數的應用,如用於手寫數字識別和球隊排名等在線代碼。

本課程開放註冊。

預備知識:基本線性代數知識

9、數學思維入門(Introduction to Mathematical Thinking)

地址:https://www.coursera.org/learn/mathematical-thinking#

課程周期:8 周

授課:史丹福大學(Coursera)

這門來自史丹福大學的課程會教你掌握分析思維技能。你能學到有趣的開箱即用的思維方式,幫助你在競爭中保持優勢。

在這門課中,你將學會一種語言、量詞分析,數論以及實分析的簡單入門。充分掌握這本課程需要熟悉代數、數系(number system)以及初級集合論的知識。

課程將於 2017 年 1 月 9 日開始,授課老師來自史丹福大學。目前已開放註冊。

預備知識:基礎代數、數系以及初等集合論。

中等數學與統計學

這個時候,你應該已經知道了一個數據科學家需要知道的所有基礎概念。是時候把你的數學知識提升到下一個級別了。

1. 貝葉斯統計:從概念到數據分析(Bayesian Statistics: From Concept to Data Analysis)

地址:https://www.coursera.org/learn/bayesian-statistics

課程周期:4 周

授課:加州大學(Coursera)

貝葉斯統計師數據科學的一個重要課題。因某些原因,它沒獲得足夠的重視。

在此課程中,第一節講了基礎的概率課題,比如條件概率、概率分布和貝葉斯定理。然後,你會學習 Frequentist 和貝葉斯方法的統計推斷、選擇最優分布的方法、離散數據的模型以及連續數據的貝葉斯分析。

上此課程需要之前需要掌握統計概念的知識,課程開始於 2017 年 1 月 16 日。

預備知識:基礎與高級統計學

2. 博弈論 1(Game Theory 1)

地址:https://www.coursera.org/learn/game-theory-1

課程周期:8 周

授課:史丹福大學和英屬哥倫比亞大學(Coursera)

博弈論是數據科學中一個非常重要的組成部分。本課中,你會學習博弈論的基礎知識及其應用。如果你打算今年掌握強化學習,這門課非常適合你。

課程會讓你對以下內容等有個基本了解:表徵博弈和策略、擴展形式(計算機科學家稱為博弈樹)、貝葉斯博弈(為諸如拍賣之類的事情建模)、重複和隨機博弈。每個概念都會輔以樣例和應用。授課老師來自史丹福大學和英屬哥倫比亞大學,已開放註冊。

預備知識:基礎概率和數學思維

3. 博弈論 II:高級應用(Game Theory II: Advanced Applications)

地址:https://www.coursera.org/learn/game-theory-2

課程周期:5 周

授課:史丹福大學和英屬哥倫比亞大學(Coursera)

在之前的課程上過博弈論基礎之後,該課程是對博弈論高級應用的講解。

在此課程中,你將會學到如何設計代理之間的交互,從而獲取好的社會結果(social outcome)。課程覆蓋的三個主要課題是:社會選擇理論、機制設計和競拍。

該課程開始於 2017 年 1 月 30 日,由來自史丹福大學與英屬哥倫比亞大學的教授教課。

課程已經開放註冊。

預備知識:博弈論基礎

4. 線性模型導論和矩陣代數(Introduction to Linear Models and Matrix Algebra)

地址:https://www.edx.org/course/introduction-linear-models-matrix-harvardx-ph525-2x-0

課程周期:4 周

授課:哈佛大學(edX)

矩陣代數已在實驗性設計和高維數據分析的各種工具中使用。

為了易於理解,這個課程分成 7 部分以循序漸進的方式進行講授。你將會學到矩陣代數的符號及其運算,數據分析中的矩陣代數應用,線性模型和 QR 分解。

這個課程所用的程式語言是 R 語言。你可以自由選擇課程內容中更迎合你興趣點的部分並進行相應內容的學習。

這個課程是由哈佛大學的生物統計教授講授,且目前只開放給該課註冊學員。

預備知識:線性代數基礎和 R 語言知識

5. 數據科學的高階線性模型 1:最小二乘法(Advanced Linear Models for Data Science 1: Least Squares)

地址:https://www.coursera.org/learn/linear-models

課程周期:6 周

授課:約翰霍普金斯大學(來源:Coursera)

這個課程是高階線性統計學習模型兩部分系列的第一部分內容。那些對回歸模型已經有了解並且想要在這上面尋求進一步學習的人一定要學習這個課程。

在這個課程裡,你將會學到一個和兩個參數的回歸分析、線性回歸分析、一般最小二乘法、最小二乘法的範例、基礎以及殘差。在你開始下一步學習之前,我需要澄清一點,你需要有線性代數基礎、多元微積分基礎、了解統計和回歸模型、熟悉基於論證的數學和 R 語言的操作知識。這個課程將在 2017 年 1 月 23 日開始。

預備知識:線性代數、微積分、統計學以及 R 語言知識

6. 數據科學的高階線性模型 2:統計的線性模型(Advanced Linear Models for Data Science 2: Statistical Linear Models)

地址:https://www.coursera.org/learn/linear-models-2

課程周期:6 周

授課:約翰霍普金斯大學

這個是高階線性統計學習模型課程的第二部分。那些對回歸模型已經有了解並且想要在這上面尋求進一步學習的人一定要學習這個課程。

在這個課程裡,你將會學到多元正態分布的統計建模基礎、分布結果以及殘差選項的基礎內容。在你開始下一步學習之前,我需要澄清一點,你需要有線性代數基礎、多元微積分基礎、了解統計和回歸模型、熟悉基於論證的數學和 R 語言的操作知識。這個課程將在 2017 年 1 月 23 日開始。

預備知識:線性代數、微積分、統計學以及 R 語言知識

7. 體育中的數學(Maths in Sports)

地址:https://www.edx.org/course/math-sports-notredamex-mat150x

課程周期:8 周

授課:聖母(Notre Dam)大學(來源 edX)

我是一個對數學如何被用於觸發運動和日常生活更深入見解非常好奇的人。

我發現了這個課程,這個課程呈現了你最喜愛運動中如何運用數學來分析數據並且預知運動員及其團隊的發展趨勢和未來表現。

在這個課程裡,你將會學到歸納推理是如何被用於數學分析的;概率論怎麼被用於數據評估以及風險和任何事件結果的評估。

所有主要的團隊運動,田徑運動,甚至極限運動如攀巖都包括在課程之中。這個課程是由聖母大學的教授講授,目前只開放給註冊該課程的學員。

預備知識:統計學和線性代數

高級數學和統計學

太棒了,到目前為止,你將可以完全自主學習了。你應該已經掌握了數學與統計上的一些技巧,將會對接下來的繼續學習充滿信心,加油!

1. 離散最優化(Discrete Optimization)

地址:https://www.coursera.org/learn/discrete-optimization

課程周期:8 周

授課:墨爾本大學(來源 Coursera)

所有行業以及公司都會運用最優化。航空公司運用最優化來確保固定的周轉時間;電子商務公司如亞馬遜運用最優化來實現貨物的準時送達。最優化在宏觀層面上的應用包括成千上萬人的供電部署、新藥的研發路徑制定等等。

這個課程給你提供一個全方位理解離散最優化的機會,並且離散最優化已用於我們日常生活。這個課程首先會帶你學習離散最優化的基礎知識及其不同技巧。你將會學到約束條件(constraint),線性和混合整數的編程。這個課程的最後一部分包括了最優化的高階專題。

學習這門課程的先決條件是你需要具備很好的編程能力,對基礎算法的了解以及線性代數知識。這門課將在 2017 年 1 月 16 日開始,由墨爾本大學的教授講授。

預備知識:編程、算法和線性代數

2. 基因數據科學的統計(Statistics for Genomic Data Science)

地址:https://www.coursera.org/learn/statistical-genomics

課程周期:4 周

授課:約翰霍普金斯大學

如果你渴望成為下一代數據測序科學家,那麼你必須學習這個課程。

在這個課程裡,你將會學到探索性分析;線性建模;假設測試和多假設追蹤測試;不同類型的數據處理如轉錄組測序(RNA-seq)、全基因組關聯研究(GWAS)、染色質免疫共沉澱測序(ChIP-Seq)以及 DNA 甲基化(DNA Methylation)研究。這個課程是約翰霍普金斯大學基因組數據科學家特別專題的一部分。課程將會從 2017 年 1 月 16 日開始。

預備知識:高階統計和算法

3. 大數據應用的生物統計(Biostatistics for Big Data Applications)

地址:https://www.edx.org/course/biostatistics-big-data-applications-utmbx-stat101x

課程周期:8 周

授課:德州大學醫學部(來源 edX)

這個課程是對運用生物醫學大數據進行數據分析的介紹。

在這個課程裡,你將會學到生物統計方法的基本組件。不熟悉統計學的人在處理生物醫學的大數據時能遇到不同類型的挑戰。

學習在生物醫學數據類型下基本統計是如何運用的。你將在課程裡學到 R 語言編程的基礎知識;如何創建以及解釋數據的圖形摘要;參數化和非參數化的推論統計方法。你將會收穫 R 語言下生物醫學問題的處理經驗。

這個課程開放給註冊該課程的學員。

預備知識:高階統計學和 R 語言知識

尾注

希望你覺得這篇文章有用。到目前為止,你已經搞清楚了自學的學習領域。如果你有數學背景,可以學習高級課程。如果沒有,就從初級開始吧,再一步步前進。

相關焦點

  • 統計學公開課大盤點
    在接觸了一些統計學公開課後,發現網絡上還有很多的免費的在線統計學課程可以用來學習和複習相關的知識點,只是缺乏一些整理和匯總。所以決定在這裡做一些系統的課程資源整理和匯總。 1、Udacity的「Introduction to Statistics(統計學導論課程)」 入門級課程,強烈推薦。
  • 乾貨匯總:統計學及統計軟體學習資源(0520)
    統計文章匯總一起學統計工具使用技巧其他教材推薦及資料下載《實驗設計、統計分析及數據挖掘》,回復「DPS」統計基礎理論公開課(按課程名稱拼音排序,請在開課時間段內抓緊學習)》公開課(2018年3月5日~7月13日),回復「STAT005」中南大學《科學計算與MATLAB語言》公開課(2018年1月8日~4月1日),回復「STAT048」中南大學《科學計算與數學建模》公開課(長期有效),回復「STAT025」臺灣大學《臨床試驗》
  • 什麼樣的人適合學習數據分析?小白如何自學數據分析?
    什麼叫數據分析?什麼樣的人適合學習數據分析?應該學習哪些內容?需要用到哪些學習資料?自學數據分析如何安排時間?不是相關專業,如何打造簡歷?這裡需要分情況討論,如果你的職業目標是希望成為一名偏建模方向,或者是偏技術方向的數據分析師的話,對數學和編程的能力要求是很高的,靠短期的突擊達到要求是比較困難的;如果想學習數據分析的技能,或者想成為一名偏業務方向的數據分析,有數學或者編程基礎最好,沒有也可以通過短期內的學習來達到要求,明確自己的目標,再根據自己的情況去進行合理的選擇。
  • 關於數據科學中數學和統計學的完全指南
    數學和統計學對學習數據科學至關重要,因為這些學科構成了所有機器學習算法的基礎。成為一名數據科學家,除了對程式語言要有很好的了解,還必須要掌握機器學習算法、數據驅動方法。但數據科學並不只涉及這些領域。在本文中,您將了解數學和統計學對數據科學的重要意義以及如何將其用於建立機器學習模型。
  • 數據分析學習:入數據科學大坑,我需要什麼樣的數學水平?
    所以,本文作者闡釋了數據科學和機器學習為何離不開數學,並提供了統計學與概率論、多變量微積分、線性代數以及優化方法四個數學分支中需要熟悉的一些數學概念。本文的作者是物理學家、數據科學教育者和作家 Benjamin Obi Tayo 博士,他的研究興趣在於數據科學、機器學習、AI、Python 和 R 語言、預測分析、材料科學和生物物理學。
  • 如何自學MIT的應用數學課程?這裡有個參照給你
    生物學和認知科學背景出身,中途迷上了神經網絡,開始學習機器學習並自學編程,為了看懂機器學習文獻又去自學數學,然後愛上了數學——這就是本文作者和數學結緣的原因,也是他決定自學MIT應用數學的動機。本文詳細介紹了作者準備自學數學課程的計劃 ↓↓今年夏天我打算做一個特別有意思的個人發展項目:完成MIT的應用數學課程。
  • 2020麻省理工最新公開課資源,最牛的CS課程免費學,這也太划算了吧!
    有哪些好的網課推薦? 說到網課,其實美國大學的公開課就是最好的選擇之一。今天,小編就給大家帶來了麻省理工2020年最新公開課的資源。作為理工學院的大牛,MIT的公開課是不少理科學生夢寐以求的。
  • 10本機器學習和數據科學的必讀書籍推薦
    雷鋒網按:Matthew Mayo 是知名數據科學網站 KDnuggets 的副主編,同時也是一位資深的數據科學家、深度學習技術愛好者,在機器學習和數據科學領域具有豐富的科研和從業經驗。近日,他在 KDnuggets 上推薦了一份機器學習和數據科學相關的免費必讀書單,雷鋒網特來與大家分享。
  • 中科大統計學python_python 中科大 - CSDN
    ,包括數據預處理、分類、聚類、回歸、關聯、推薦、集成學習、進化計算等。強調在知識的廣度、深度和趣味性之間尋找最佳平衡點,在生動幽默中講述數據挖掘的核心思想、關鍵技術以及一些在其它相關課程和教科書中少有涉及的重要知識點,適合對大數據和數據科學感興趣的各專業學生以及工程技術人員學習。
  • 如果能重來,我選擇這樣學習數據科學……
    我花了大量的時間了解應該從哪裡開始,首先學習什麼,以及利用哪些資源。在過去的兩年裡,筆者學到了一些希望有人能早早教導我的事情,比如應該首先關注編程還是統計,應該利用什麼資源學習新技能,以及如何學習新技能等等。因此,本文旨在為那些正在數據科學道路上迷茫徘徊的人提供一些指導和見解。一名有抱負的數據科學家通常會希望能完全理解各種機器學習算法、數據科學思想等的概念和細節。
  • 【新書推薦】《機器學習及R應用》目錄
    編者薦語:  《機器學習及R應用》終於上市啦!不少讀者想知道《機器學習及R應用》的目錄。這裡附上詳細的二、三級目錄清單,讓我們先睹為快!  以下文章來源於計量經濟學及Stata應用,作者愛計量。  目錄  第1章 緒論  1.1什麼是機器學習  1.2機器學習的分類  1.3機器學習的術語  1.4機器如何學習  1.5機器學習與統計學
  • 免費教材資源第二彈!這回側重數據科學
    這次,雷鋒網再為大家呈上數據科學領域的相關圖書、教程。仍然是正版免費,仍然是英文原著,部分有漢語譯本。本列表不分先後次序。█《Foundations of Data Science》作者:John Hopcroft, Ravindran Kannan未出版的教學筆記。正在學習數據科學理論課程的童鞋,這本書是一個不錯的補充。
  • 統計學的實質是什麼?--寫給所有將要或者正在學習統計學的朋友們
    ,通過搜索、整理、分析、描述數據等手段,以達到推斷所測對象的本質,甚至預測對象未來的一門綜合性科學。統計統計學研究數據,發現數據背後的規律。不過,大部分初學者對這樣的統計學定義依然一知半解。統計學的本質是什麼?統計學是數學嗎?如果不是數學,它和數學有什麼關係?我們統計分析的目的是什麼?它的原理難以理解,如何應用統計原理於數據分析呢?
  • 統計學:從數據入手 探尋事物內在規律
    大部分人對統計學的認識只停留在表面階段,認為統計學就是簡單的收集、整理和記錄數據。其實不然,統計學不僅僅是簡單的收集整理數據,它是一門通過分析挖掘數據內在數量規律性的科學,是一門研究如何解釋、分析和應用數據的方法論科學,是一門融合自然科學和社會科學的學問。 浙江大學數學系蘇中根教授說:「統計學專業是學習和研究隨機現象(不確定現象)規律的一門學科。
  • 網際網路上20大免費數據科學、機器學習和人工智慧慕課
    全文共4864字,預計學習時長14分鐘在21世紀,傳統教育已經轉變為一種選擇,而不是人生中的必經階段。隨著網際網路的繁榮和大規模網絡公開課(mooc慕課)的興起,人們可以選擇在線學習數據科學,以避免學生的債務負擔。統計數據顯示,線上教學使學生在每小時的訓練中可以多學習5倍的材料。
  • 準備好進入數據科學領域了嗎?先問問自己這14個問題
    我建議從Python開始,因為越來越多的學術訓練項目和行業將Python用作數據科學的默認語言。7.成為數據科學家要多長時間如果你有紮實的分析學科背景知識,如物理、數學、工程、計算機科學、經濟學或統計學,基本上可以自學數據科學的基礎知識。你可以從edX、Coursera或DataCamp等平臺上學習免費的在線課程。
  • 想從事數據科學?統計學60分怎麼夠!
    一直以來,小編都對數學有一種執念,似乎覺得只要數學好,就能走上人生巔峰。N年後,看到數據科學發展得風生水起,並且跟數學息息相關,我暗自發誓:錯過的青春和數學我都要補回來!於是勾搭了一位數學科學家,想找他開開光。他噗嗤一笑,用飽含同情的目光看著我,鄭重地將《基本數學和數學科學統計教程》交到我手上。
  • 吳軍《數學之美》:大數據的數學基礎和大數據的利弊
    在《數學之美》中,吳軍在第31章重點談到了大數據的威力和數據的重要性。從2010年開始,「大數據」頻繁亮相於各種媒體,那麼,「大數據」究竟是怎麼一回事?它是否就是大量的數據呢?它的數學基礎是什麼?它又有什麼作用和利弊呢?01什麼是數據?
  • [公開課]《Python:從計算到算計》第04講: 科學計算(Scipy)
    機器學習: An introduction to machine learning with scikit-learn機器學習: 手寫數字識別機器學習: 人臉補全Python普通最小二乘法[公開課]機器學習(01-04): 四個例子[公開課]機器學習(05-06): 分類結果的評價
  • 關於機器學習,這可能是目前最全面最無痛的入門路徑和資源!
    最近有不少童鞋給李傑克留言,說自己對機器學習很感興趣卻無從下手,想知道我的學習路徑,也希望我可以分享一些適合入門的學習資源給到大家。 二、科學計算庫numpy和pandas numpy和pandas是非常出名兩個科學計算庫,很多做數據分析和金融的童鞋都會用到。 那為什麼機器學習會用到這兩個庫了? 我們先來無腦吟唱下這句話:在機器的世界裡,萬物皆可為向量。向量其實也算是一維的矩陣,我們的訓練數據和要預測的數據也都是以矩陣的形式餵給機器的。