開發者入門必讀:最值得看的十大機器學習公開課

2020-12-13 雷鋒網

在當下的機器學習熱潮,人才匱乏十分顯著。截至目前,國內開設人工智慧(AI)專業的高校不多,相當多的開發者是跨界入門,需要自學大量知識並摸索。因而優質的學習資源至關重要。因此,雷鋒網搜集了全世界範圍內最受歡迎的機器學習課程,整理成這份「機器學習十大入門公開課」盤點,集中呈現給各位。這份推薦榜頗費心血,綜合考慮了難易、側重點、時效性等諸多因素,希望能幫助大家找到最適合自己的學習資源。

這些課程全部免費開放,但有些需翻牆,有的缺少中文字幕。

1. 吳恩達「機器學習」公開課

無論國內國外,這是最火的機器學習入門課程,沒有之一。無數新手都是通過這門課對機器學習初窺門徑。吳恩達老師用極其清楚直白的語言,對機器學習的幾種主要算法做了初步介紹。

這門課最大的特點,是它側重於概念理解而不是數學。數學推導過程基本被略過,重點放在讓初學者理解這背後的思路。另外,它還十分重視聯繫實際和經驗總結:1. 課程中吳恩達老師列舉了許多算法實際應用的例子 2. 他提到當年他們入門 AI 時面臨的許多問題,以及處理這些難題的經驗。

課程中代碼教程使用的是 Octave/MATLAB,因此不需要會 Python、C 語言,適合沒有編程基礎的新手。

總結起來,這門課對數學、統計、IT 基礎薄弱的童鞋十分友好。其實很多機器學習入門課,都是假定學生已修完這一門,於是重點對其進行補充——講解這門課程中吳恩達老師未涉及、或是涉及不深的話題。因此,對於機器學習 「一張白紙」的童鞋,雷鋒網強烈推薦從這門課起步,然後選擇其他入門課程進階,以在腦海中建立起更全面的知識體系。另外,Coursera 上這門課的論壇十分活躍,不管拋出什麼問題都會有人解答,算是一個額外的好處。

彩蛋:網易公開課上有吳恩達老師在斯坦福授課的實錄視頻。內容比較深入,但時間比較久了,可作為進階姊妹篇。地址:http://open.163.com/special/opencourse/machinelearning.html

2. 加州理工 「從數據中學習」

  • 課程名稱:Learning from Data,網易公開課譯名為「加州理工學院公開課:機器學習與數據挖掘」

  • 主講人:Yaser Abu-Mostafa

  • 授課機構:加州理工學院

  • 發布平臺:edX(原版),網易公開課

  • 語言:英語,網易有漢語字幕

  • 網址: https://www.edx.org/course/caltechx/caltechx-cs1156x-learning-data-2516,edX;

    http://open.163.com/special/opencourse/learningfromdata.html,網易。

這同樣是一門機器學習的入門課,但並不簡單。該課程強調數據,是因為機器學習與各領域的大數據處理應用(比如金融、醫療)聯繫十分緊密。這門課內容涵蓋基礎理論、算法和應用,平衡了理論與實踐,既覆蓋數學統計,也包含啟發式的概念理解

課程結構是這樣的:

  • 什麼是學習?

  • 機器能學習嗎?

  • 怎麼做到?

  • 怎麼做好?

  • 經驗教訓。

不少人評論該課程結構就像講故事,它有助於學習者形成對機器學習概念和模型深度、直覺性的理解。學習者公認它內容非常充實,但對作業模塊的爭議很大:有人認為難度偏高並且缺乏反饋,有人認為它是網上能找到的、最好的機器學習練習。

彩蛋:Yaser Abu-Mostafa 出版了同名著作 《Learning From Data》,可作為該課程的教材和補充。

3. Tom Mitchell 機器學習課程

這門課是學界人士的最愛,是入門課程之中較全面、高階的一門。課時為 15 周,遠超大多數機器學習慕課。其覆蓋的話題非常廣,按先後次序包括:代數和概率論,機器學習的基礎工具,概率圖模型,AI,神經網絡,主動學習,增強學習。課程內容和練習十分簡潔明白,概念解釋清楚到位。

Tom Mitchell 是 AI 領域德高望重的老牌宗師,他的《Machine Learning》 (中文版為《計算機科學叢書:機器學習》),是最經典的機器學習教科書之一。但因為時間久遠,涉及的一些概念與今天的開發者並沒有太大關聯,更適合需要了解人工智慧來龍去脈的大學師生。這門課程與之類似,能幫助學習者理清機器學習的發展脈絡。它適合計劃進行系統性學習、投入大量時間的人。

對於初學者,建議至少聽完吳恩達的機器學習課程之後,再修這一門。

4. 臺大林軒田老師的機器學習基石

  • 課程名稱:機器學習基石

  • 主講人:林軒田

  • 授課機構:臺灣大學

  • 發布平臺:Coursera

  • 語言:漢語

這是為漢語學子量身定做的入門課,相當於臺灣大學機器學習課程前半學期的課,教給大家的是機器學習最核心的知識。林老師是教科書《Learning From Data》 的作者之一,是華人機器學習領域年輕有為的青年學者。這門課程十分用心細緻,內容比吳恩達老師的入門課程稍稍充實一些。

林老師表示,針對頂級機器學習公開課全是英語授課的現狀,不少學生反映英語教學有不易吸收之處。因此,借推出這門課程,希望幫助漢語為母語的學生減少入門難度。

針對如何讓學生接受枯燥的算法,林老師說道:

「我們的課程設計中,大家會看到我們把對算法與數學式的推導,以『解決問題』的過程方式呈現。也就是說,我們對算法的介紹是環繞著『為什麼』出發的,當同學們腦中有『為什麼』的時候,就有目標去理解這些算法與數學式的內容了。」

《Learning From Data》 也可作為這門課的教科書。學習 Yaser Abu-Mostafa 的課程有不解之處,可與這門課互相印證。

目前該課程已在 Coursera 下架,何時重開尚屬未知。好在網易公開課、Youtube 倒是有全套視頻,地址是:http://c.open.163.com/coursera/courseIntro.htm?cid=938 以及 https://www.youtube.com/playlist?list=PLXVfgk9fNX2I7tB6oIINGBmW50rrmFTqf。更多課程資料可從臺大官網找到(網頁為英語)http://www.csie.ntu.edu.tw/~htlin/mooc/。

彩蛋:臺大 2015 年機器學習課程的大綱以及學習資料(PPT):https://www.csie.ntu.edu.tw/~htlin/course/ml15fall/,可作為補充。順便提一句,林老師把臺大後半學期的課程開成另一門 Coursera 課程「機器學習技巧」,作為進階。目前 Coursera 也已撤下。網易公開課地址為 http://c.open.163.com/coursera/courseIntro.htm?cid=1664。

5. 谷歌人工智慧入門

  • 課程名稱:人工智慧入門 Intro to Artificial Intelligence

  • 主講人:Peter Norvig,Sebastian Thrun

  • 授課機構:谷歌

  • 發布平臺:優達學城 Udacity

  • 語言:英語,漢語字幕

  • 網址:https://cn.udacity.com/course/intro-to-artificial-intelligence--cs271

該課程久享盛名,是 AI 入門最好的公開課之一(雷鋒網註:有人認為可以去掉「之一」)。

嚴格來說,它並不是一門機器學習課程。但其中有一周的主題是機器學習,它還介紹了另外幾個 AI 主要領域:概率推理、信息檢索、機器人學、自然語言處理等。鑑於學習機器學習的童鞋,幾乎都會對 AI 這個大學科有興趣——這門課程便是探索機器學習周邊與交叉領域的絕好機會

兩位主講者,Peter Norvig 和 Sebastian Thrun,一個是谷歌研究總監,一個是斯坦福著名機器學習教授,均是與吳恩達、Yann Lecun 同級別的頂級 AI 專家。

需要強調的是,該課程傾向於介紹 AI 的實際應用。課程練習廣受好評。

6. UBC 本科生的機器學習課程

Nando de Freitas 是機器學習領域非常傑出的學者。他的這門課很適合作為吳恩達老師「機器學習」的進階課程,因為:1. 「機器學習」省略掉的一些概念,可以在這門課中找到。2. 「機器學習」課 不重視數學,而數學是這門課的重點內容。Nando de Freitas 對諸如概率論、log likelihood 等基礎數學原理做了很好的講解,並以此為基礎介紹更高級的數學、統計概念。

對於機器學習新手,完全略過數學細節是很危險的,這門課會幫助你打下基礎。

但是,它錄製於 2012 年,時間也比較久了。因此,雷鋒網特意奉上彩蛋一枚。

彩蛋:Nando de Freitas 2013 年轉入牛津大學任教。這是他 2014-2015 學年在牛津的全套深度學習課程,包括視頻、PPT 以及練習:https://www.cs.ox.ac.uk/people/nando.defreitas/machinelearning/ (視頻保存在 Youtube,需翻牆)。

7. Yann Lecun 深度學習公開課

Yann Lecun 在 2016 年初於法蘭西學院開課,這是其中關於深度學習的 8 堂課。當時是用法語授課,後來加入了英文字幕。

作為人工智慧領域大牛和 Facebook AI 實驗室(FAIR)的負責人,Yann Lecun 身處業內機器學習研究的最前沿。他曾經公開表示,現有的一些機器學習公開課內容已經有些過時。通過 Yann Lecun 的課程能了解到近幾年深度學習研究的最新進展。該系列可作為探索深度學習的進階課程。

8. Geoffrey Hinton 深度學習課程

  • 課程名稱:神經網絡用於機器學習 Neural Networks For Machine Learning;網易譯名「神經網絡的機器學習」

  • 主講人:Geoffrey Hinton

  • 授課機構:多倫多大學

  • 發布平臺:Coursera、網易公開課

  • 語言:英語,漢語字幕

  • 網址:https://www.coursera.org/learn/neural-networks,Coursera;

    http://c.open.163.com/coursera/courseIntro.htm?cid=77,網易

深度學習必修課程,講師為該領域的一代宗師 Geoffrey Hinton。

這門課程聚焦於神經網絡和深度學習,是深入了解該領域最好的課程之一(雷鋒網註:很多人認為可以去掉「之一」)。

課程官方介紹:

「(你會在這門課)學習人工神經網絡以及它們如何應用於機器學習,比方說語音、物體識別,圖像分割(image segmentation),建模語言、人體運動等等。我們同時強調基礎算法,以及對它們成功應用所需的實用技巧 。」

這門課錄製於 2013-2013,時效性上不如 Yann Lecun 的法蘭西學院公開課,建議兩者結合。另外,它要求微積分、Python 基礎,涉及許多專有名詞,對初學者難度較大,需自己查找相關資料。

9. 哥倫比亞大學的機器學習公開課

在這份大牛雲集的榜單中,該課程的主講者——哥倫比亞大學副教授 John Paisley,只是一名相對普通的青年學者。但是,這門課程將於兩天後,也就是 2017 年 1 月 16 日首次開課。這使它成為時下最新的機器學習入門課程。要知道,近一兩年來人工智慧和機器學習的發展完全可以用「日新月異」來形容——湧現的新方法、新理論,即便是一流專家也有目不暇接之感。換句換說,三、四年前的課程,可能現在有許多內容已經過時了。

這是 Yann LeCun 提醒大家注意學習資源時效性的原因所在。

可惜許多一流的機器學習公開課,距離錄製都有些久了。我們知道一堂公開課背後所耗費的巨大人力。因此,對於部分課程在近兩三年並沒有更新的事實,倒也不能去怪主講者和平臺。但這使得比較新、時效性較強的課程格外可貴。

這門課中,學習者會了解到機器學習的算法、模型和方法,以及它們在現實生活中的應用。

由於是首次開課,尚沒有對該課程的反饋。但鑑於哥倫比亞大學的研究、教學實力,課程品質應當值得期待。

10. MIT 進階課程

這是一門研究生水平的機器學習課程,難度較高。可惜的是,MIT 並沒有提供課程視頻,而是以參考書目和課堂筆記的形式,讓我們得以一窺該課程的內容。小編認為,這些學習資源的價值仍舊不可估量。因為如此,相比常規公開課,它不會耗費過多時間,非常適合有一定基礎的學習者印證自己所學

小結

這就是雷鋒網為您盤點的十大最有價值的機器學習入門公開課。這些課程有淺有深,分別對機器學習不同領域、方面有所側重。各位童鞋可根據自己所需,自行選擇最適合自己的課程。不過,小編必須提醒各位,所有盤點都不可避免得摻雜了主觀因素。雖然雷鋒網已盡力按照課程質量與業內人士的評價來制定該推薦榜,但自知無法做到十足的公正客觀。比方說,該榜單傾向於機器學習的「入門」,而非開發者進階;傾向於概念、算法學習,而非實戰技巧(比如 Python 教程);傾向於把全世界範圍內最好的課程推薦給諸君,而對英語基礎較差的學習者照顧不足。榜單之外尚有許多有價值、適應不同層次人士需求的公開課。因此,雷鋒網特意列舉了幾個比較好的系統性機器學習課程以及學習平臺,彌補該榜單不足,以供參考。

友情提醒,以下包含收費課程。

系統性課程:

  • 優達學城(Udacity)提供的的 「機器學習工程師」納米學位,中文字幕,谷歌、滴滴參與授課,收費。

    https://cn.udacity.com/course/machine-learning-engineer-nanodegree--nd009

  • 華盛頓大學的「機器學習專業」系列課程,Coursera 平臺,收費,共六門課。

    https://www.coursera.org/specializations/machine-learning

  • 密西根大學的「Python 的應用數據科學專業」系列課程,Coursera 平臺,收費,共五門課。適合需要學習 Python 實戰技巧的機器學習開發者。

    https://www.coursera.org/specializations/data-science-python

平臺推薦:

國外的 Coursera、edX、優達學城(Udacity)、Udemy;國內的網易公開課、七月在線都集中了相對優質的學習資源。當然,英語不錯的童鞋推薦國外學習網站,尤其它們的問答論壇非常有幫助。

對於英語基礎不是那麼好的童鞋,Coursera 和優達學城很重視中國市場,它們的大部分機器學習資源都添加了漢語字幕。對於 edX 和可汗學院的部分課程,網易公開課有字幕翻譯。

對於需要在數學、統計方面補課的童鞋,除了以上幾個平臺之外,強烈推薦可汗學院 Khan Academy, 它的數學課非常有名,連比爾·蓋茨都推薦給他子女,很適合從零起步打基礎。

另外,雷鋒網旗下 「AI 科技評論」會定期舉辦「硬創公開課」,邀請業內專家對機器學習熱點問題進行深度討論,並問答 AI 科技評論讀者的問題 。上期,我們就請來新加坡國立大學的馮佳時教授剖析了 GANs (生成對抗網絡)。更多信息請關注 AI 科技評論微信公眾號。

相關焦點

  • 開發 | 開發者入門必讀:最值得看的十大機器學習慕課教程
    截至目前,國內開設人工智慧(AI)專業的高校不多,相當多的開發者是跨界入門,需要自學大量知識並摸索。因而優質的學習資源至關重要。因此,編輯搜集了全世界範圍內最受歡迎的機器學習課程,整理成這份「機器學習十大入門公開課」盤點,集中呈現給各位。這份推薦榜頗費心血,綜合考慮了難易、側重點、時效性等諸多因素,希望能幫助大家找到最適合自己的學習資源。
  • 機器學習漫遊指南 最完整的入門書單(外文版)
    在雷鋒網所篩選的學習資源中,這堪稱是迄今為止最全面、最完整、權威性比較高的一份 ML 書單,涵蓋了最值得學習者、從業者、開發者認真研讀的精品書目。這份指南適合多樣背景的讀者:從想要了解機器學習的普通人,到入門新手,再到高階開發者和學術研究人員。因此,雷鋒網對其進行編譯整理,特來與大家分享。
  • 2016 年十大 Java / Android 開發者必讀好文 年度盤點(四)
    2016 年已經過去,感謝大家支持開發者頭條
  • 3小時極致學習AI開發,WAIC開發者日有一堂必上公開課
    在今年 WAIC 開發者日期間,機器之心將聯合百度組織「開發者日百度公開課」,為廣大開發者提供 3 小時極致學習機會,從 NLP、CV 到零門檻 AI 開發平臺 EasyDL,助你掌握人工智慧開發技能。2020 世界人工智慧大會雲端峰會是由上海市政府打造的國際頂級人工智慧會議,大會將於 7 月 9 日 - 11 日在線上舉辦。
  • 2018 公開課盤點應用篇:面向 AI 開發者,「猿桌會」帶你看各路大神...
    作為一個針對 AI 開發者的公開課類目,「猿桌會」自去年推出以來廣受各位的喜愛,在今年雷鋒網 AI 研習社依舊以最飽滿的誠意為大家邀請了領域內的各路大神進行分享,具體內容涵蓋深度學習開源框架、神經網絡調參和優化、開發語言使用技巧、開源工具使用心得、人工智慧/數據競賽經驗、 行業最新成果等,持續關注我們公開課的粉絲們想必也從他們身上得到了不少收穫。
  • Python、R、Java、 C++ 等:從業界反饋看機器學習語言趨勢
    比如說,有的開發者(尤其是初學者)會因為一門語言的某個特性很契合自己的使用習慣、用著最順手,就狂贊這門語言,而對其他語言的優點選擇性失明。而這篇雷鋒網編譯自 IBM 開發者論壇的文章,則儘量避免了主觀判斷,用數據來展示各門開發語言在工業界的實際使用情況,可以說是十分難得。畢竟,統計學習的核心就是用數據說話。AI 開發者應該更明白可靠數據相比主觀臆測的價值。
  • 開始學習機器人——公開課推薦
    ——之如何正確入門ROS | 硬創公開課第二版:ElliQ:以色列人工智慧機器人,老年人的「生活伴侶」第三版:深度 | 對比深度學習十大框架:TensorFlow最流行但並不是最好作者:Top Liu著作權歸作者所有,本文由作者授權轉載
  • 百度再放「必殺技」 為開發者提供PaddlePaddle最全教程
    近日,百度上線PaddlePaddle公開課,以提供豐富的深度學習課程資源,在線幫助開發者從零開始掌握PaddlePaddle深度學習框架。這也是業內第一套由深度學習教育聯盟合作夥伴製作完成,包含理論和實戰的PaddlePaddle深度學習中文視頻課程。
  • 入門必讀!一堂來自NVIDIA的深度學習公開課
    3月20日,智東西與NV公開課」在深度學習社群開講,這是NVIDIA在國內首次就深度學習主題組織公開課,共有近千名以研發工程師為核心的行業用戶參與。3月20日,智東西與NV公開課」在深度學習社群開講,主講嘉賓為NVDeep Learning部門技術總監賴俊傑博士,主題為《AI浪潮來襲,如何搭建適合自己的深度學習平臺?》。
  • 2020年軟體開發者必讀10本好書推薦
    這是一個最壞的時代,也是一個最好的時代。而你的問題可能是想得太多,看書太少! ^_^有鑑於此,我想藉此機會從我個人看的100本技術書籍中,挑選出10本好書和大家一起分享,只有我們自己成長了、強大了,別人看來的危機反而成為我們的機遇。
  • 深度學習全網最全學習資料匯總之入門篇
    面對如此重要的江湖地位,我們相信一定有為數眾多的 AI 開發者對深度學習技術充滿了好奇心,想要快速著手使用這項強大的技術來解決現實生活中的實際問題。因此,雷鋒網(公眾號:雷鋒網)將圍繞深度學習技術整理一個系列文章,全面覆蓋與其相關的各項知識點。本文針對如何入門深度學習這一話題,整理了若干參考資料,希望對廣大開發者有所裨益。
  • 圖解十大經典機器學習算法入門
    這些問題是根據已有數據學習出來的,再投入新數據的時候,就可以根據這棵樹上的問題,將數據劃分到合適的葉子上。圖解十大經典的機器學習算法圖6-1 問題案例為了解決這個問題,可以只看其中的一些單詞:最開始先初始化,這裡面選了最簡單的 3,2,1 作為各類的初始值 。剩下的數據裡,每個都與三個初始值計算距離,然後歸類到離它最近的初始值所在類別。
  • 入門者的機器學習/深度學習自學指南
    看這類公開課,光看視頻是遠遠不夠的,一定要完成對應作業。Ng教授在斯坦福開設的機器學習課堂實錄。這個難度比Coursera的大了不少,內容上也是偏理論,上課在黑板推公式為主,對數學要求高了不少。林軒田教授的課程看似入門,實際上功力深厚。如果能把他將的內容和作業都融匯貫通,你的機器學習素養已經不低。數據挖掘方向的公開課。
  • 機器學習(Machine Learning)&深度學習(Deep Learning)資料(之一)
    乾貨很多,值得深入學習下29.看起來挺全的,Java愛好者值得收藏。41.《Machine Learning Theory: An Introductory Primer》 介紹:機器學習最基本的入門文章,適合零基礎者42.《機器學習常見算法分類匯總》 介紹:機器學習的算法很多。很多時候困惑人們都是,很多算法是一類算法,而有些算法又是從其他算法中延伸出來的。
  • 2020 WAIC開發者日百度公開課帶你上手
    對於入門不久的初級開發者或者中小企業的開發者來說,做好AI開發是不是一件很難的事?不一定。在7月11日上午舉行的2020 WAIC開發者日百度公開課上,來自百度的四位技術專家結合自身多年深耕 AI 開發領域的經歷,分別從智能對話技術、視覺技術、EasyDL 平臺三個方向分享了AI開發的實戰經驗,助力學習者快速掌握人工智慧開發技能。
  • 12.20 WAVE SUMMIT+2020深度學習開發者峰會來襲
    WAVE SUMMIT是中國深度學習開發者每年兩次的技術盛會,WAVE SUMMIT+ 2020是今年的第二場。從官網議程看,本次峰會將從早上九點開始持續到晚上,包括生態盛典、技術沙龍和AI之夜。來自高校的著名專家學者、企業界和開源社區負責人將共聚盛會,帶來精彩發言,為開發者們帶來一場乾貨滿滿的AI盛宴。
  • 2020 WAIC開發者日百度公開課核心乾貨
    對於入門不久的初級開發者或者轉型中小企業來說,如何最輕鬆、最高效地進行 AI 開發和部署?2020 世界人工智慧大會雲端峰會是由上海市政府打造的國際頂級人工智慧會議,於 7 月 9 日正式開幕。「開發者日」作為 WAIC 雲端峰會主題論壇及特色活動,也是 WAIC 期間唯一面向 AI 開發者的專業活動。
  • 最受歡迎的哈佛公開課,為何成為名校生的必讀課?
    這是想提升英語、鍛鍊思辨能力、或入門哲學的同學,不可不了解學習的優質課程。此課程不僅連續多年成為哈佛大學註冊人數最多的課程,也曾創下了哈佛大學的歷史紀錄,被評為哈佛新生最歡迎的公開課。此外,麥可·桑德爾還是當今世界最著名的政治哲學家之一,是西方社群主義(共同體主義)最著名的理論代表人物,於上世紀80年代初以其對羅爾斯正義論的批評而蜚聲西方學界。曾被《中國新聞周刊》譽為「年度最具影響力的外國人物」。
  • 新課丨最受歡迎的哈佛公開課,為何成為名校生的必讀課?
    這是想提升英語、鍛鍊思辨能力、或入門哲學的同學,不可不了解學習的優質課程。此課程不僅連續多年成為哈佛大學註冊人數最多的課程,也曾創下了哈佛大學的歷史紀錄,被評為哈佛新生最歡迎的公開課。而且,哈佛公開課只有桑德爾lecture大課的錄播。許多同學學習了以後還渴望和他人進行深入的討論,因為這樣才能說是真正的學習到位。因此,接下來,PeerBang將根據這門超網紅的哈佛公開課,新開設一門「英文思辨研討課」,幫助學生學習和理解這門課程,並全面提升英文聽、說、讀、寫的能力。
  • 機器人程序設計之如何正確入門ROS | 雷鋒網公開課
    然而隨著ROS近年來火熱,在教學中也發現很多新夥伴對ROS的認識存在一些誤區,為了加快小夥伴們的學習速度,雷鋒網本期公開課雷鋒網邀請Top和大家分享一點自己學習和使用的經驗和心得。雷鋒網本期公開課面向想入手ROS卻又不知從何下手的小夥伴,為大家梳理好學習思路。內容包括但不限於ROS全球使用現狀、核心概念、工作原理等學習重點,及仿真環境、工具庫等需了解的內容。