威斯康辛大學《機器學習導論》2020秋季課程完結,課件、視頻資源已...

2020-12-24 騰訊網

機器之心報導

編輯:蛋醬

對於機器學習領域的初學者來說,這會是很好的入門課程。目前,課程的筆記、PPT 和視頻正在陸續發布中。

2020 年就這麼悄無聲息地走完了,想必大多數人,尤其是在校學生唯一的感覺就是:「又是毫無學術進展的一年。」

別慌,只要馬上開始學習,什麼時候都不算晚。

近日,威斯康辛大學麥迪遜分校助理教授 Sebastian Raschka 在推特上宣布了威斯康辛大學《機器學習導論》2020 秋季課程的完結:「教授兩個班級和 230 個學生是相當不錯的體驗,對於那些感興趣的人,我整理了一頁記錄以供參考。」

課程筆記主頁:https://sebastianraschka.com/resources/ml-lectures-1.html(持續更新中)

Sebastian Raschka 是威斯康星大學麥迪遜分校的統計學助理教授,致力於機器學習和深度學習研究。他最近的一些研究方法已應用於生物識別領域,解決面部圖像隱私問題,其他的研究重點包括開發與機器學習中的模型評估、對抗攻擊和 AutoML 有關方法和應用程式。他也是《Python 機器學習》一書的作者,曾被科技博客 Analytics Vidhya 評為 GitHub 上具影響力的數據科學家之一。

對想要學習這門課程的學生,Sebastian Raschka 教授的建議是:你至少要熟悉基本編程知識並完成了編程入門課程。

課程總共由七個部分組成:

第一部分:簡介

L01:什麼是機器學習

1.1 課程概述:「Stat 451:機器學習導論(FS 2020)」的簡介

1.2 什麼是機器學習:機器學習的定義,以及機器學習與編程的關係

1.3 機器學習的類別:討論了機器學習的三大類,監督學習、無監督學習和強化學習

1.4 符號:介紹了將在本課程中使用的機器學習形式和符號

1.5 ML 應用:走向機器學習程序的主要步驟,以及機器學習組件的分類

1.6 ML 動力:關於學習機器學習的不同觀點和動力

L02:最近鄰算法

2.1 最近鄰算法:介紹最近鄰算法,概覽最近鄰算法的應用和最新進展

2.2 最近鄰決策邊界:包括 1 - 最近鄰決策邊界背後的概念,此外還列出了一些常見的距離度量

2.3 K - 最近鄰算法:將 1 - 最近鄰概念擴展到 k - 最近鄰算法,進行分類和回歸

2.4 K - 最近鄰的 Big O:K - 最近鄰簡單實現的 Big O 運行時間複雜度

2.5 K - 最近鄰的提升:總結一些提升 K - 最近鄰計算性能和預測效率的常見技巧

2.6 Python 中的 K - 最近鄰:利用 scikit-learn,在 Python 中使用 K - 最近鄰。這節課中使用的 Jupyter 筆記本從這裡獲取:https://github.com/rasbt/stat451-machine-learning-fs20/blob/master/L02/code/02_knn_demo.ipynb

第二部分:計算基礎

L03: (可選)Python 編程

3.1 Python 概述:這節課將討論 Python 的用法,進行 C 和 Python 的快速演示(也許並不是很有吸引力)

3.2 Python 設置:演示如何在 MacOS 上使用 Miniconda 安裝 Python,另外提供了有關 conda 軟體包管理器的簡短演示

3.3 運行 Python 代碼:演示運行 Python 代碼的不同方式,包括 REPL、IPython、.py 腳本和 Visual Studio Code

L04: Python 中的科學計算

4.1 NumPy 基礎知識介紹

4.2 NumPy 數組的創建及索引

4.3 NumPy 數組的數學運算和通用函數

4.4 NumPy 的廣播機制

4.5 NumPy 高級索引–內存視圖和副本

4.6 NumPy 隨機數生成器

4.7 重塑 NumPy 數組

4.8 NumPy 比較運算符和掩碼

4.9 NumPy 線性代數基礎

4.10 Matplotlib

L05: 使用 Scikit-Learn 進行機器學習

5.1 從表格文本文件讀取數據集

5.2 基本數據處理

5.3 面向對象的編程和 Python 類

5.4 Scikit-Learn 簡介

5.5 Scikit-Learn Transformer API

5.6 Scikit-Learn 管道

第三部分:基於樹的方法

L06:決策樹

6.1 決策樹簡介

6.2 遞歸算法和 Big-O

6.3 決策樹的類型

6.4 分割標準

6.5 基尼係數 & 熵與誤分類誤差:闡釋在 CART 決策樹的信息增益方程式中,為什麼要使用熵(或基尼)代替誤分類誤差作為雜質度量

6.6 改進和處理過擬合:將決策樹的一些問題(例如過擬合)融合在一起並討論改進方法,例如增益比、預剪枝和後剪枝

6.7 代碼示例:如何使用 scikit-learn 訓練和可視化決策樹的快速演示

L07: 集成方法

7.1 集成方法簡介:討論了包括絕對多數投票法(majority voting)、套袋法(bagging)、隨機森林(random forests)、堆棧(stacking)、梯度提升(gradient boosting)等最受歡迎、使用最廣泛的機器學習方法。

7.2 絕對多數投票法:討論最基本的模型集成之一「絕對多數投票」,通過示例解釋為什麼它比使用單個分類器更好

7.3 套袋法:介紹了偏差 - 方差權衡和分解,以了解套袋法的用途

7.4Boosting 和 AdaBoost:討論 boosting 的概念,然後介紹了 AdaBoost,該方法將弱分類器(比如決策樹樁)提升為強分類器

7.5 梯度提升:在 AdaBoost 使用權重作為訓練示例來提升下一輪樹的情況下,梯度提升使用損失的梯度來計算殘差以適應序列中的下一棵樹,視頻中提到的論文地址:https://dl.acm.org/doi/pdf/10.1145/2939672.2939785

7.6 隨機森林:講解隨機森林及其與套袋法之間的關係,以及為什麼隨機森林在實踐中的效果優於套袋法

7.7 堆棧:介紹 Wolpert 堆棧算法,並展示如何在 mlxtend 和 scikit-learn 中使用堆棧分類器

第四部分:模型評估

模型評估分為五個小節:

L08:基礎部分,欠擬合和過擬合

L09:重採樣方法

L10:交叉驗證

L11:統計測試和算法選擇

L12:評估指標

在後續即將更新的課程中,Sebastian Raschka 將對「降維和無監督學習」、「貝葉斯學習」內容進一步介紹,課程資料也會更新,包括講座視頻、PPT 連結等。

待更新的內容包括:

第五章:降維和無監督學習

L13 - 功能選擇

L14 - 特徵提取

L15 - 聚類

第六章:貝葉斯學習

L16 - 貝葉斯方法簡介

L17 - 貝葉斯最佳分類器

L18 - 樸素貝葉斯分類器

L19 - 貝葉斯網絡

這些課程資料在 GitHub 平臺也會同步更新,項目地址:https://github.com/rasbt/stat451-machine-learning-fs20

本周六,WAIC開發者·2020上海臨港人工智慧開發者大會將震撼來襲。

全球頂尖AI專家齊聚主論壇,解讀智能化轉型的技術之道。4場技術工作坊分享智慧城市、智能出行、華為開源生態與邊緣智能引擎等話題,2場黑客松等你來戰。

相關焦點

  • 【碩士課程】深圳大學南特商學院2020級金融科技與風險控制理學...
    深圳大學與法國南特高等商學院2020級中外合作辦學項目金融科技與風險控制理學碩士金融科技與風險控制專業是中國教育部批准的由深圳大學與法國南特高等商學院共同推出的中外合作辦學項目
  • 倫敦瑪麗女王大學新增開設2020年秋季語言班課程
    倫敦瑪麗女王大學為申請2021年1月入學研究生課程的學生們新增開設2020年秋季語言班課程,現在秋季語言班已經正式開放申請,具體細節如下:由於疫情的影響,語言班課程將全程在線上進行,因此學校將對語言班課程的學費提供10%的減免。
  • 86歲還在錄網課:MIT教授Gilbert Strang最新「線性代數」課程上線
    如今疫情爆發,他又一個人對著攝像機錄了一套新的課程,視頻、PPT、文字稿都已上傳。無論你是在學校、油管、B 站還是其他地方學《線性代數》,相信你對 MIT 的 Gilbert Strang 老爺子都不會陌生。
  • 北京大學化身「充電寶」 公開課程資源大放送
    【課程連結】http://www.chinesemooc.org/mooc/4920其他課程:中國近現代史綱要、思想道德修養與法律基礎、毛澤東思想和中國特色社會主義理論體系概論、馬克思主義基本原理概論、政治學概論、法律導論、社會調查與研究方法(上)(下)、法學論文與方法、家庭社會學導論、美國文化與社會、刑法學總論
  • 95後哈佛小哥撰寫從零開始的機器學習入門必備,書籍資源已開放
    機器之心報導作者:蛋醬、小舟機器學習怎麼入門最簡單?今年剛剛從哈佛大學統計專業畢業的 Danny Friedman 寫了一本「轉專業學生專用教材」,無基礎也可輕鬆入門,資源現已全部開放。說起機器學習入門書,大概有成百上千種選擇。這些書籍大多是由具備豐富研究經驗的學者撰寫的,涵蓋各種主題。俗話說「開卷有益」,但對於轉專業的初學者來說,這本新書或許更適合入門:近日,一位畢業於哈佛大學的小哥根據自己的機器學習入門經歷,撰寫了一本《從零開始的機器學習》。
  • 教育部:秋季學期覆蓋所有年級學科的中小學課程資源已全部開發完成
    北京商報訊(記者 程銘劼 趙博宇)12月10日,教育部召開了第四場教育2020收官系列新聞發布會,介紹「十三五」期間我國基礎教育改革發展的相關成就。教育部基礎教育司副司長俞偉躍表示,「在今年春季實現『停課不停學』以後,教育部就抓緊組織了高水平的地區、高水平的學校、高水平的老師和高水平的技術團隊,按照『四高』的要求,把秋季學期覆蓋所有年級和學科的中小學課程資源全部開發出來了,總共有四千多節,實現了應急狀態下開發春季課程資源,向優質課程資源的轉變,真正做到了有備無患。」
  • 英國大學2020/21學年秋季開學安排!
    年1月開課的課程清單,不在列表中的課程將於2020年9月開學,課程長度仍然為12個月。 02 謝菲爾德大學 考慮到今年疫情特殊情況,學校允許大部分2020年秋季入學的課程,可酌情申請延期到2021年秋季入學。
  • 三峽大學回應趣味日語教學課件被指歧視女性:已停課 正調查處理
    9月30日,有網友反映,三峽大學的一門趣味日語選修課中,老師製作的教五十音的課件含有大量低俗內容,涉嫌侮辱、歧視女性。北青-北京頭條記者從三峽大學獲悉,目前該課程已經停課,學校相關部門正在調查、處理。
  • 「主播」經驗值飆升,教學資源double,這網課,有點上頭!
    此次春季學期全校本科教學共有各類課程1300多門,在疫情防控的特殊時期,學校依託「中國大學慕課MOOC」平臺,結合「南信大教育在線」平臺和QQ群等社交軟體,創新教育教學模式,已實現1020門課程、2359個教學班開展線上教學,總體教學秩序平穩有序。
  • 英國愛丁堡大學宣布取消多個2020年秋季入學碩士項目
    新京報訊(記者 戚望)近日,記者從英國愛丁堡大學獲悉,受到疫情影響,該校取消了20多個專業2020年秋季入學項目。多名申請人向新京報記者確認,稱收到了相應郵件。愛丁堡大學發給學生的郵件稱,疫情之下,學校很難保證以上專業的教學資源和授課質量,因此取消以上專業的2020年秋季入學。在郵件中,愛丁堡大學提出兩個解決方案。學生可以調劑至其他同類型的相似專業就讀2020年秋季入學課程,或選擇入讀原專業2021年秋季入學課程,但後者需重新申請。
  • 三峽大學:教師郎某某日語課件中有不雅言論,已停課處理
    據三峽大學官方微博9月30日消息,9月25日,我校關注到有自媒體帳號在網絡上發布我校土木與建築學院教師郎某某在開設的《趣味日語》全校公選課所使用的課件中有不雅言論,涉違反教師職業行為準則問題。學校高度重視,教務處已對其作停課處理,相關部門已展開全面調查。
  • 你離開學只差這個視頻:李宏毅機器學習2020版正式開放上線
    臺大李宏毅老師的機器學習課程可以說是最具代表性的中文公開課之一,已成為大量國內初學者的首選。由於最近新冠疫情爆發,臺大的課程也全面轉為線上,今年的《機器學習》有了不小的變化。昨天,李宏毅老師今年的第一課開講了:「精靈寶可夢大師」李宏毅提起李宏毅老師,熟悉機器學習的讀者朋友一定不會陌生,他現任臺灣大學電氣工程助理教授,研究重點是機器學習,特別是深度學習領域。很多人選擇的機器學習入門學習材料都是李宏毅老師的臺大公開課視頻。
  • 日語教學課件涉嫌歧視女性,三峽大學:涉事教師已停課,正調查處理
    近日,三峽大學一名教師的日語選修課PPT內容被網友發上網絡,這種教單詞的方式,被質疑言語低俗且歧視女性。日語教學課件涉嫌歧視女性9月30日,有網友發帖稱,三峽大學一名教師的趣味日語選修課PPT中,含有大量歧視女性的低俗言論,隨後不少學生在群中表示要退課,稱「希望老師不要在公開場合把低俗當樂趣」。
  • 耶魯大學廢棄取消「藝術史導論:文藝復興至今」一課引眾怒
    今年,耶魯大學決定廢除其歷史悠久的「藝術史導論:文藝復興至今」一課。然而這一決定引起大批公眾關注乃至憤怒,甚至授課老師都感到相當驚訝。藝術史系主任蒂姆·巴林傑(Tim Barringer)稱之為「一次直截了當的現代化行動」,他在接受《耶魯每日新聞》採訪時表示,在一學期的時間裡教授任何一門概論課都不可能是全面的。
  • 2020年北京高校「優質本科課程」和「優質本科...
    本網訊 近日,北京市教育委員會發布《關於公布2020年「優質本科課程」和「優質本科教材課件」遴選結果的通知(京教函〔2020〕463號)》。首都醫科大學使用《新標準大學英語》(第二版)開設的「大學英語」課程、國際關係學院使用《現代大學英語 精讀》(第二版)開設的「英語基礎」課程入選「優質本科課程」;《大學思辨英語教程 寫作1:記敘文寫作》《大學思辨英語教程 寫作3:議論文寫作》《跨文化交際:中英文化對比》《現代西班牙語3》入選「優質本科教材課件」,其中《現代西班牙語3》被列為重點項目。
  • ——葛四友《哲學思維導論》通識課
    葛四友 課程名稱:哲學思維導論 開課教師:葛四友 開課院系:華東師大哲學系開課時間:2020年秋季學期選課模塊:思維、推理與判斷>人數限制:75人一、課程目的、任務:本課程嘗試突破傳統的知識記憶型教育,變成一門思維的訓練型課程,會分三個方面訓練學生的三種基本思維能力,即想像力、邏輯思維能力與直觀能力,培養學生的批判性思維與創造性思維,最終的目的在於提高學生提出問題、分析問題與解決問題的能力。
  • 謝菲爾德大學新增兩門傳媒專業!
    注意啦,謝菲爾德大學新增2個傳媒專業!快來看看具體信息吧~由於這兩個課程是第一年招收學生,因此這兩個課程沒有對中國學生的學校設置任何嚴格的入學標準,接受所有學校的學生申請。它採用各種類似的數字和計算方法進行管理,分析和通信:從數據標準,公民科學和Web應用程式到計算語言學,機器學習和以用戶為中心的設計。專業介紹這門新課程將利用藝術學院數字人文學院(DHI)在文化數據領域超過25年的專業知識和國際聲譽來進行。
  • 2020年秋季美國大學開學政策一覽,你的夢校讓你失望了嗎?
    很多留學生對此感到不滿:線上授課太不真實,我們沒法與同學和老師保持及時的聯繫,也沒法享受到學校的資源!總之一句話,儘快恢復面對面教學是他們的終極願望。面對學生的迫切需求,以哈佛大學、聖母大學為首的一些高校決定硬剛疫情,在保證安全的同時恢復線下教學活動。
  • 吳恩達機器學習入門2018高清視頻公開,還有習題解答和課程拓展
    賈浩楠 發自 凹非寺量子位 報導 | 公眾號 QbitAI機器學習入門課程哪家最強?斯坦福吳恩達的CS229稱第二,恐怕沒人敢稱第一。最近,吳恩達在斯坦福的最新CS229 2018課程,已經完成YouTube上傳——高清哦。沒有高糊勸退,還附送課題討論總結、課後習題和解答參考等珍貴資源,簡直讓你找不到不學的理由!
  • 快速課件製作工具Snap by Lectora中文版上市
    針對中國市場對互動式課件及演示持續增長的需求,Trivantis公司正式發布PowerPoint嵌入式課件製作工具中文版。  今天,Trivantis公司針對中國市場正式發布了PowerPoint嵌入式快速課件製作工具Snap!by Lectora中文版。