臺灣大學林軒田機器學習基石課程學習筆記1 -- The Learning Problem

2021-02-15 AI有道

最近在看NTU林軒田的《機器學習基石》課程,個人感覺講的非常好。整個基石課程分成四個部分:

每個部分由四節課組成,總共有16節課。那麼,從這篇開始,我們將連續對這門課做課程筆記,共16篇,希望能對正在看這們課的童鞋有所幫助。下面開始第一節課的筆記:The Learning Problem。

一、What is Machine Learning

什麼是「學習」?學習就是人類通過觀察、積累經驗,掌握某項技能或能力。就好像我們從小學習識別字母、認識漢字,就是學習的過程。而機器學習(Machine Learning),顧名思義,就是讓機器(計算機)也能向人類一樣,通過觀察大量的數據和訓練,發現事物規律,獲得某種分析問題、解決問題的能力。

機器學習可以被定義為:Improving some performance measure with experence computed from data. 也就是機器從數據中總結經驗,從數據中找出某種規律或者模型,並用它來解決實際問題。

什麼情況下會使用機器學習來解決問題呢?其實,目前機器學習的應用非常廣泛,基本上任何場合都能夠看到它的身影。其應用場合大致可歸納為三個條件:

事物本身存在某種潛在規律

某些問題難以使用普通編程解決

有大量的數據樣本可供使用

二、Applications of Machine Learning

機器學習在我們的衣、食、住、行、教育、娛樂等各個方面都有著廣泛的應用,我們的生活處處都離不開機器學習。比如,打開購物網站,網站就會給我們自動推薦我們可能會喜歡的商品;電影頻道會根據用戶的瀏覽記錄和觀影記錄,向不同用戶推薦他們可能喜歡的電影等等,到處都有機器學習的影子。

三、Components of Machine Learning

本系列的課程對機器學習問題有一些基本的術語需要注意一下:

實際中,機器學習的流程圖可以表示為:

對於理想的目標函數f,我們是不知道的,我們手上拿到的是一些訓練樣本D,假設是監督式學習,其中有輸入x,也有輸出y。機器學習的過程,就是根據先驗知識選擇模型,該模型對應的hypothesis set(用H表示),H中包含了許多不同的hypothesis,通過演算法A,在訓練樣本D上進行訓練,選擇出一個最好的hypothes,對應的函數表達式g就是我們最終要求的。一般情況下,g能最接近目標函數f,這樣,機器學習的整個流程就完成了。

四、Machine Learning and Other Fields

與機器學習相關的領域有:

其實,機器學習與這三個領域是相通的,基本類似,但也不完全一樣。機器學習是這三個領域中的有力工具,而同時,這三個領域也是機器學習可以廣泛應用的領域,總得來說,他們之間沒有十分明確的界線。

五、總結

本節課主要介紹了什麼是機器學習,什麼樣的場合下可以使用機器學習解決問題,然後用流程圖的形式展示了機器學習的整個過程,最後把機器學習和數據挖掘、人工智慧、統計這三個領域做個比較。本節課的內容主要是概述性的東西,比較簡單,所以筆記也相對比較簡略。

這裡附上林軒田(Hsuan-Tien Lin)關於這門課的主頁: 
http://www.csie.ntu.edu.tw/~htlin/

歡迎關注公眾號學習交流~



相關焦點

  • 【本站原創】臺大林軒田《機器學習基石》系列課程教材的習題解答和實現
    臺灣大學林軒田老師的《機器學習基石》、《機器學習技法》課程由淺入深、內容全面,基本涵蓋了機器學習領域的很多方面。
  • 《從數據中學習》--臺灣大學林軒田所著
    轉自:深度學習前沿公眾號臺大林軒田老師的機器學習課程,講解清楚,課程的參考教材是learning from data。
  • 臺灣大學林軒田機器學習基石課程學習筆記13 -- Hazard of Overfitting
    本節課介紹這種模型複雜度增加帶來機器學習中一個很重要的問題:過擬合(overfitting)。一、What is Overfitting?‍‍首先,我們通過一個例子來介紹什麼bad generalization。
  • 林軒田機器學習基石課程學習筆記1 -- The Learning Problem
    學習就是人類通過觀察、積累經驗,掌握某項技能或能力。就好像我們從小學習識別字母、認識漢字,就是學習的過程。而機器學習(Machine Learning),顧名思義,就是讓機器(計算機)也能向人類一樣,通過觀察大量的數據和訓練,發現事物規律,獲得某種分析問題、解決問題的能力。
  • 獨家乾貨 | 林軒田機器學習課程精煉筆記!
    點擊上方「AI有道」,選擇「星標」公眾號重磅乾貨,第一時間送達臺灣大學林軒田老師曾在coursera上開設了兩門機器學習經典課程:《機器學習基石》和《機器學習技法》。《機器學習基石》課程由淺入深、內容全面,基本涵蓋了機器學習領域的很多方面。其作為機器學習的入門和進階資料非常適合。《機器學習技法》課程主要介紹了機器學習領域經典的一些算法,包括支持向量機、決策樹、隨機森林、神經網絡等等。林老師的教學風格也很幽默風趣,總讓讀者在輕鬆愉快的氛圍中掌握知識。本文列出了林軒田機器學習基石和機器學習技法課程的所有精煉筆記,均是紅色石頭精心製作的原創內容。
  • ​機器學習基石 - (林軒田主講)課程學習
    機器學習 - 林軒田臺灣大學-林軒田老師的機器學習課程課程有點小難度,但是是從另外一個角度來闡述機器學習,很有意思!
  • Coursera上機器學習課程(公開課)匯總推薦
    臺灣大學林軒田老師的 機器學習基石上 (Machine Learning Foundations)—Mathematical Foundationshttp://coursegraph.com/coursera-ntumlone-mathematicalfoundations如果有一定的基礎或者學完了Andrew Ng老師的機器學習課程,這門機器學習基石上-數學基礎可以作為進階課程
  • 臺灣大學林軒田機器學習基石課程學習筆記16(完結) -- Three Learning Principles
    這個例子表明,抽樣的樣本會影響到結果,用一句話表示「If the data is sampled in a biased way, learning will produce a similarly biased outcome.」意思是,如果抽樣有偏差的話,那麼學習的結果也產生了偏差,這種情形稱之為抽樣偏差Sampling Bias。
  • 林軒田《機器學習基石》課程總結
    公眾號發布了一系列臺灣大學資訊工程系林軒田(Hsuan-Tien Lin)教授開設的《機器學習基石》
  • 臺灣大學林軒田機器學習基石課程學習筆記6 -- Theory of Generalization
    上一節課,我們主要探討了當M的數值大小對機器學習的影響。
  • 25個AI學習資料送給你! | 資源
    full-stack-deep-learning/fsdl-text-recognizer-project國內學習地址:https://www.bilibili.com/video/av49643298國外學習地址:https://fullstackdeeplearning.com/march2019課程名稱:《How to Win
  • 資源推薦|機器學習與深度學習視頻和書籍資源拿去!
    有相當多的大學課程都提供在線課程材料,但沒有視頻。以下課程可以足夠你忙上幾個月了:Coursera — 機器學習(Machine Learning) 授課:Andrew Nghttps://www.coursera.org/learn/machine-learning#syllabusCoursera — 機器學習神經網絡(Neural Networks
  • B 站上有哪些值得學習的 AI 課程...
    需要視頻配套資料的可以看看這裡 https://zhuanlan.zhihu.com/p/84214338 這是國內黃博士為吳老師課程配的全套資料,包括視頻字幕,對應 python 代碼,原版 PPT,中文版筆記等等2、林軒田機器學習基石 (國語)https
  • 臺灣大學林軒田機器學習基石課程學習筆記11 -- Linear Models for Classification
    邏輯回歸模型的‍‍hypothesis為h(x)=θ(s),取‍‍值範圍為(-1,1)之間,它的err是cross-entropy的,所有對應‍‍的Ein(w)是平滑‍‍的凸函數,可以使用梯度下降算法求最小值。‍‍
  • 【重溫經典】吳恩達機器學習課程學習筆記七:Logistic回歸
    【導讀】前一段時間,專知內容組推出了春節充電系列:李宏毅2017機器學習課程學習筆記,反響熱烈,由此可見,大家對人工智慧、機器學習的系列課程非常感興趣
  • 收藏,全網開發者都在學的26門AI課程!
    list=PLqYmG7hTraZDM-OYHWgPebj2MfCFzFObQ 9、全棧深度學習訓練營(課程視頻):為熟悉深度學習基礎知識的開發人員提供的實踐指導課程 https://github.com/full-stack-deep-learning/fsdl-text-recognizer-project
  • B站最強學習資源匯總(Python,數據科學,機器學習)
    需要視頻配套資料的可以看看這裡https://zhuanlan.zhihu.com/p/84214338這是國內黃博士為吳老師課程配的全套資料,包括視頻字幕,對應python代碼,原版PPT,中文版筆記等等https://www.bilibili.com/video/av12463015/課程介紹:臺灣大學林軒田老師的《機器學習基石》課程由淺入深、內容全面,基本涵蓋了機器學習領域的很多方面。
  • 贊,全網開發者都在學的 26 門 AI 課程!
    list=PLqYmG7hTraZDM-OYHWgPebj2MfCFzFObQ9、全棧深度學習訓練營(課程視頻):為熟悉深度學習基礎知識的開發人員提供的實踐指導課程https://github.com/full-stack-deep-learning/fsdl-text-recognizer-projecthttps:
  • 吳恩達《Machine Learning》精煉筆記 1:監督學習與非監督學習
    然而,吳恩達從最早的 CS229,到後來的 deeplearning.ai 深度學習專項課程,還有其它 AI 資源,大神發布的 AI 知名課程和資料非常多。說到吳恩達優秀的 AI 課程,首當其衝的就是幾年前在 Coursera 上發布的《Machine Learning》課程!
  • 資源 | 15個高質量免費機器學習課程都在這兒了
    這次整理了15個必看的機器學習課程。這些課程內容包括決策樹,樸素貝葉斯,邏輯回歸,神經網絡和深度學習,估計,貝葉斯學習,支持向量機和核方法,聚類,無監督學習,提升算法,強化學習和學習理論。tijmen/csc321/CMU——機器學習(csc411),2015年該課程由蘋果公司人工智慧研究所主任Ruslan Salakhutdinov主導。