林軒田機器學習基石課程學習筆記1 -- The Learning Problem

2021-02-13 AI算法與圖像處理

點擊上方「AI算法與圖像處理」,選擇加"星標"或「置頂」

重磅乾貨,第一時間送達

主要內容

What is Machine Learning

Applications of Machine LearningComponents of Machine LearningMachine Learning and Other Fields一、What is Machine Learning

什麼是「學習」?學習就是人類通過觀察、積累經驗,掌握某項技能或能力。就好像我們從小學習識別字母、認識漢字,就是學習的過程。而機器學習(Machine Learning),顧名思義,就是讓機器(計算機)也能向人類一樣,通過觀察大量的數據和訓練,發現事物規律,獲得某種分析問題、解決問題的能力。

機器學習的過程是從資料出發,經過電腦的計算之後,最終得到某一種表現。

比如通過電腦讓電腦學會預測股票。利用十年前的數據去學習,告訴我明天該怎麼去投資,如果機器真的做到了,那麼說明機器真的學到了這些。這是我們希望機器學習能做的事情。

舉例:如何識別一棵樹

通過我們的腦力去分析這些東西比較困難,因為希望通過機器自己去學習和分析,發現這些規律。

機器學習在構建一個複雜系統的時候是一個可選的方法:

比如:

機器學習要做的事情,是類似於教電腦釣魚的方法,讓它可以一輩子受用。

那麼什麼場景下,考慮使用機器學習解決呢?


機器學習的三個關鍵條件:

當三個關鍵條件都滿足的時候才考慮使用機器學習

測試&答案:

1、預測小孩子接下來的幾分鐘後會哭?no(沒有規則)

2、判斷圖中是否存在圓?no(規則可以輕鬆定義)

3、決定是否該給用戶分發信用卡?yes,不容易編程實現,有大量的客戶歷史信息

4、地球什麼時候會毀滅?no(沒有足夠的數據)

二、Applications of Machine Learning

機器學習在我們的衣食住行等各個方面中都有應用。

(1)Food:

數據來源:推特(評價+定位)

功能:了解這家飯店食物的味道如何

(2)Clothing

數據:商品的圖片、用戶穿搭

功能:告訴我們怎樣去搭配衣服才能更加Fashion

(3)Housing

數據:房子的建築特點、使用的能源

功能:預測房子在節能減排上面的能力

(4)Transportation

數據:交通燈的圖片和含義

功能:準確識別交通燈信號


上面只是舉一些例子,當然這樣子的例子還有很多!

機器學習在教育上的應用

數據:學生在上網課中的一些記錄,答題記錄和上課記錄等

功能:預測學生會哪些內容,不會哪些內容,並推薦一些資料。

那麼機器學習要如何去設計呢?

從3000學生中給出900萬數據

利用機器學習去自動確定問題的難度等

娛樂方面的應用,推薦系統

數據:有多少用戶喜歡什麼電影

功能:預測一個用戶有多大概率喜歡一個沒看過的電影

那麼電腦是如何去學習這些特徵呢?

利用模型將用戶和電影用一串特徵來描述,對兩串特徵求內積,如果相乘的分數高,則會給非常高的推薦分數。但是我們沒有辦法去定義這些特徵,所以機器學習通過以往的數據,去學習這些特徵,並預測用戶有多喜歡這部電影。

測試&答案

機器在以下哪些領域用不到?

1、金融 (預測股市)

2、醫療 (預測藥效)

3、法律 (從公文書自動給出摘要,便於搜尋和閱讀)

4、不是上述的任何一個 yes

三、Components of Machine Learning

如何公式化機器學習的問題

基礎的術語:


機器學習流程圖:

從未知規律的數據中,通過學習算法去挖掘,讓最終的 g 接近 f

注意點:

目標函數,f是未知

假說是希望g儘可能的接近f,但是可能還是不同於f

舉例,以信用卡為例

g 到底長什麼樣

今天決定要不要發給客戶信用卡,以下是一些可能的公式

h1:年收入有沒有超過800000,超過就給

h2:負債超過100000給信用卡

h3:工作不滿兩年給他信用卡

將所有的可能h,都放到g的集合中,並從集合中找到最有可能的結果

學習模型=算法+假說

機器學習的定義:從資料出發,機器學習算法要算出一個假說(hypothesis)g,我們希望這個g要很接近我們最渴望的那個f。

測試&答案

歌曲推薦

四、Machine Learning and Other Fields

與機器學習相關的領域有:

數據挖掘(Data Mining) ——>從數據中挖掘一些有用的資料

人工智慧(Artificial Intelligence)——>計算一些東西並顯示出很聰明的行為(比如AI下棋)

統計(Statistics)——>使用數據做一些推論(比如硬幣問題)

機器學習和數據挖掘,非常相像,有些地方還是一樣,密不可分

機器學習是實現人工智慧的一種方式

統計是實現機器學習的一種方法,統計更加關注使用數學理論來給出結果,很少關心計算的問題。統計學給機器學習提供了很多有用的工具。

測試&答案

五、總結


本節課主要引入了機器學習的概念,機器學習實際上是從資料出發找到一個函數,然後找到的函數和我們最渴望的目標是很接近的。機器學習在很多地方都有應用,其核心 算法,數據(資料),假說(hypothesis)最後得到g。

機器學習和數據挖掘、人工智慧、統計這三個領域做個比較,和各個領域的關係,他們各自有各自的取向。

參考資料:

https://www.bilibili.com/video/BV1Cx411i7op?p=1

https://blog.csdn.net/red_stone1/article/details/101303228

加群交流

歡迎小夥伴加群交流,目前已有交流群的方向包括:AI學習交流群,目標檢測,秋招互助,資料下載等等;加群可掃描並回復感興趣方向即可(註明:地區+學校/企業+研究方向+暱稱)

相關焦點