人工智慧之機器學習ML 學習筆記乾貨

2020-12-12 小小的社會家

我們經常看到這幾個熱詞: 人工智慧( ArtificialIntelligence )、機器學習( MachineLearning )和深度學習 (DeepLearning) ,但是它們之間究竟有什麼 區別和聯繫呢?

人工智慧(AI)的根本在於智能,即如何為機器賦予人的智能,這是一個非常大的範圍。

機器學習(ML)是指通過數據訓練出能完成一定功能的模型,是實現人工智慧的手段之一,也是目前最主流的人工智慧實現方法。人工智慧是科學,機器學習是讓機器變得更加智能的方法或算法。

深度學習(DL)是機器學習的一個分支。深度即層數,超過 8 層的神經網絡模型就叫深度學習。深度學習也是當下最流行的機器學習的一種。目前在語音、圖像等領域取得了很好的效果。

三者之間是從大到小的包含關係。

今天重點介紹一下機器學習ML。

機器學習直接來源於早期的人工智慧領域。

機器學習為什麼如此重要?機器學習之所以成為人工智慧背後的強勁動力是在於一個重大突破--網際網路的發明。網際網路有大量的數字信息被生成存儲和分析。機器學習算法在這些大數據方面是最有效的。

機器學習最基本的做法,是使用算法來解析數據、從中學習,然後對真實世界中的事件做出決策和預測。與傳統的為解決特定任務、硬編碼的軟體程序不同,機器學習是用大量的數據來「訓練」,通過各種算法從數據中學習如何完成任務。機器學習則是機器通過大數據的輸入,從中主動尋求規律,驗證規律,最後得出結論,機器據此結論來自主解決問題,如果出現了偏差,會自主糾錯。

什麼是機器學習呢?

機器學習ML(Machine Learning)是一門人工智慧的學科,一門多領域交叉學科,涉及概率論、統計學、逼近論、凸分析、算法複雜度理論等多門學科。專門研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的性能。

機器學習ML是人工智慧的核心,是使計算機具有智能的根本途徑,其應用遍及人工智慧的各個領域,它主要使用歸納、綜合而不是演繹。

ML defined byLangley(1996) - Machine learning is a science of the artificial. Thefield's main objects of study are artifacts, specifically algorithms that improvetheir performance with experience.

ML defined byTom Mitchell (1997)- Machine Learning is the study of computeralgorithms that improve automatically through experience.

ML defined byAlpaydin(2004) - Machine learning is programming computers to optimize aperformance criterion using example data or past experience.

機器學習的本質是空間搜索和函數的泛化。無論使用哪種機器學習模型,都要經歷要經歷「建立模型」,「訓練模型」,「反饋」,「應用」的過程。而這個過程,跟一個嬰兒認識世界,獲取知識的過程是一樣的。培養機器建立人的認識的過程,就是「機器學習」。

機器學習常見分類:

1)有監督學習(supervised learning):從給定的訓練數據集中學習出一個函數,當新的數據到來時,可以根據這個函數預測結果。主要應用於分類和預測。監督學習的訓練集要求是包括輸入和輸出,也可以說是特徵和目標。訓練集中的目標是由人標註的。常用算法包括人工神經網絡(Artificial neural network)、貝葉斯(Bayesian) 、決策樹(Decision Tree)和線性分類(Linear classifier)等 。

2)無監督學習(unsupervised learning):與監督學習相比,訓練集沒有人為標註的結果。又稱歸納性學習(clustering)利用K方式(Kmeans),建立中心(centriole),通過循環和遞減運算(iteration&descent)來減小誤差,達到分類的目的。常用算法包括人工神經網絡(Artificial neural network)、關聯規則學習(Association rule learning)、分層聚類 Hierarchical clustering 和異常檢測(Anomaly detection) 等 。

3)半監督學習(semi- supervised learning):介於監督學習與無監督學習之間。結合了大量未標記的數據和少量標籤數據。常用算法包括包括生成模型(Generative models)、低密度分離(Low-density separation)和聯合訓練Co-training等。

4)強化學習(Reinforcement learning):在這種學習模式下,輸入數據作為對模型的反饋,不像監督模型那樣,輸入數據僅僅是作為一個檢查模型對錯的方式,在強化學習下,輸入數據直接反饋到模型,模型必須對此立刻作出調整。常見的應用場景包括動態系統以及機器人控制等。常見算法包括Q-Learning、時間差學習(Temporal difference learning)和學習自動 Learning Automata等。

機器學習研究內容主要包括三個方面:

(1)面向任務的研究:研究和分析改進一組預定任務的執行性能的學習系統。

(2)認知模型:研究人類學習過程並進行計算機模擬。

(3)理論分析:從理論上探索各種可能的學習方法和獨立於應用領域的算法。

機器學習研究領域集中於兩個範疇:

(1)分類任務要求系統依據已知的分類知識對輸入的未知模式作分析,以確定輸入模式的類屬。相應的學習目標就是學習用於分類的準則(如分類規則)。

(2)問題求解任務要求對於給定的目標狀態,尋找一個將當前狀態轉換為目標狀態的動作序列;機器學習在這一領域的研究工作大部分集中於通過學習來獲取能提高問題求解效率的知識(如搜索控制知識,啟發式知識等)。

機器學習應用廣泛,如:計算機視覺、自然語言處理、生物特徵識別、數據挖掘、搜尋引擎、自動駕駛、醫學診斷、檢測信用卡欺詐、證券市場分析、DNA序列測序、語音和手寫識別、專家系統、認知模擬、規劃和問題求解、戰略遊戲和機器人等。

機器學習各種方法的應用範圍不斷擴大,一部分已形成商品。歸納學習的知識獲取工具已在診斷分類型專家系統中廣泛使用。連接學習在聲圖文識別中佔優勢。分析學習已用於設計綜合型專家系統。遺傳算法與強化學習在工程控制中有較好的應用前景。與符號系統耦合的神經網絡連接學習將在企業的智能管理與智慧機器人運動規劃中發揮作用。

機器學習是繼專家系統之後人工智慧應用的又一重要研究領域,也是人工智慧和神經計算的核心研究課題之一。現有的計算機系統和人工智慧系統沒有什麼學習能力,至多也只有非常有限的學習能力,因而不能滿足科技和生產提出的新要求。對機器學習的討論和機器學習研究的進展,必將促使人工智慧和整個科學技術的進一步發展。

結語

機器學習是一門人工智慧的科學,該領域的主要研究對象是人工智慧,特別是如何在經驗學習中改善具體算法的性能。機器學習是人工智慧的組成部分,是人工智慧的核心和前沿。機器學習的進展將不斷推動人工智慧向前發展。

文章來源:http://www.ziiai.com/blog/316

相關焦點

  • 人工智慧之機器學習算法體系匯總
    Github開源機器學習系列文章及算法源碼1. 人工智慧之機器學習體系匯總【直接上乾貨】此處梳理出面向人工智慧的機器學習方法體系,主要體現機器學習方法和邏輯關係,理清機器學習脈絡,後續文章會針對機器學習系列講解算法原理和實戰。
  • 李宏毅機器學習完整筆記正式發布
    《LeeML-Notes》李宏毅機器學習筆記3.《LeeML-Notes》學習筆記框架4.筆記內容細節展示a. 對梯度下降概念的解析b. 為什麼需要做特徵縮放c. 隱形馬爾科夫鏈的應用5.代碼呈現a. 回歸分析b.
  • 知乎 | 機器/深度學習入門建議
    獲得CV入坑學習資料視頻:(選一個喜歡的就行)文檔教程:還是推薦看莫煩的教程:書籍的話推薦看看《利用Python進行數據分析》建議觀看吳恩達老師的課程,可以看個兩三遍,乾貨很多機器學習實戰:cuijiahua.com/blog/ml/參考書籍:《統計學習方法》李航吳恩達機器學習筆記:http://www.ai-start.com/ml2014/1.
  • 【重溫經典】吳恩達機器學習課程學習筆記七:Logistic回歸
    【導讀】前一段時間,專知內容組推出了春節充電系列:李宏毅2017機器學習課程學習筆記,反響熱烈,由此可見,大家對人工智慧、機器學習的系列課程非常感興趣
  • 李宏毅機器學習完整筆記發布,AI 界「最熱視頻博主」中文課程筆記全開源
    因為課程中乾貨滿滿,李宏毅老師的課程視頻也被稱為中文世界中最好的機器學習視頻。李老師以幽默風趣的上課風格讓很多晦澀難懂的機器學習理論變得輕鬆易懂,他將理論知識與有趣的例子結合在課堂上展現,並且對深奧的理論知識逐步推導,保證學習者能夠學習到問題的精髓所在。比如老師會經常用寶可夢來結合很多機器學習算法。對於想入門機器學習又想看中文講解的人來說絕對是非常推薦的。
  • 開發APP,怎麼少得了人工智慧和機器學習?
    全文共2036字,預計學習時長4分鐘多年來,計算機技術飛速發展並且卓有成效。人類已經開啟了開發強大計算機系統的時代,通過合適的設備,行動應用程式能在全球範圍內發揮作用,包括機器、教育、商業等領域。所有這些手機功能都是基於人工智慧 (AI) ,即計算機系統內的一整套思考及學習模式。這意味著什麼?許多智能程序都是依靠對AI的深度研究和深層知識開發的,而開發人員依照其他手機應用的智能及潛能來開發智識功能。我們可以假設,在能夠自己思考的電腦程式和機器出現之前,人類的思考水平與計算機相當。
  • 一文打盡人工智慧和機器學習網絡資源,反正我已經收藏了!
    這些連結夠你學上很久,而且你看完本文一定會再次驚嘆:現在網上關於機器學習、深度學習和人工智慧的信息真的非常多。本文羅列了以下幾個方面的學習資源,供大家收藏:知名研究人員、人工智慧研究機構、視頻課程、博客、Medium、書籍、YouTube、Quora、Reddit、GitHub、播客、新聞訂閱、科研會議、研究論文連結、教程以及各種小抄表。
  • 臺灣大學林軒田機器學習基石課程學習筆記1 -- The Learning Problem
    那麼,從這篇開始,我們將連續對這門課做課程筆記,共16篇,希望能對正在看這們課的童鞋有所幫助。下面開始第一節課的筆記:The Learning Problem。一、What is Machine Learning什麼是「學習」?學習就是人類通過觀察、積累經驗,掌握某項技能或能力。就好像我們從小學習識別字母、認識漢字,就是學習的過程。
  • 林軒田機器學習基石課程學習筆記1 -- The Learning Problem
    學習就是人類通過觀察、積累經驗,掌握某項技能或能力。就好像我們從小學習識別字母、認識漢字,就是學習的過程。而機器學習(Machine Learning),顧名思義,就是讓機器(計算機)也能向人類一樣,通過觀察大量的數據和訓練,發現事物規律,獲得某種分析問題、解決問題的能力。
  • 春節充電系列:李宏毅2017機器學習課程學習筆記19之遷移學習(Transfer Learning)
    春節充電系列:李宏毅2017機器學習課程學習筆記01之簡介春節充電系列:李宏毅2017機器學習課程學習筆記02之Regression春節充電系列:李宏毅2017機器學習課程學習筆記03之梯度下降春節充電系列:李宏毅2017機器學習課程學習筆記04分類(Classification)春節充電系列:李宏毅2017機器學習課程學習筆記05
  • 一文打盡人工智慧和機器學習網絡資源
    激動過後,多數 AI 學習者會陷入焦慮:入坑人工智慧,到底要從何入手?的確,如今學習人工智慧最大的困難不是找不到資料,更多同學的痛苦是:網上資源太多了,以至於沒法知道從哪兒開始搜索,也沒法知道搜到什麼程度。為了節省大家的時間,我們搜遍網絡把最好的免費資源匯總整理到這篇文章當中。
  • 資源 | 15個高質量免費機器學習課程都在這兒了
    這些課程內容包括決策樹,樸素貝葉斯,邏輯回歸,神經網絡和深度學習,估計,貝葉斯學習,支持向量機和核方法,聚類,無監督學習,提升算法,強化學習和學習理論。神經網絡與機器學習導論(csc321),2014年該課程包括視頻講座連結:http://www.cs.toronto.edu/~tijmen/csc321/CMU——機器學習
  • 機器學習(Machine Learning)&深度學習(Deep Learning)資料(之一)
    乾貨很多,值得深入學習下29.《機器學習&數據挖掘筆記_16(常見面試之機器學習算法思想簡單梳理)》 介紹:常見面試之機器學習算法思想簡單梳理,此外作者還有一些其他的機器學習與數據挖掘文章和深度學習文章,不僅是理論還有源碼。70.《文本與數據挖掘視頻匯總》 介紹:Videolectures上最受歡迎的25個文本與數據挖掘視頻匯總71.
  • 科學家如何使用機器學習?《機器學習導論》2021這份講義為你簡明講解,80頁pdf
    我們討論有監督、無監督和強化學習。筆記開始闡述了沒有神經網絡的機器學習方法,如主成分分析,t-SNE,和線性回歸。我們繼續介紹基本和高級神經網絡結構,如傳統神經網絡、(變分)自編碼器、生成對抗網絡、受限玻爾茲曼機器和遞歸神經網絡。可解釋的問題使用對抗性攻擊的例子來討論。
  • 年終總結:2021年人工智慧(AI)和機器學習(ML)五大發展趨勢
    人工智慧(AI)和機器學習(ML)一直在改變著我們的世界,但是2020年給這兩個改變遊戲規則的人帶來了新的機遇和緊迫性-預計2021年會有更大的發展。Covid-19顯然已成為催化劑,推動了從辦公室到生產車間以及從產品創新到消費者喜好的業務。
  • 史上最全的機器學習筆記,301頁PDF精心整理
    機器學習筆記PDF版本訂閱版權申明:特在此聲明,「機器學習筆記(訂閱版)」為本人獨立工作成果,未經允許,不得轉載。Copyright © 2020 Sakura-gh關注微信公眾號「Sakura的知識庫」,即可訂閱301頁的機器學習筆記PDF版本,訂閱後24小時內會發送到郵箱~訂閱版本將長期進行修訂和更新,並會在後續免費發送到你的郵箱中~封面概覽如下:
  • ScalersTalk成長會機器學習小組第7周學習筆記
    Scalers點評:機器學習小組是成長會的內部小組,這是成長會機器學習小組第7周學習筆記往期日誌:ScalersTalk成長會機器學習小組第6周學習筆記ScalersTalk成長會機器學習小組第5周學習筆記(微信有個Bug,無法連結,參見3月23日推送)ScalersTalk成長會機器學習小組第
  • 常用機器學習算法的目前主要有深度學習領域的各種模型及框架
    本周咱們就來聊聊人工智慧到底是怎麼回事兒。中國人工智慧四個代表職位之一的「算法工程師」——數據科學家,是近年來在網際網路和人工智慧領域顯示出極大發展潛力的新興職位,是在計算機科學、工程技術等諸多領域中分別涉及的領域內的一個綜合領域。
  • 盤點52個全球人工智慧和機器學習重要會議
    作為人工智慧領域的重要會議,NIPS 每年都能匯集來自計算機科學的專家和專業人士,討論和分享有關人工智慧的新想法。這是一個你應該優先參加的機器學習和人工智慧會議,其討論範圍涵蓋神經科學、機器學習、計算科學、信息處理、神經計算和神經系統。機器之心將全程關注本次大會(參見:雖然票早已被搶光,你可以從機器之心關注NIPS 2017)。
  • 機器喵大作戰 | 解剖人工智慧、機器學習和深度學習
    說白了,機器學習是實現人工智慧的方法之一。而機器學習,又細分了很多種學習「方法」:有監督學習、無監督學習、強化學習、深度學習等等。先來簡單扒一扒各種學習方法——▌有監督學習比如,機器並不能學習並識別貓的模型,但是可從海量的貓圖片中,發現黑貓白貓兩大類,然後把他們分類。這,就是「無監督學習」。▌強化學習在機器學習中,還有一種方法,叫做強化學習,俗稱:打一巴掌,給個甜棗。