如何區分人工智慧、機器學習和深度學習?

2021-01-08 矽谷密探

本文內容來自於矽谷投資人Lake Dai,LDV Partners合伙人。嚴肅編輯整理。

人工智慧(Artificial Intelligence)是一個最廣泛的概念,人工智慧的目的就是讓計算機這臺機器能夠象人一樣思考,而機器學習(Machine Learning)是人工智慧的分支,專門研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,使之不斷改善自身的性能。

深度學習(Deep Learning)是一種機器學習的方法,它試圖使用包含複雜結構或由多重非線性變換構成的多個處理層(神經網絡)對數據進行高層抽象的算法。

神經網絡是一組大致模仿人類大腦構造設計的算法,用於識別模式。神經網絡通過機器感知系統解釋傳感器數據,能夠對原始輸入進行標記或聚類等操作。神經網絡所能識別的模式是數值形式,因此圖像、聲音、文本、時間序列等一切現實世界的數據必須轉換為數值。

在深度學習網絡中,每一個節點層在前一層輸出的基礎上學習識別一組特定的特徵。隨著神經網絡深度增加,節點所能識別的特徵也就越來越複雜,因為每一層會整合併重組前一層的特徵。

(http://fortune.com/ai-artificial-intelligence-deep-machine-learning/)

上圖顯示了一個神經網絡用於判定一個圖片是不是一條狗的過程,輸入是圖片,通過深層神經網絡對狗的低層特徵進行抽象,最後輸出是圖片是狗的概率。

深度學習的過程同樣是分為訓練和推理(既「評估」)兩個過程,通過訓練過程來獲得數據模型,然後用於評估新的數據。

數據模型分為兩種,一種是所謂判別模型(Discriminative Model),也就是說模型可以直接用來判別事物的。這裡所說的判別事物,最典型的就是做分類。既然直接可以用來分類,也就是說我們可以在已知屬性的條件下,對該記錄進行判斷。所以,判別模型是對條件概率進行的建模,也就是p(Y|X)。這裡X就是屬性集合,實際上就是一個向量;而Y則可能是一個值(此時對應分類問題), 可能是一個向量(此時對應序列標註問題)。判別模型常用於處理分類問題(比如鑑定垃圾郵件)、圖像識別等等。

再說一說生成模型(Generative Model)。生成模型可以描述數據的生成過程。換句話說,已知了這個模型,我們就可以產生該模型描述的數據。而數據由兩部分組成,也就是(X,Y),前者是特徵,後者則是類別(Y是標量)或者序列類別(Y是向量)。要描述整個數據,也就是要對p(X,Y)進行建模,所以是對聯合概率進行建模。生成模型本身不是做分類或者序列標註的,但是可以用來解決這些問題,也可以用於生成式問題,比如聊天機器人、比如AI譜曲等問題。

而機器學習可以分成下面幾種類別:

監督學習從給定的訓練數據集中學習出一個函數,當新的數據到來時,可以根據這個函數預測結果。監督學習的訓練集要求是包括輸入和輸出,也可以說是特徵和目標。訓練數據中的目標是由人標註的。常見的監督學習算法包括回歸分析和統計分類。

無監督學習與監督學習相比,訓練集沒有人為標註的結果。常見的無監督學習算法有聚類。

半監督學習介於監督學習與無監督學習之間。它主要考慮如何利用少量的標註樣本和大量的未標註樣本進行訓練和分類的問題。。

增強學習通過觀察來學習做成如何的動作。每個動作都會對環境有所影響,學習對象根據觀察到的周圍環境的反饋來做出判斷。

在傳統的機器學習領域,監督學習最大的問題是訓練數據標註成本比較高,而無監督學習應用範圍有限。利用少量的訓練樣本和大量無標註數據的半監督學習一直是機器學習的研究重點。

當前非常流行的深度學習GAN模型和半監督學習的思路有相通之處,GAN是「生成對抗網絡」(Generative Adversarial Networks)的簡稱,包括了一個生成模型G和一個判別模型D,GAN的目標函數是關於D與G的一個零和遊戲,也是一個最小-最大化問題。

GAN實際上就是生成模型和判別模型之間的一個模仿遊戲。生成模型的目的,就是要儘量去模仿、建模和學習真實數據的分布規律;而判別模型則是要判別自己所得到的一個輸入數據,究竟是來自於真實的數據分布還是來自於一個生成模型。通過這兩個內部模型之間不斷的競爭,從而提高兩個模型的生成能力和判別能力。

(圖片來自Nvidia Deep Learning Training Workshop)

目前主流的深度學習框架:

Caffe 由Berkeley提出

TensorFlow 由Google提出 (Apache 2.0)

Torch (BSD License), facebook是主要使用者

MXNet 一個相對中立的機器學習框架(Apache 2.0), 被Amazon AWS使用

CNTK2 由Microsoft提出 (MIT License)

人工智慧在各個行業的公司分布

(圖片來源 http://www.shivonzilis.com/)

目前人工智慧在各個領域的初創公司數量(2016年的數據):

Deep learning/機器學習 (通用)(123家公司)

Deep learning/機器學習 (應用) (260家公司)

NLP (通用) (154家公司)

NLP (語音識別) (78家公司)

計算機視覺/圖像識別 (通用) (106家公司)

計算機視覺/圖像識別 (應用) (83 家公司)

手勢控制 (33 家公司)

虛擬個人助理 (92 家公司)

智慧機器人 (65 家公司)

推薦系統 (60 家公司)

Context aware computing (28 家公司)

語音即時翻譯 (15 家公司)

視頻識別 (14 家公司)

下圖是目前人工智慧在各個行業的熱度

上圖是2011到2016年最積極的人工智慧企業投資者

下圖是福布斯關注的50家人工智慧公司。

(圖片來自http://fortune.com/2017/02/23/artificial-intelligence-companies/)

融資最多的人工智慧初創公司(2011-2016)

Sentient Technologies:使用先進的人工智慧技術,大規模分布式計算和科學的方法來驗證新發現的策略,Sentient Technologies為各種領域中的複雜問題提供了新的解決方案。

Ayasdi:機器學習平臺,數據可視化,分析,金融技術,醫療保健代理系統:

Vicarious: 這是一家神秘的人工智慧公司,Vicarious的目標定位於「建立下一代的人工智慧算法」。並且聲稱要構建「像人類一樣思考的軟體」,實現「人腦級別的視覺、語言和自動控制系統」,致力於研究通用人工智慧,目前他們的研究重點是實現人工視覺識別系統。

Context Relevant:Context Relevant通過使用機器學習驅動的自動化數據科學平臺,來解決一些世界上最棘手的大數據,預測和行為挑戰 - 比任何其他解決方案更快更有效。

Cortia:Cortica的技術模擬人類皮層,以便以最高的精度理解和識別圖像。

Workfusion:WorkFusion是全球運營的完整自動化解決方案,將您需要的複雜業務流程數位化所需的核心功能整合到一個平臺中:業務流程管理(BPM),機器人過程自動化(RPA),勞動力編排和機器學習提供的認知自動化。

RapidMiner:開源預測分析平臺,使企業能夠在業務流程中包括預測分析

Digital Reasoning Systems:確保合規性,保持安全性,並快速準確地分析信息。

H2O.ai:H2O是世界領先的開源深度學習平臺。 H2O被超過80,000個數據科學家和超過9,000個組織使用。

Viv Labs:Viv在開發語音智能助理,已被三星收購。

參考文獻:

http://fortune.com/ai-artificial-intelligence-deep-machine-learning/

https://en.wikipedia.org/wiki/Artificial_neural_network

http://fortune.com/2017/02/23/artificial-intelligence-companies/

https://www.amazon.com/b?ie=UTF8&node=16008589011#

http://techemergence.com/artificial-intelligence-industry-an-overview-by-segment/

Nvidia Deep Learning Training Workshop

Crunchbase

CB Insights

關注矽谷密探

緊盯全球創新趨勢

(長按上方二維碼即可關注,神馬,這居然是二維碼!)

相關焦點

  • 人工智慧、機器學習、神經網絡和深度學習之間是什麼樣的關係?
    但是大家在關注或研究人工智慧領域的時候,總是會遇到這樣的幾個關鍵詞:深度學習、機器學習、神經網絡。那他們之間到底是什麼樣的關係呢?本文引用地址:http://www.eepw.com.cn/article/201806/381185.htm  先說人工智慧,人工智慧是在1956年一個叫達特茅斯會議上提出的。
  • 人工智慧、機器學習、深度學習和神經網絡傻傻分不清?看這兒!
    人工智慧、機器學習、深度學習和神經網絡這些詞傻傻分不清?這四個都是非常熱門的詞彙,很多人甚至將四者看成是一種等價的關係,在很多報導中,會混雜使用。事實上,這四者之間既有一定的聯繫,但也有明顯的區別。可以簡單理解為:機器學習是人工智慧領域中的一個重要分支;深度學習是實現機器學習的一種重要方法;而深度學習通常都是基於多層神經網絡的。筆者之前畫了一張圖,比較形象一些。
  • 機器學習與深度學習有什麼區別?
    近年來,隨著科技的快速發展,人工智慧不斷進入我們的視野中。作為人工智慧的核心技術,機器學習和深度學習也變得越來越火。一時間,它們幾乎成為了每個人都在談論的話題。那麼,機器學習和深度學習到底是什麼,它們之間究竟有什麼不同呢? 什麼是機器學習?
  • 深度| 機器學習對抗性攻擊報告,如何欺騙人工智慧?
    我們不妨將Master的60連勝視為人工智慧與人類交鋒的信號和警報,在人工智慧時代人類如何完成自身的「刷新升級」值得每個人思考。同時其帶來的安全問題也急需安全專家去突破。隨著人工智慧和機器學習技術在網際網路的各個領域的廣泛應用,其受攻擊的可能性,以及其是否具備強抗打擊能力一直是安全界一直關注的。之前關於機器學習模型攻擊的探討常常局限於對訓練數據的汙染。
  • 人工智慧的意義,機器學習的三種類型
    縮小人工智慧領域   人工智慧是一個猶如銀河系的龐大話題,擁有很多子類,如自然語言處理(NLP)、人工神經網絡、計算機視覺、機器學習、深度學習、機器人等等。   人工智慧的正式定義如下:「可執行通常需要人類智能(如視覺感知、語音識別、決策和語言之間的翻譯)的任務的計算機系統的理論和發展。」
  • 2021年重要的機器學習和A人工智慧的發展趨勢
    一項研究發現,人們目前使用的設備中有77%正在使用機器學習(ML)技術。通過採用亞馬遜Alexa、Google Home、Netflix等智能設備,人工智慧服務正在為組織提供行業領先的創新解決方案。 人們需要了解2021年一些重要的機器學習和人工智慧趨勢,這些趨勢可能會重塑經濟、社會和工業運作。
  • 人工智慧和機器學習如何從物聯網數據中提取關鍵見解
    當談到為這些關鍵見解制定路線時,人工智慧(AI)和機器學習(ML)是照亮道路的技術。  幾十年來,數據分析主要涉及計算機編譯和存儲信息,並將其呈現給人類進行分析,這一過程比較緩慢、容易出錯,並且無法解讀隱藏在數據深處的趨勢。這些缺點在物聯網環境中更加嚴重,在物聯網環境中,大量傳感器和行動裝置產生的數據量呈指數級增長。
  • 從零開始的人工智慧和機器學習,該從哪裡入手呢?
    圖源:Unsplash問:零基礎,如何讓人工智慧和機器學習更簡單,更容易上手呢?儘管人工智慧行業已經發展得熱火朝天,但目前人們對於它的定義仍沒有達成一致。有人認為可以將深度學習視為人工智慧,也有人認為,除非它通過圖靈測試,否則就不能算是人工智慧。這在一開始就阻礙了他的學習,因為要學會有多種不同定義的東西真的很難。真是受夠了這麼多定義。如何入手?
  • 量子物理學機器學習:讓人工智慧學習與運用量子力學
    在剛出版的《 自然通訊 》上,發表了一篇科技論文,題為:「將機器學習和量子化學與分子波函數的深度神經網絡統一起來」,科學家們讓人工智慧學習與運用量子力學。在當代醫學和工業應用中的新型專用分子的化學計算設計過程中,需要求解一些方程。
  • 機器學習、深度學習,然後軟體裡面的流程是機器學習之前要做好的
    最近有一篇採訪了江蘇樂博智能製造新疆地區總經理陳輝的報導,報導中討論到工業4.0轉型升級中智能工廠的問題,想了解一下各方和樂博ai是如何推動打造智能工廠的?樂博ai還有哪些可以突破的地方?近日,李開復博士和王航老師在武漢峰會成功會面,雙方就推動ai賦能實體經濟等共同話題展開討論。今年3月8日到今年5月1日這兩年,在江蘇樂博一座人工智慧示範工廠中。
  • 人工智慧、深度學習與人類智能之間的區別和聯繫
    人工智慧的浪潮正在席捲全球,人工智慧(Artificial Intelligence)、深度學習(Deep Learning)、人類智能(Human Intelligence)這些高頻詞彙經常出現。那麼,什麼是人工智慧?什麼是深度學習?什麼又是人類智能呢?
  • 如何從零開始逐步學習人工智慧
    階段一:高等數學 人工智慧的基礎,其中高等數學是必需必會的。而高等數學則包括數據分析、概率論、線性代數及矩陣、凸優化等。良好的數學基礎,也是有利於以後同學們在後續的課程中更好的理解機器學習和深度學習的內容。同時對於AI研究尤為重要,例如人工智慧中的智能很大一部分依託「概率論」實現的。
  • 機器學習和深度學習最佳作品
    來源:CPDA數據分析師網 機器學習算法的超參數優化:理論與實踐 機器學習算法已廣泛應用於各種應用程式和領域,為了使機器學習模型適應不同的問題,必須調整其超參數,為機器學習模型選擇最佳的超參數配置會直接影響模型的性能,它通常需要對機器學習算法和適當的超參數優化技術有深入的了解
  • 網際網路上20大免費數據科學、機器學習和人工智慧慕課
    機器學習與人工智慧- 機器學習與人工智慧基礎- 深度學習- 自然語言處理- 計算機視覺我沒有實地考察不同課程,也沒有花幾個小時過濾網上的幹擾信息,而是編輯了這個列表,其中包含了我發現在機器學習、人工智慧、數據科學和編程學習中很有用的課程。下面,就來看看這個列表吧!慕課0.
  • 自動化是當前與深度學習及人工智慧等的不可分割的關係
    自動化是當前與深度學習及人工智慧等的不可分割的關係,也同樣是當前的熱門主題。自動化機器學習在自動化,人工智慧,無人機等科技領域有廣泛的應用。自動化機器學習可以模擬生物學過程,比如分類,和識別。分類。分類就是識別。
  • 人工智慧深度學習的未來展望
    本文是推出的人工智慧深度學習綜述,也是Hinton、LeCun和Bengio三位大神首次合寫同一篇文章。該綜述在深度學習領域的重要性不言而喻,可以說是所有人入門深度學習的必讀作品。 本文上半部分深入淺出介紹深度學習的基本原理和核心優勢,下半部分則詳解CNN、分布式特徵表示、RNN及其不同的應用,並對深度學習技術的未來發展進行展望。
  • 2018年,機器學習和人工智慧領域最重要的突破是什麼?
    2018年,人工智慧發展到什麼階段了?Quora鼎鼎有名的大V認為,AI炒作和AI威脅論在今年都降溫,並且不會有AI寒冬,升溫的是各種開源框架,2019年的AI,你認為會是怎樣? 2018年,機器學習和人工智慧領域最重要的突破是什麼? (這裡給你留出充分思考的時間。)
  • 深度學習技術和卷積神經網絡(CNN)讓機器視覺識別更智能
    隨著人工智慧技術的進步,深度學習技術(DL)和卷積神經網絡技術(CNN)領域的人工智慧(AI)被引入到機器視覺圖像處理系統的應用中來,從而幫助機器學習和機器檢測缺陷更加高效,使機器視覺識別的過程更加精確。也讓使用這些技術的企業可以從智能化中獲得更高的生產經營效益。
  • ...首席科學家鄧力:深度學習十年簡史和人工智慧未來展望(33PDF...
    鄧力博士回顧了他與 Hinton 的合作及其產業影響,重點講述語音識別如何隨深度學習發展進入商用階段,還介紹了微軟近兩年的人工智慧進展,並對深度學習技術、應用和產業進行展望。演講最後,鄧力分享了他最新的思想和工作——將符號式邏輯推理和數值張量式神經網絡結合到一起,有望解決深度學習黑箱問題、常識嵌入與充實問題,以及邏輯推理規則的自動學習問題。
  • 謝國彤:疾病預測的機器學習、深度學習和經典回歸方法
    造成數據中正例相對較少,很不均衡,對機器學習算法的要求更高。疾病預測的主要方法疾病預測的主要方法可以簡單的分為經典回歸方法、機器學習方法和深度學習方法三大類。下面分別用三篇論文舉例介紹一下。將各種特徵選擇算法與預測算法相結合的平均顯示,保守均值和基於邊緣的刪失回歸相結合在 AUC 評價標準中能達到 0.777,為性能最佳的結果。基於深度學習方法的疾病預測近年來,深度學習技術飛速發展,對圖像識別、語音識別、自然語言理解等多個領域產生了顛覆性的改變。