【深度】AI領域三大範式的發展簡史

2020-12-15 中國機器人網
   導讀: 過去50年人工智慧(AI)領域形成的三大範式:邏輯學、概率方法和深度學習。如今,無論依靠經驗和「數據驅動」的方式,還是大數據、深度學習的概念,都已經深入人心,可是早期並非如此。

 

  今天,我們一起來回顧過去50年人工智慧(AI)領域形成的三大範式:邏輯學、概率方法和深度學習。如今,無論依靠經驗和「數據驅動」的方式,還是大數據、深度學習的概念,都已經深入人心,可是早期並非如此。很多早期的人工智慧方法是基於邏輯,並且從基於邏輯到數據驅動方法的轉變過程受到了概率論思想的深度影響,接下來我們就談談這個過程。

 

  本文按時間順序展開,先回顧邏輯學和概率圖方法,然後就人工智慧和機器學習的未來走向做出一些預測。
 

  圖1:圖片來源Coursera的概率圖模型課


  一、邏輯和算法(常識性的「思考」機)

 

  許多早期的人工智慧工作都是關注邏輯、自動定理證明和操縱各種符號。JohnMcCarthy於1959年寫的那篇開創性論文取名為《常識編程》也是順勢而為。

 

  如果翻開當下最流行的AI教材之一——《人工智慧:一種現代方法》(AIMA),我們會直接注意到書本開篇就是介紹搜索、約束滿足問題、一階邏輯和規劃。第三版封面(見下圖)像一張大棋盤(因為棋藝精湛是人類智慧的標誌),還印有阿蘭·圖靈(計算機理論之父)和亞里斯多德(最偉大的古典哲學家之一,象徵著智慧)的照片。
 

  圖2:AIMA的封面,它是CS專業本科AI課程的規範教材

 

  然而,基於邏輯的AI遮掩了感知問題,而我很早之前就主張了解感知的原理是解開智能之謎的金鑰匙。感知是屬於那類對於人很容易而機器很難掌握的東西。(延伸閱讀:《計算機視覺當屬人工智慧》,作者2011年的博文)邏輯是純粹的,傳統的象棋

機器人

也是純粹算法化的,但現實世界卻是醜陋的,骯髒的,充滿了不確定性。

 

  我想大多數當代人工智慧研究者都認為基於邏輯的AI已經死了。萬物都能完美觀察、不存在測量誤差的世界不是機器人和大數據所在的真實世界。我們生活在機器學習的時代,數位技術擊敗了一階邏輯。站在2015年,我真是替那些死守肯定前件拋棄梯度下降的傻子們感到惋惜。

 

  邏輯很適合在課堂上講解,我懷疑一旦有足夠的認知問題成為「本質上解決」,我們將看到邏輯學的復甦。未來存在著很多開放的認知問題,那麼也就存在很多場景,在這些場景下社區不用再擔心認知問題,並開始重新審視這些經典的想法。也許在2020年。

 

  二、概率,統計和圖模型(「測量」機)

 

  概率方法在人工智慧是用來解決問題的不確定性。《人工智慧:一種現代方法》一書的中間章節介紹「不確定知識與推理」,生動地介紹了這些方法。如果你第一次拿起AIMA,我建議你從本節開始閱讀。如果你是一個剛剛接觸AI的學生,不要吝嗇在數學下功夫。
 

  圖3:來自賓夕法尼亞州立大學的概率論與數理統計課程的PDF文件

 

  大多數人在提到的概率方法時,都以為只是計數。外行人很容易想當然地認為概率方法就是花式計數方法。那麼我們簡要地回顧過去統計思維裡這兩種不相上下的方法。

 

  頻率論方法很依賴經驗——這些方法是數據驅動且純粹依靠數據做推論。貝葉斯方法更為複雜,並且它結合數據驅動似然和先驗。這些先驗往往來自第一原則或「直覺」,貝葉斯方法則善於把數據和啟發式思維結合做出更聰明的算法——理性主義和經驗主義世界觀的完美組合。

 

  最令人興奮的,後來的頻率論與貝葉斯之爭,是一些被稱為概率圖模型的東西。該類技術來自計算機科學領域,儘管機器學習現在是CS和統計度的重要組成部分,統計和運算結合的時候它強大的能力才真正釋放出來。

 

  概率圖模型是圖論與概率方法的結合產物,2000年代中期它們都曾在機器學習研究人員中風靡一時。當年我在研究生院的時候(2005-2011),變分法、Gibbs抽樣和置信傳播算法被深深植入在每位CMU研究生的大腦中,並為我們提供了思考機器學習問題的一個極好的心理框架。我所知道大部分關於圖模型的知識都是來自於CarlosGuestrin和JonathanHuang。CarlosGuestrin現在是GraphLab公司(現改名為Dato)的CEO,這家公司生產大規模的產品用於圖像的機器學習。JonathanHuang現在是Google的高級研究員。

 

  下面的

視頻

儘管是GraphLab的概述,但它也完美地闡述了「圖形化思維」,以及現代數據科學家如何得心應手地使用它。Carlos是一個優秀的講師,他的演講不局限於公司的產品,更多的是提供下一代機器學習系統的思路。

 

  (圖4:概率圖模型的計算方法介紹|DatoCEO,CarlosGuestrin教授)

 

  如果你覺得深度學習能夠解決所有機器學習問題,真得好好看看上面的

視頻

。如果你正在構建一套推薦系統,一個健康數據分析平臺,設計一個新的交易算法,或者開發下一代搜尋引擎,圖模型都是完美的起點。

 

  三、深度學習和機器學習(數據驅動機)

 

  機器學習是從樣本學習的過程,所以當前最先進的識別技術需要大量訓練數據,還要用到深度神經網絡和足夠耐心。深度學習強調了如今那些成功的機器學習算法中的網絡架構。這些方法都是基於包含很多隱藏層的「深」多層神經網絡。註:我想強調的是深層結構如今(2015年)不再是什麼新鮮事。只需看看下面這篇1998年的「深層」結構文章。
 

  圖5:LeNet-5,YannLeCun開創性的論文《基於梯度學習的文檔識別方法》

 

  你在閱讀LeNet模型導讀時,能看到以下條款聲明:

 

  要在GPU上運行這個示例,首先得有個性能良好的GPU。GPU內存至少要1GB。如果顯示器連著GPU,可能需要更多內存。

 

  當GPU和顯示器相連時,每次GPU函數調用都有幾秒鐘的時限。這麼做是必不可少的,因為目前的GPU在進行運算時無法繼續為顯示器服務。如果沒有這個限制,顯示器將會凍結太久,計算機看上去像是死機了。若用中等質量的GPU處理這個示例,就會遇到超過時限的問題。GPU不連接顯示器時就不存在這個時間限制。你可以降低批處理大小來解決超時問題。

 

  我真的十分好奇Yann究竟是如何早在1998年就把他的深度模型折騰出一些東西。毫不奇怪,我們大伙兒還得再花十年來消化這些內容。

 

  更新:Yann說(通過Facebook的評論)ConvNet工作可以追溯到1989年。「它有大約400K連接,並且在一臺SUN4機器上花了大約3個星期訓練USPS數據集(8000個訓練樣本)。」——LeCun

 

  註:大概同一時期(1998年左右)加州有兩個瘋狂的傢伙在車庫裡試圖把整個網際網路緩存到他們的電腦(他們創辦了一家G打頭的公司)。我不知道他們是如何做到的,但我想有時候需要超前做些並不大規模的事情才能取得大成就。世界最終將迎頭趕上的。

 

  結論:


  我沒有看到傳統的一階邏輯很快捲土重來。雖然在深度學習背後有很多炒作,分布式系統和「圖形思維」對數據科學的影響更可能比重度優化的CNN來的更深遠。深度學習沒有理由不和GraphLab-style架構結合,未來幾十年機器學習領域的重大突破也很有可能來自這兩部分的結合。

相關焦點

  • 「AI簡史」從1950到2020
    人工智慧的研究領域包括機器人、語言識別、圖像識別、自然語言處理和專家系統等。 事實上,給一門學科界定範圍是很難的,即使是像數學這樣古老的學科,有時我們也很難梳理出一個明確的邊界。而對於一門正在快速發展的學科,尤其像人工智慧這樣仍在不斷擴展邊界,更是很難做出一個相對準確的判斷。
  • 經典推薦之《未來簡史》:一本既有深度又「溫柔」的書
    赫拉利關注的領域涉及歷史學、人類學、生態學、基因學等,從宏觀視覺切入的研究往往得出頗具新意而又耐人尋味的觀點。所以說,他站在了一個我們達不到的高度,看整個人類世界,簡史不簡。NO.2出版社這本「簡史」由中信出版集團出版,譯者林俊宏。
  • 《AI全景報告》聚焦中國;中國AI公司會議室取名簡史;AI投資理性
    【今日資訊頭條 | 劍橋2019年度《AI全景報告》聚焦中國,盤點全球AI大勢】來源:stateofai劍橋2019年度《AI全景報告》聚焦中國劍橋2019年度《AI全景報告》出爐,全方位總結過去一年來AI領域的研究成果與突破、人才形勢、產業動態、政府政策,並作出未來預測。
  • 除了深度學習 你還應該關注這 6 大 AI 領域
    因為深度學習最近在語音識別、圖像識別等領域取得的突破,很多人都把人工智慧與深度學習混為一談。但深度學習只是AI的一方面,實際上還有其他一些AI的分支也正在取得進展,並且這些技術分支在很多領域都有極大的應用潛力。投資人Nathan Benaich系統地闡述了AI的6個值得關注的領域以及其潛在應用於相關的公司和研究人員,是分析和跟蹤AI的一篇很好的介紹文章。
  • 機器之心專訪吳恩達,深度學習課程項目Deeplearning.ai正式發布
    Deeplearning.ai 課程地址:https://www.coursera.org/specializations/deep-learning今早,吳恩達在 Medium 上發布了一篇博客,宣布 Deeplearning.ai 項目正式啟動。同時表示今天發布的項目僅僅是他正在發布的三大項目中的第一個。
  • 談談機器學習的趨勢 - 新三大學習範式
    引 言機器學習/深度學習是一個廣闊的研究領域,說來並不年輕,但又朝氣蓬勃,似乎每天都在湧現大量的新方法和新技術。一般來說,傳統的機器學習可以分為三個基本學習範式,即監督學習、無監督學習以及強化學習。
  • 打開人工智慧黑箱:看最新16篇可解釋深度學習文章,帶您了解增強AI透明性
    從聲學、圖像到自然語言處理,深度學習在許多領域都取得了成功。然而,將深度學習應用於無所不在的圖數據並非易事,因為圖形具有獨特的特性。近年來,這一領域的研究取得了很大的進展,極大地推動了圖分析技術的發展。
  • 多Agent深度強化學習綜述(中文版),21頁pdf
    , DRL)在諸多複雜序貫決策問題中取得巨大突破.由於融合了深度學習強大的表徵能力和強化學習有效的策略搜索能力, 深度強化學習已經成為實現人工智慧頗有前景的學習範式.然而, 深度強化學習在多Agent系統的研究與應用中, 仍存在諸多困難和挑戰, 以StarCraft Ⅱ為代表的部分觀測環境下的多Agent學習仍然很難達到理想效果.
  • 深度學習未來的三種範式
    深度學習是一個廣闊的領域,它圍繞著一種形態由數百萬甚至數十億個變量決定並不斷變化的算法——神經網絡。似乎每隔一天就有大量的新方法和新技術被提出來。不過,總的來說,現代深度學習可以分為三種基本的學習範式。每一種都有自己的學習方法和理念,提升了機器學習的能力,擴大了其範圍。
  • 深度學習未來三大範式:混合學習、成分學習和簡化學習
    這種學習範式試圖去跨越監督學習與無監督學習邊界。由於標籤數據的匱乏和收集有標註數據集的高昂成本,它經常被用於商業環境中。從本質上講,混合學習是這個問題的答案。我們如何才能使用監督學習方法來解決或者連結無監督學習問題?例如這樣一個例子,半監督學習在機器學習領域正日益流行,因為它能夠在很少標註數據的情況下對有監督的問題表現得異常出色。
  • 人工智慧融入學校教育的三大發展領域
    人工智慧融入學校教育的三大發展領域 李倩 發表於 2018-08-29 10:12:20 前 言 人工智慧技術與學校教育融合成為一種未來趨勢,這為個性化學習和個別化學習的實現提供技術保障
  • 潘魯生:手工藝文化發展的亞洲範式
    民   藝   館  上世紀 60 年代託馬斯•庫恩提出了科學界的「範式轉換」概念。如果將之作為一種「解決問題的模式」,在具有普遍性的經驗研究數據支持的基礎上,深化關於經驗的理解和研究,具有現實意義。從亞洲國家手工藝文化發展的基本經驗來看,主要有兩種基本範式,一是原生態、聚落化傳承和發展的「手藝農村」範式,二是凝鍊傳統文化元素和精神的「設計產業」範式。
  • 深度學習框架 fast.ai 2.0 正式發布
    經歷了長久的等待之後,深度學習框架 fast.ai 2.0 版本終於正式發布了。fast.ai 課程,是為了踐行 Jeremy Howard 「讓深度學習不再酷」的承諾。這話的意思是也消除掉門檻,讓更多沒有高等數學和統計專業基礎的人,都有機會來了解和應用深度學習。關於這個事兒,我在《如何從零基礎學最前沿的 Python 深度學習?》一文中,給你介紹過。
  • 自然語言處理的發展簡史
    而自然語言處理(Natural Language Processing,簡稱NLP)既是人工智慧的核心技術,又是計算機科學和語言科學的分支學科;它推動著語言智能的持續發展和突破,並越來越多地應用於各個行業。正如國際知名學者周海中先生曾經所言:「自然語言處理是極有吸引力的研究領域,它具有重大的理論意義和實用價值。」
  • 人工智慧產業鏈的三個核心,底層硬體、通用AI技術及平臺、應用領域...
    目前在GPU領域,英偉達主打工業級超大規模深度網絡加速,並於日前推出了基於Volta、首款速度超越100TFlops的處理器Tesla;英特爾主要圍繞FPGA構建產業,推出了模仿人腦的人工智慧晶片。谷歌也推出了第二代TPU晶片,為自己的開源TensorFlow框架提供晶片支撐。
  • 常用機器學習算法的目前主要有深度學習領域的各種模型及框架
    中國人工智慧四個代表職位之一的「算法工程師」——數據科學家,是近年來在網際網路和人工智慧領域顯示出極大發展潛力的新興職位,是在計算機科學、工程技術等諸多領域中分別涉及的領域內的一個綜合領域。很多初期從事人工智慧相關工作的人,受限於對本專業知識認識有限,在對人工智慧了解尚淺之時,就開始應聘。甚至有人剛開始著手做招聘工作時,就拿數據科學家這個工作的名稱誤導了初入門人工智慧行業的從業者。
  • 深度 | 致研究者:2018 AI研究趨勢
    本文略有不同,Alex Honchar在Medium發文,從研究者的角度分享機器學習明年發展的走向。機器之心對此行了編譯和整理。本文的預測基於 2012 年以來我關注的學術界和科技巨頭實驗室的研究思路演變。我所選擇的領域,從我的觀點來看,都多多少少尚處於發展的初級階段,但是已經為研究做足了準備,且在 2018 年可能獲得良好的結果,並在 2019-2020 年能投入實際應用。
  • 華為首次投資國內AI公司,多模態深度語義理解技術成競逐焦點?
    該公司最突出的技術是「多模態深度語義理解引擎(iDeepwise.ai)與人機互動技術」,該引擎技術可同時理解文本、視覺圖像等多模態非結構化數據背後的深度語義,其中以「長文本的機器閱讀理解技術、自由跨域的多輪人機對話技術、對多種模態信息的語義理解技術」三大技術,搶佔了市場的先發優勢。
  • 深度學習 vs. 概率圖模型 vs. 邏輯學
    摘要:本文回顧過去50年人工智慧(AI)領域形成的三大範式:邏輯學、概率方法和深度學習。
  • 教育研究中的人類學範式
    它證明了人類學研究範式在教育研究領域中的合理性與現實性,又表明人類學核心問題與教育研究本質之間所具有的內在統一性。 關鍵詞: 作者簡介:   教育研究與人類學範式的結合最顯著的成就即教育人類學這門學科的產生,它證明了人類學研究範式在教育研究領域中的合理性與現實性,又表明人類學核心問題與教育研究本質之間所具有的內在統一性。