深度學習和經驗主義的勝利

2020-11-26 CSDN技術社區

現在深度學習在許多監督式機器學習的任務中扮演著領頭羊的角色。也可以這樣認為,在近幾十年中,深度學習已經產生了最實用的非監督式機器學習算法。興奮之餘,這也引發了一系列的研究和聳人聽聞的新聞頭條。雖然我警惕這些炒作,但是我也發現了令人興奮的技術,並且最近加入了一個社團,針對回歸神經網絡序列學習發表了 一篇30頁的關鍵評語。


但很多機器學習研究者並不奉承深度。事實上,對於那些利用數學語言和理論保證來挽救人工智慧研究的人抗爭過的人而言,深度學習代表了一種時尚。更糟糕的是,對於一些人來說,它似乎是一種倒退。在這篇文章中,我會盡力對理論保證的有用性提供一個高層次的、公平的分析,並說明為什麼他們可能不總是像智力獎勵那樣實用。更重要的是,我將提供論據來解釋為什麼經過這麼多年越來越健全的統計學機器學習,對今天許多表現最好的算法並沒有理論保證。

要保證什麼?

保證是一個聲明,可以用數學確定其行為、性能或一個算法的複雜度。在其他條件不變的情況下,給定足夠的時間,我們的算法A可以從某種模型分類器{H1,H2,···}找到一個分類算法H,它的性能不比H*差,H*是這個類中最好的分類器。當然,這和一些固定的損失函數L有關。簡短來說,我們可能很樂意用一些常數來固定H與H*之間的性能差異或比例。缺少這樣一個絕對限制,我們可能會喜歡去證明,在固定的時間內,運行算法之後,H和H*能夠給出相近的結果。

許多現有的算法能夠提供強大的統計學保證。線性回歸會有一個確切的解決方案。邏輯回歸能夠保證收斂。通常情況下,深度學習算法不能夠提供什麼保證。給定一個任意壞的起點,我知道沒有理論能夠證明,經過SGD變種訓練的神經網絡一定會隨著時間推移優化而不會陷入局部最小。近期的工作表明,在神經網絡的誤差平面(一個m維平面,m是學習參數的個數,通常是節點邊緣之間的權重)上,鞍點的數目比局部最小值要多。然而,這不等於證明不存在局部最小或者它們不能任意壞。

保證中存在的問題

可證明的數學性質顯然是可取的。它們甚至已經拯救了機器學習,AI領域曾經一度被認為設計不明確,承諾過度,總在實施。然而,今天許多最好的算法並沒有提供任何保證。這怎麼可能呢?

  1. 保證通常與小類假設相關;
  2. 保證通常在最糟糕的情況下分析,但是最糟糕的情況在現實生活中很少見;
  3. 保證通常建立在錯誤的數據假設之上。

從弱者中選出優勝者

首先,對於某個給定的類,理論保證通常會確保一個假設會接近最佳假設。沒有辦法保證在給定的類中,一個假設能夠表現得令人滿意。

這裡有個棘手的例子:我希望有一個人來幫助我撰寫文檔。拼寫檢查會保證它將如何表現。它將100%識別某些拼寫錯誤。但是,現有的自動校對工具不能夠提供像智能人那樣的洞察力。當然,人不能給出任何形式的數學保證。人會睡覺,無視我的郵件,或者胡亂回應。然而人可以比工具助手表達更多有用的想法。具有諷刺意味的是,可能可以採取兩種方法來提高理論保證。一個是改進算法,另一個減少假設類的成員。而神經網絡很少提供保證,它們提供了比大多數更好理解的機器學習模型更豐富的潛在假設。啟發式學習技術和更強大的計算機已經排除了有效學習的障礙,很明顯,對於許多模型,為給出實用性的預測,這種增強的表現力是不可少的。

最壞的情況可能並不重要

保證通常是在最壞的情況下給定的。通過保證最佳係數ε得到結果,最壞的情況也不過於是保證一個普通的係數ε得到的結果。但是在實踐中,最壞的情況可能永遠不會發生。現實世界中的數據通常都是高度結構化的,並且最壞的情況可能具有這樣的結構,即在標準數據集和錯誤數據集之間沒有重疊。在這些假設中,最壞情況下的約束仍然成立,但這可能是所有算法都更好執行的情況。可能沒有理由相信,更壞情況下的算法能夠保證會有一個更好的典型性能。

不正確假設下的預測

理論合理的模型可能不能轉為真實性能的另一個原因是,生成理論結果而假設的數據通常都是假的。以潛在狄利克雷分布(LDA)為例,它是一個易於理解的非常有用的用於話題建模的算法。大量關於LDA的理論依據都是基於一篇文檔在主題上與分布相關這個假設之上。每個主題都依次與分布在詞彙表中所有單詞相關聯。生成過程如下,對於文檔中的每個字,文章主題根據每個主題的相對概率來隨機選擇。然後,以選中的主題為條件,從這篇文章的主題詞分布中選取一個詞語。反覆這個過程直到所有的詞都被選中。

顯然,這種假設在任何自然語言的數據集上並不成立。在實際的文檔中,單詞要從上下文中選取,而且很大程度上取決於它們所處的語境。此外文檔的長度不是任意的,儘管這種情況可能在本科課程中出現。然而,對於這樣的生成過程,LDA具有許多理論特性的優雅證明。

需要明確的是,LDA的確是一個用處廣泛、最先進的算法。而且,我相信,算法的性能理論研究,即使是基於不切實際的假設,仍然是提高我們對更一般和更強大定理做出理解和基礎工作不可或缺的步驟。在這篇文章中,我只思考眾多知名的理論,以及為數據科學工作者解釋關於為什麼具有良好理論性質的算法並不總是表現最好的。

經驗主義的勝利

有人可能會問,如果不是完全由理論引導,是什麼讓像深度學習這樣的方法流行?另外,為什麼由直覺判斷支撐的經驗方法會如此廣泛成功,即使在幾十年前他們並不受歡迎?

在回答這些問題上,我相信大量良好標記的數據的出現,比如ImageNet,是啟發式方法東山再起的原因。給定了足夠大的數據集,過度擬合的風險很低。此外,對測試數據的驗證提供了解決典型案例的手段,而不是著眼於最壞的情況。並行計算和存儲器大小的進步讓人們可以通過實證分析來同時跟蹤許多假設。由強大直覺判斷支撐的實證研究,在我們達到理解的極限時,為我們提供了前進的道路。

注意事項

對於在機器感知和自然語言領域深度學習所取得的成功,人們可以合理地認為,到目前為止,三個最有價值的機器學習算法是線性回歸、logistic回歸和K-均值聚類,它們在理論上都非常易於理解。而迄今為止,反駁經驗主義勝利的最合理的理由可能是,最好的算法是由理論驅動和限制的,而經驗主義則只是用於最新的突破,並不是最重要的。

有保證的事情很少

實現算法時,理論上的保證是很優美的。它們反應了清晰的思維,提供了對問題結構的深刻洞察。給定一個可工作的算法,理論解釋了其性能,加深理解,提供了進一步判斷的基礎。缺乏可工作的算法,理論提供了實現這個算法的思想。

不過,這種想法也有其美妙之處,搭配嚴謹的實證研究,有理有據的直覺判斷可以產生勝過更好理解模型的持續運作系統,有時在許多重要任務中,甚至超過人類。經驗主義為形式分析受到抑制的應用場合提供了前進的道路,並可能為將來可能最終承認深入理解理論知識打開了新的方向。

英文原文: Deep Learning and the Triumph of Empiricism(譯者/劉翔宇 審校/劉帝偉、朱正貴 責編/周建丁) 

關於譯者: 劉翔宇,中通軟開發工程師,關注機器學習、神經網絡、模式識別。


【預告】首屆中國人工智慧大會(CCAI 2015)將於7月26-27日在北京友誼賓館召開。機器學習與模式識別、大數據的機遇與挑戰、人工智慧與認知科學、智慧機器人四個主題專家雲集。人工智慧產品庫將同步上線,預約諮詢:QQ:1192936057。歡迎關注。

本文為CSDN編譯整理,未經允許不得轉載,如需轉載請聯繫market#csdn.net(#換成@)

相關焦點

  • 【NLP反思扛鼎之作】深度學習是經驗主義新高峰,不是理性主義終結
    原標題:【NLP反思扛鼎之作】深度學習是經驗主義新高峰,不是理性主義終結 新智元推薦 來源:立委NLP博客,公眾號洗腳池 AI 的發展中,理性主義和經驗主義此起彼伏,就像鐘擺的周期性回擺。目前已經偏離經驗主義太遠太高,但偏離越遠,將來回歸理性主義的速度就會越快。深度學習是經驗主義的一個新高峰,但它不會是理性主義的終結者。因為這是科學哲學高度的兩個基本的方法論,是貫穿人工智慧全部歷史的。
  • 經驗主義和理性主義
    這種認為感性經驗是知識的唯一來源、一切知識都通過感官經驗而獲得,並在其中得到驗證的學說,被稱為「經驗主義」。其實,經驗主義離我們並不遙遠,不僅如此,它還是我們所能體驗的最早的哲學流派。從我們小時候讀過的《伊索寓言》中《驢子過河》的故事開始,經驗將會陪伴我們走過人生的旅途。當然,經驗主義不是與生俱來的,而是一個逐漸積累的過程。
  • 經驗主義簡介
    還有一些理性主義者認為,許多知識是生而具有的;學習的實質,就在於通過理性能力對內部潛在的內容作出重新發現。他們指出,在這樣一個先驗的知識概念系統中,短促和隨機的臨時性經驗必然找不到它的位置。 一方面,理性主義者認為,知識僅僅存在於一個完美的獨立世界之中。
  • 自然語言處理的經驗主義和理性主義
    前不久,中國語言文字研究所研究員、計算語言學家馮志偉先生在接受中國社會科學院訪談時呼籲計算語言學的發展應將基於規則的理性主義和基於統計的經驗主義相結合。馮志偉先生在另一篇文章中對計算語言學/自然語言處理發展過程中的經驗主義和理性主義做了非常高屋建瓴的解讀和詳細深刻的闡釋,本文就對這篇文章進行梳理,回史望今,希望對理解當下自然語言處理的發展趨勢有所幫助。
  • 科學精神的緣起:經驗主義和理性主義
    他們喜歡向別的學者和別的學科學習,隨時準備修正自己的看法,如果實際情況和原本的理論不一樣,他們更願意懷疑理論錯了。▲ 科學方法可以分為兩個類型,「狐狸型」和「刺蝟型」,它們優劣互補  圖:Google經驗主義是狐狸🦊,理性主義是刺蝟🦔,經驗主義和理性主義都有自身存在的道理,它們各有各的法則,研究對象和哲學思考。
  • 觀點| Yoav與LeCun深度學習之爭後續:谷歌VP Fernando Pereira談...
    Goldberg 與 Yann LeCun 爭論,看當今的深度學習、NLP 與 arXiv 風氣》和《觀點 | Yoav Goldberg 撰文再回應 Yann LeCun:「深度學習這群人」不了解 NLP(附各方評論)》。
  • 深度學習筆記:深度學習——AlphaGo阿爾法狗
    它主要的原理就是深度學習。柯傑對戰AlphaGo圍棋界公認AlphaGo的棋力已經超過人類職業圍棋頂尖水平,AlphaGo的勝利是人工智慧歷史上的一座裡程碑。早在1997年,IBM的西洋棋系統深藍,擊敗了世界冠軍卡斯帕羅夫時,採用的算法是通過暴力搜索的方式嘗試更多的下棋方法從而戰勝人類,其所依賴的更多是計算機的計算資源優勢。
  • 經驗主義與理性主義
    我們應該用好兩把武器,經驗主義與理性主義。      牛頓的機械宇宙,讓人類從懵懂中甦醒過來,發現自己通過邏輯推演竟然可以解釋大多數事物的運動原理,讓人類沾沾自喜以為自己可以絕對準確的預測未來,於是有的人會傾向於理性主義,以為理性主義可以解決一切問題。
  • 法律經驗主義
    法律經驗主義   馬國川:「文革」結束,也標誌著法律虛無主義的終結,至少是在國家層面上已經認識到,沒有法律是不行的。   江平:從改革開放開始,我國的法治進入了法律經驗主義階段。法律經驗主義之所以出現,有很深刻的歷史背景。鄧小平同志提出來「摸著石頭過河」,曾經受到一些人的讚揚,也有一些人稱之為經驗主義。
  • 中共執政初期反經驗主義鬥爭歷史考察與反思
    在此體系裡,圍繞鞏固政權這個根本問題,中共對其執政任務、活動方式和加強自身建設問題進行審慎分析和高度概括,形成統一、凝練且邏輯嚴密的用語範式。經驗主義概念在中共舊有革命話語體系中已存在,借指幾乎所有被定性為因循守舊式的革命主張和活動方式。但在中共實際革命活動中,教條主義問題才是反對的重點。
  • 「徹底經驗主義」不徹底
    詹姆士繼承皮爾士的主觀經驗主義,參考柏格森生命哲學的論證思路,結合德國意志主義哲學和心理學,提出了「徹底經驗主義」的概念。徹底經驗主義意欲徹底打破笛卡爾、休謨和康德的二元論框架,實現一種徹徹底底的一元論哲學。然而,由於徹底經驗主義理論體系本身所固有的缺陷,這種試圖超越傳統理性主義和經驗主義的方法論努力並不成功,徹底經驗主義並不徹底。
  • 動漫考研之「經驗主義錯誤」
    動漫考研之「經驗主義錯誤」2020年真的磨人的大妖怪疫情不多說單是動漫專業考研的各大高校整體變動,就很讓人頭痛.就目前的情況來看。2.理論的學習上,不管哪個學校,前期建議以歷史類科目書,和動畫學為主。等出大綱再針對性複習。3.繪畫上,以基礎訓練和即興抗壓創作為主要訓練方向。切勿迷信某一類題型。隨機應變的臨場快速反應最為重要。切勿過於依賴往期考上的學姐學長畫的所謂的「重點」。切勿犯經驗主義錯誤。
  • 經驗主義的教育可以毀掉一個時代
    教育脫離了生活而存在,也就失去了它的初心和本質。法乎自然,就此而言,人類當前的教育尚不如自然界的動物。動物界的學習完全就是生存的一部分,或者說教育本身就是一種生存方式。人類的大腦發達起來,那些生存的技巧經驗化,人類的教育也就開始遠離生活。對中國來講,尤其如此。
  • 經驗主義與理性主義之概念辨析
    但早期的經驗主義哲學家,比如洛克,一方面其認識論屬於經驗主義的理路,而另一方面在上帝的問題上,其論證方式卻依然是學理性主義的方法來論證,卻放棄了自己主張的經驗主義…這不能不說是傳統習俗對他的影響,實在太大了。不過,自休謨尤其是康德之後,歷史進入19世紀之後,因為經驗主義的巨大影響力,那些出身基督教的哲學家與科學家們認識到,上帝只能屬於信仰,而不是事實。
  • 論西方哲學「經驗主義」
    個人理解的經驗主義,分析,概括如下。經驗主義認為世界不可認知,即使能認知也是相對的認知,建立在我們的實踐範圍內的認知,實踐越深,認知是相對越深,即使你認知深了,最後也要靠實踐去檢驗,跟我國文革結束,改革開放時所提的,實踐是檢驗真理的唯一標準一樣,只不過,這裡是建立在馬克思主義哲學上的,馬克思主義哲學認為世界是可以提前認知,不管是物質世界,還是人的精神世界,還是人類社會,都可以用馬克思主義哲學的原理去演繹認知的
  • 大數據: 一種新經驗主義方法
    當今世界,「大數據」已成為一個熱點話題,學術界和產業界都試圖在該領域取得突破。何為大數據?這是在充分收集、整理和分析歷史經驗數據的基礎上,運用已有經驗對新事物進行判斷與預測的新興思維和方法。
  • 學會用唯物辯證法分析問題 ——重溫毛澤東《學習和時局》
    陳毅讀完《學習和時局》後深刻剖析自己:「我個人說來多年含茹於經驗主義的原野之上,今後多從打開腦筋重新認識自己去著手,由己及人,變更過去及人而不由己的辦法。」當工作已經取得成績、處於進步狀態的時候,要善於發現工作中的不足之處;當事業不斷取得勝利、正在上升發展的時候,要能夠發現面對的新情況新問題新挑戰,以爭取新的勝利。
  • 東莞時報:經驗主義害死人
    廣東與八一的第一場季後賽結束後,和一位前輩聊天。他說,以廣東東莞銀行目前的狀態,「回到寧波,也是20分的差距。」我相信他一定看了昨晚的這場比賽,我也相信,他會為八一的表現大吃一驚。
  • 深度學習 vs. 概率圖模型 vs. 邏輯學
    【編者按】在上個月發表博客文章《深度學習 vs. 機器學習 vs. 模式識別》之後,CMU博士、MIT博士後及vision.ai聯合創始人Tomasz Malisiewicz這一次帶領我們回顧50年來人工智慧領域三大範式(邏輯學、概率方法和深度學習)的演變歷程。通過本文我們能夠更深入地理解人工智慧和深度學習的現狀與未來。
  • 純粹經驗主義導致迷信
    純粹經驗主義導致迷信 2017年07月25日 09:19 來源:中國社會科學網-中國社會科學報 作者:曾傳輝 字號 內容摘要:當今時代,宗教神學為自己辯護的基本方法不外乎唯心主義和形上學