深度學習的光環背後,都有哪些機器學習的新進展被忽視了?

2020-12-15 雷鋒網

雷鋒網 AI 科技評論按:從神經網絡被學術界排擠,到計算機科學界三句話不離人工智慧、各種建模和預測任務被深度學習大包大攬,只不過短短十年時間。這十年裡我們目睹了 dropout、SGD+動量、殘差連接、預訓練等等深度學習技術的大爆發,見證了學術研究全面擁抱深度學習,也聽到了對深度學習不足之處的質疑之聲、感受到了很多人對非深度學習方法「復興」的期盼。

reddit 上近期就出現了一個帖子,把網友們聚起來聊聊除了神經網絡之外的機器學習方法的新發展,以及可以和各種模型配合、不僅限於改善神經網絡的概念和模型。也許這些現在並不熱門的研究裡就埋下了下一次機器學習革命的種子,就像十年前研究神經網絡的學者們在冷落中迎來了革命的黎明一樣。

下面雷鋒網 AI 科技評論整理了一些言之有物的網友回答。

高斯過程 Gaussian Processes

高斯過程並不是近期新發明的技術,但它近幾年有重大發展,尤其是在技術的實現和拓展性方面。相比於神經網絡,高斯過程的特點在於:

高斯過程的研究裡也融入了許多有價值的數學發現,涉及線性代數、概率、諧波分析等等。GPytorch 是一個了解高斯過程領域最優秀模型的好去處。

高斯過程的主要不足在計算方面,訓練和推理過程中一般都需要計算行列式和軌跡,或者從很大的矩陣中解算系統,存儲空間的需求按列長度的平方增長,而計算的時間複雜度為 O(n^3)。近幾年的進展也主要來自於更高效的算法或者近似計算方法(比如 KISS-GP、SKI、LOVE 等等)

基因算法&演化策略 Genetic Algorithms & Evolution Strategies

離散演化訓練是用基因算法配置網絡結構,然後讓得到的模型學習。它的一個動機來自於,在複雜環境中為稀疏的回報歸因是非常困難的,所以不如完全拋棄梯度,轉而採用計算更高效的演化策略,反倒可以在模型設計和參數搜索方面獲得更大的靈活度、取得更好的結果。其中採用的和大自然中的生物演化類似的「隨機突變+方向性選擇」的做法也規避了當前的強化學習中的一些問題。

谷歌大腦的研究員 David Ha 在這個領域做了許多研究,他也撰寫了易懂的介紹博客、配上了生動有趣的動圖,可以點擊 這裡 詳細閱讀。

因果推理 Causal Inference

Judea Pearl 是這條路線的代表人物,Yoshua Bengio 等學者也加入了探索當中,並且在想辦法把它和現代機器學習結合到一起。提到這個方向的這位網友表示,他的一位做數據科學的好朋友的工作內容裡就已經越來越多地涉及到因果推理,而且他認為因果推理帶來的革命在日後看來可能會比深度學習革命的影響更為深遠。接著他做了詳細的解釋:

首先要知道的是貝葉斯網絡。1980 年代的時候,Judea Pearl 正在探索各種能對人工智慧領域的發展起到幫助的路線,貝葉斯網絡的發明就有一部分功勞是他的。但是貝葉斯網絡也有一些限制,它能在低維空間高效地捕捉聯合概率分布,但是說到底它也只能回答一些可觀測的問題。比如,給定了一些消費者的屬性,基於其它消費者的行為,預測這些消費者在未來六個月內不再繼續使用某個服務的概率。

但值得研究的問題還有很多。理想情況下,如果你要採取一些行動幹預某個系統,你會希望能夠了解系統會發生哪些變化(由於行動幹預)。沿著剛才消費者的例子說,如果把他們加入一個為了提高顧客忠實度和互動程度而設計的自動發送促銷郵件的清單裡,他們不再繼續使用服務的概率會如何變化?這時候你需要思考的就是,給定了已知的消費者信息,也指定了要不要用某種方式幹預之後,得到的結果會如何變化。這是因果關係運動的一個方面,目前看來 Rubin 和 Imbens 是這一方面的權威人物。詳細了解可以參考這篇文獻綜述 http://proceedings.mlr.press/v67/gutierrez17a.html 。

另一方面,你相當於在估計這個量 E[Y|X, do(T)],這裡的 Y 是得到的結果、X 是觀察到的條件、T 是你要採取的措施。有沒有更通用的理解因果關係的方式呢?我很欣賞 Pearl 的分解方式,他展示了超越貝葉斯網絡之外的處理方式,而且可以把過程表示為一個因果圖模型。他的思路是,圖模型裡的箭頭方向可以編碼因果關係的方向,而幹擾某個系統就可以看作是破壞圖裡的幾個邊。 繼續消費者的例子,也許你手裡有一些曾經收到促銷郵件的消費者的數據,但他們的情況不一樣,你想知道其它情況的消費者看到促銷郵件以後的反應如何;而且,你手裡現有的數據肯定不是雙盲的(因為是發現消費者有不再使用的意向之後才給他們發送促銷郵件)。所以,本來會根據客戶表現出的某些信號來決定是否給他們發送促銷郵件,但真的發了以後又會干擾這些信號;而且,對於不同來源的用戶,引發「要發送郵件」決定的具體信號又會各自不同…… 所以要怎麼辦呢?在圖上做這些分析計算就可以幫助回答這些問題,或者,最起碼也可以知道哪些問題是可以回答的、哪些是回答不了的,以及想要回答現在回答不了的問題的話還需要哪些信息。

Judea Pearl 在 2017 年寫的《Book of Why》是一本非常棒的入門書籍,這個領域的每個研究者都應該讀一讀這本書,它很容易讀懂,只不過對於喜歡聽音頻書的人來說,裡面談圖元素的部分還是最好用看的。如果你想做更深入的研究,Pearl 2009 年的學術專著《Causality》數學性更強,也更嚴謹,不過書裡的習題和例子都很少,所以想要理解裡面的所有內容還很需要花一些功夫。

《A Meta-Transfer Objective for Learning to Disentangle Causal Mechanisms》(https://arxiv.org/abs/1901.10912)論文講解了因果推理和深度學習之間的聯繫,最起碼也要讀讀開頭的幾小節。更大更全的綜述可以讀讀 Pearl 的《Theoretical Impediments to Machine Learning With Seven Sparks from the Causal Revolution》(https://arxiv.org/abs/1801.04016),不過它實際涵蓋的內容和《Book of Why》有很多重合,先讀讀這篇論文再決定要不要買書來讀也挺好的。

反向強化學習 Inverse Reinforcement Learning

反向強化學習採用了和傳統強化學習相同的基礎設定,然後做相反的事。在強化學習裡,給定一個回報函數,讓模型找到會得到最大回報的策略;在反向強化學習裡,給定一個策略,然後模型找到可以被這個策略最大化的回報函數。

它的關鍵在於從對行為的觀察中學習,即便你可能無法訪問回報函數,或者無法模仿特定的執行器的行為。反向強化學習已經成功訓練出了和人的行為很類似的玩第一人稱射擊遊戲的 AI。

反向強化學習中有一個重大的開放問題是如何從並非最優的演示中學習。目前的系統能很好地模仿人類,以至於它們體現出的失效模式也和人類相似。想要從人類身上學習,但是得到比人類更高的表現,理論上看起來是可行的,但做起來非常困難。近期的文獻綜述可以參考 https://arxiv.org/abs/1806.06877。

自動機器學習 AutoML

這個自領域很重要,也很酷。可以把它看做一個決策樹,在給定數據集以後幫你決定什麼樣的數據處理流水線是最好的。它很有用,也會在整個機器學習領域中佔據更多位置。谷歌目前就已經面向商業用戶提供 AutoML 服務,不過顯然這是面向自己沒有編程能力的客戶的。

目前最熱門的自動機器學習算法是 Auto-sklearn(https://automl.github.io/auto-sklearn/master/  ),還有基於它進一步改進的 Mosaic。AutoML 也有一些比賽,排名前幾的算法都有很高的參考價值。


除了上面這些之外,網友們還提到了最優傳輸理論 Optimal Transport Theory、符號回歸 Symbolic Regression、脈衝神經網絡 Spiking neural networks、隨機優化 Stochastic optimization,還有一些從生物學中得到啟發的方法等等。如果你也知道一些有趣的、近幾年有重大進展的機器學習方法,歡迎留言和我們討論。

via reddit.com/r/MachineLearning,雷鋒網(公眾號:雷鋒網) AI 科技評論整理編譯

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 強化學習/機器學習/深度學習三者有何區別?
    打開APP 強化學習/機器學習/深度學習三者有何區別? 2013年,DeepMind發明了DQN算法,成功將深度學習和強化學習結合起來,開啟了深度強化學習的新紀元。此後數年,強化學習的成果日新月異,很多非常困難的問題都被深度強化學習算法解決。 2016年,谷歌阿爾法圍棋以4:1戰勝圍棋世界冠軍、職業九段棋手李世石,不僅讓深度學習為人們所知,而且掀起了人工智慧的「大眾熱」,大家由此更加關注強化學習這一技術要點。
  • 多媒體領域中,深度學習有何進展?
    近日,「雲上沙湖」雲課堂邀請復旦大學計算機科學技術學院教授、博士生導師金城進行了線上直播,就「深度學習在多媒體領域的最新進展」這一主題做出分享。 01 什麼是深度學習 人工智慧在近幾年非常熱門, AlphaGo事件,不僅給中國大眾普及了人工智慧的最新進展,而且也讓更多的人開始關注人工智慧的發展。
  • 深度學習和機器學習的線性代數入門
    Euclidean範數ML中的正則化Lasso嶺特徵選擇與抽取協方差矩陣特徵值與特徵向量正交性正交集擴張空間基主成分分析(PCA)矩陣分解總結引言機器學習和深度學習建立在數學原理和概念之上,因此神經元是深度學習的基本單位,該結構完全基於數學概念,即輸入和權重的乘積和。至於Sigmoid,ReLU等等激活函數也依賴於數學原理。
  • 無人駕駛,深度學習和機器學習最強科普(三),特徵提取
    機器學習和深度學習是人工智慧領域最先進的技術,代表了當今人工智慧的發展方向,它們已經廣泛地應用在了無人駕駛領域。汽車人參考用四篇文章,介紹機器學習和深度學習,以及它們在無人駕駛領域的應用,本文為第三篇文章,主要介紹機器學習和深度學習的區別。
  • 深度學習面試寶典(含數學,機器學習,深度學習,計算機視覺等)
    深度學習面試寶典這是一個在 github 上開源的 深度學習面試寶典,收集和整理了很多相關的知識。相關收集內容 自我介紹 數學 機器學習 深度學習 強化學習 計算機視覺 傳統圖像處理 自然語言處理 SLAM 推薦算法 數據結構與算法 程式語言 深度學習框架 面試經驗 面試技巧 其它深度學習001 神經網絡中的Epoch、Iteration、Batchsize神經網絡中epoch與iteration是不相等的batchsize:
  • 全面回顧2020年圖機器學習進展,12位大神論道、寄望2021年大爆發!
    作者 |Michael Bronstein編譯 | Mr.Bear編輯 | 陳大鑫 圖機器學習在 2020 年大放異彩,各種新理論和新應用精彩紛呈。目前,我們還不確定下一代圖機器學習算法應該是怎樣的,但是我們相信該領域的進步有賴於大家擺脫在 2020 年及以前佔據主導地位的消息傳遞機制。在 2021 年,我們希望圖機器學習技術能夠走進更具影響力和挑戰性的應用領域。近年來,有太多研究工作都著眼於簡單、同質化的節點分類任務。
  • 談談機器學習的趨勢 - 新三大學習範式
    引 言機器學習/深度學習是一個廣闊的研究領域,說來並不年輕,但又朝氣蓬勃,似乎每天都在湧現大量的新方法和新技術。一般來說,傳統的機器學習可以分為三個基本學習範式,即監督學習、無監督學習以及強化學習。
  • 「深度學習」已經接近終點?下一代機器學習將會怎樣?|極客雲算
    林宙辰:深度學習、機器學習已經很少聽到有突破性的進展了。去年三大巨頭獲得圖靈獎,馬上有人跳出來說「某個領域獲得圖靈獎就表明這個領域已經走到盡頭了」;我們也體會到近一兩年來,深度學習重大進展好像就沒有了,大家只能想方設法去充分利用算力。因此,我和許多做機器學習的學者都在想一件事情:機器學習下一步應該是什麼樣子?
  • 機器學習模型部署都有哪些坑?劍橋研究者梳理了99篇相關研究
    高質量工具對於任何類型的數據分析都至關重要,其中數據剖析(data profiling)的可視化是極具挑戰性的。模型學習近年來,機器學習方法的研究傾向於在模型學習階段更好地選擇和使用各種模型和方法。六年來,機器學習頂會 NeurIPS 的論文提交量翻了兩番,從 2014 年的 1678 篇到 2019 年的 6743 篇。
  • 2020年深度學習發展大盤點及對2021年深度學習的未來展望|極客雲算
    深度學習框架作為AI底層工具,對個人而言是進入深度學習世界的一把鑰匙,掌握深度學習框架並不等於理解了深度學習,要在AI開發中有所作為,關鍵還是要真正理解框架背後的技術、實踐和生態。隨著近年來的人工智慧發展,2020年深度學習依然是發展最快的領域之一,直奔未來工作。其發展是多方面的,而且是多方位的。
  • 機器學習吧面向ai的中文機器學習資源與分享平臺
    如果你對這個感興趣的話至少學習如何抓取的知識。機器學習吧,機器學習吧-面向ai的中文機器學習資源與分享平臺。裡面涵蓋了比較新的機器學習算法,可以看看。當然這僅僅是入門級的機器學習算法,下面會引入深度學習算法的文章。並且機器學習算法的理論比深度學習算法更加複雜,這裡有深度學習算法的專題篇。不管從什麼角度看,機器學習都是一個非常好的方向,希望你對機器學習有更多的了解。
  • 重中之重:數據科學與機器學習背後的數學理論
    有了這些包,任何人都可以構建模型或者生成數據可視化。然而,想要微調模型,使之能產生具有最佳性能的可靠模型,確實需要非常紮實的數學基礎知識。建立模型是一回事,但是解釋模型,並且總結出有意義的,且可用於數據驅動的決策制定的結論是另一回事。
  • 在深度學習頂會ICLR 2020上,Transformer模型有什麼新進展?
    大數據文摘出品來源:medium編譯:一一、AndyICLR是機器學習社群最喜愛的會議平臺之一。如今,機器學習領域的會議已成為預印本裡論文質量的標誌和焦點。但即使這樣,論文的發表數量還是越來越龐大,這使得緊跟最新進展變得困難。在Zeta Alpha,我們會密切關注自然語言處理(NLP)和信息檢索(IR)領域研究的最新進展。
  • AI學習筆記:人工智慧與機器學習概述 - 計算機java編程
    常見的算法:傳統的機器學習又分為有監督學習和非監督學習,有監督學習:有feture和label;業務系統提供的數據源知道原因又知道結果,根據原因找結果,此時稱之為有監督的學習,數據與目標:有哪些數據?想做什麼?之前是怎麼做的?之前結果有什麼不滿意?做法與思路:能不能用機器學習方法來做?如何轉換為機器學習問題以及優先級?應用於評估:訓練出來的模型怎麼用?期望達到什麼樣的效果(業務角度的效果)?
  • Facebook 爆錘深度度量學習:該領域13年來並無進展!網友:滄海橫流...
    也就是說:新出的ArcFace, SoftTriple, CosFace 等十種算法與十三年前的依賴成對或成三元組的損失函數並沒有本質上的區別。FB和康奈爾科技此論無疑是對深度度量學習過去十三年研究成果蓋棺定論,斬釘截鐵表示,雖然深度度量學習非常重要,但是學界這些年一直在灌水。損失函數對度量學習很重要
  • 這五個數據科學家和機器學習工程師油管博主,你必須關注
    這個頻道的視頻內容是萊克斯·弗裡德曼本人與電腦運算、機器學習、深度學習、人工智慧等領域的先驅或頂尖研究人員進行的簡單對話。推薦這個頻道的主要原因是,萊克斯·弗裡德曼曾與機器學習和深度學習領域的先驅進行過交流。大多數深度學習從業者多多少少會熟悉一些下列的深度學習先驅。
  • 大會直擊|微軟亞洲研究院劉鐵巖:深度學習成功的秘密
    劉博士的研究興趣包括:人工智慧、機器學習、信息檢索、數據挖掘等。他的先鋒性工作促進了機器學習與信息檢索之間的融合,被國際學術界公認為「排序學習」領域的代表人物,他在該領域的學術論文已被引用近萬次。近年來,劉博士在博弈機器學習、深度學習、分布式機器學習等方面也頗有建樹,他的研究工作多次獲得最佳論文獎、最高引用論文獎、研究突破獎,並被廣泛應用在微軟的產品和在線服務中。
  • 龍池生物:深度學習的幾個主要模型
    深度學習的幾個主要模型RNN循環神經網絡主要用於語音識別和自然語言處理等,CNN卷積神經網絡圖像識別為主,DBN深度信念網絡做回歸分析為主,至於神經網絡的各種變體,也都有著局限的領域,比如強化學習目前只能運用並長期只能運用於信息對稱的環境狀態下的學習。
  • 普林、DeepMind新研究:結合深度學習和符號回歸,從深度模型中看見...
    符號模型緊湊,具備可解釋性和良好的泛化能力,但很難處理高維機器學習問題;深度模型擅長在高維空間中學習,但泛化性和可解釋性卻很差。那麼有沒有什麼辦法可以取二者之所長呢?這項研究做到了。如何將深度模型轉換為符號方程?來自普林斯頓、DeepMind 等機構的研究人員提出了一種解決方案:結合深度學習和符號回歸實現這一目標。
  • 機器學習會取代數學建模嗎?讓我們假設一個微積分落後但深度學習...
    對於那些擅長於用微分方程、概率論解決問題的數學家們來說,素有「黑盒子」之稱機器學習往往是要被踢到鄙視鏈底端的。  但是,在與各行各業中,絕大多數公司(小到初創公司,大到國際巨鱷)都在尋求運用機器學習的方法。隨著企業不斷地將機器學習融入其文化與組織中,這事也變得越來越普遍。  有意思的是,在本科和碩士教育中,數學專業內部居然也都瀰漫起了機器學習的熱潮。