重磅乾貨 | 從連續的視角看機器學習

2021-01-21 數據科學人工智慧

本文於2020年發表於《中國科學:數學》雜誌。作者為鄂維南(普林斯頓大學、北京大數據研究院)、馬超(普林斯頓大學)和吳磊(普林斯頓大學)。英文論文PDF文件下載請在本公眾號回復關鍵詞「機器學習連續視角」。

摘要

在經典數值分析的影響下,我們提出了一個連續的機器學習形式,將其作為變分法和微分積分方程中的一個問題。我們證明了傳統的機器學習模型和算法,如隨機特徵模型、兩層神經網絡模型和殘差神經網絡模型,都可以表示成(以比例形式)對應連續形式的離散化的特例。我們還提供了從這種連續形式自然產生的新模型,例如基於流的隨機特徵模型,以及新算法,例如平滑粒子方法和譜方法。我們討論了如何在這個框架下研究泛化誤差和隱式正則化問題。

提綱 4.2 基於流模型的Pontryagin最大值原理討論

這裡提出的連續視角提供了一種更抽象的機器學習的思考方式。重點關注函數的表示、變分法問題和連續梯度流。特徵和神經元作為對象出現在這些連續問題的特殊離散化中。

我們從這個思考過程中至少學到了兩件事。一方面,我們可以不藉助神經元的概念來討論機器學習,實際上除了神經網絡模型之外,還有很多算法和模型。另一方面,我們也看到了為什麼神經網絡(淺層和深層)是不可避免的選擇:它們是最簡單的連續梯度流模型的最簡單粒子方法離散化(分別用於基於積分變換和基於流的表示)。

經典數值分析的一個主要主題是提出更好的模型和算法的設計原則。本著這種精神,我們可以為連續機器學習方法提出以下一組原則:

2.風險泛函應該是好泛函。即使不是凸的,它們也應該具有凸泛函的許多特徵。好的一點是,如果我們從連續模式開始,離散化模型很可能不會被離散效應導致的局部極小所困擾。3.不同的梯度流是很好的流,即相關範數應在流上變現良好。這裡相關範數指與特定表示相關的範數(例如,基於積分變換的表示的Barron範數)。

我們認為如果遵循這組設計原則,所得到的模型和算法將以一種相當健壯的方式運行,而當前的機器學習模型往往敏感地依賴於超參數的選擇。

當前機器學習算法中的一些微妙之處,僅僅是從一個連續的角度來看待就已經可以被理解了。例如,非常深的全連接網絡應該會引起問題,因為它們沒有很好的連續極限[35]。

英文論文PDF文件下載請在本公眾號回復關鍵詞「機器學習連續視角」。

Long-press QR code to transfer me a reward

創作不易 需要鼓勵

As required by Apple's new policy, the Reward feature has been disabled on Weixin for iOS. You can still reward an Official Account by transferring money via QR code.

相關焦點

  • 經典書《機器學習:概率視角》習題解答(中文),附1098頁pdf下載
    新智元報導 來源:專知 編輯:SF 【新智元導讀】自2012年發行以來就奉為經典機器學習書目
  • 機器學習之父Michael I. Jordan 親臨2018全球機器學習技術大會
    Jordan(麥可.喬丹)要來了,不是籃球界的飛人喬丹,是機器學習界的開山鼻祖、人工智慧領域根目錄的人物之一;是機器學習領域唯一一位獲得美國科學院、美國工程院、美國藝術與科學院三院院士成就的科學家;是伯克利大學的著名機器學習實驗室AMP Lab的聯席主任。
  • 實施二次混改、上海重磅發布乾貨超多的國改行動方案
    實施「二次混改」、新增10家科創板上市,上海重磅發布乾貨超多的國改行動方案,機構給出兩大標準挖出最受益標的A股市場每年必炒的國資改革題材新年伊始就迎來重磅消息。1月7日召開的上海推進實施國企改革三年行動新聞通氣會上公布,近期上海已研究制定了《上海市貫徹《國企改革三年行動方案(2020-2022年))的實施方案》。
  • 【乾貨】數據挖掘中算法學習的2條進擊路線
    儘管很多機器學習的書裡沒把它看做是一種機器學習算法(或許那些作者認為它應該是信號處理中的內容),但是它的確可以被看成是一種機器學習技術。《機器學習實踐》作者:Peter Harrington 英文版:4.《Artificial Intelligence : A Modern Approach(Third Edition)》作者:Stuart Russell、Peter Norvig5.
  • 乾貨|GMAT IR全知視角解讀
    AWA傳送: 乾貨 | GMAT AWA全知視角解讀另外,IR部分與傳統800分的算分機制不同,並不是自適應(CAT)模式,下一道題並不會因為你這一題的答題正確與否而改變,在開始答題之後題目是固定的。所以考生只要答對8道題,就可以獲得滿分。在這一部分,GMAT給了我們戰略性放棄的空間。
  • 萬字乾貨 | 一文助你了解機器學習
    本文將通過大量案例和通俗易懂的「人話」,講述機器學習建模邏輯和使用場景,讓非數據科學專業的職場人都可以快速了解機器學習是什麼,能做什麼,如何用!筆者有幸參與了一個機器學習建模實驗室項目,項目的本質是抽象機器學習建模流程,將機器學習建模過程組件化,通過在畫布上對組件(算子)靈活連接,讓非專家用戶(不會寫代碼,不熟悉算法模型和調參的產品經理,市場運營,行政財務等職場人)可以快速搭建機器學習模型,實現業務預測,極大降低機器學習應用門檻。
  • 機器學習中的忒修斯之船:那些「愚弄」專家的著名悖論
    機器學習模型中的著名悖論作為基於數據的任何知識構建形式,機器學習模型都不能排除認知悖論。恰恰相反,當機器學習試圖推斷隱藏在訓練數據集中的模式,並根據特定環境驗證其知識時,它們總是容易受到自相矛盾的結論的影響。
  • 「重磅」高考地理大氣環境專題必背乾貨全在這
    ②地形狀況(坡向、海拔高低、地形封閉狀況、山脈走向、地形區分布狀況地勢高,氣溫低;地形對冷空氣或者熱空氣的阻擋作用(要看地形走向與地勢的高低)——迎風坡氣溫低;背風坡盛行下沉氣流,氣溫升高(河谷地區易盛行下沉氣流)——焚風效應;封閉地形,冷空氣易聚集或者不容易散熱;陽坡、陰坡(同一山脈):陽坡氣溫大於陰坡。
  • 【乾貨】機器學習最常用優化之一——梯度下降優化算法綜述
    原標題:【乾貨】機器學習最常用優化之一——梯度下降優化算法綜述 1新智元獲授權轉載 【新智元導讀】梯度下降算法是機器學習中使用非常廣泛的優化算法,也是眾多機器學習算法中最常用的優化方法。幾乎當前每一個先進的(state-of-the-art)機器學習庫或者深度學習庫都會包括梯度下降算法的不同變種實現。
  • 從零開始的人工智慧和機器學習,該從哪裡入手呢?
    有些人看書學得更好,有些人則需要看視頻。比開始學習的方式更重要的是開始的理由。從動機開始。為什麼想學這些技能?是想賺錢嗎?是想構建什麼嗎?或是想要有所作為?沒有什麼特定的正確理由。所有的學習方式都有自己存在的理由與意義。從動機開始,是因為開始的理由比方式更重要。
  • 行上行下|2020年腦科學技術乾貨合集
    認知神經科學 | 腦電信號處理的機器學習6. 全腦神經網絡時間動態:腦電微狀態介紹7. 靜息態EEG微狀態:現狀及未來發展方向8. 穩態視覺誘發電位:社會情感神經科學9. 穩態視覺誘發電位 SSVEP 簡介10. 時間響應函數與刺激重構11. 腦網絡研究中的圖論指標詳解12.
  • 機器學習:Python中的四種機器學習技巧
    機器學習技術與算法眾所周知,機器學習是技術和算法的結合。但在開始關注技術和算法之前,讓我們看看它們是否是同一個東西。技術是解決問題的一種方法,這是一個非常通用的術語。 但是,當我們說我們有一個算法時,意思是我們有一個輸入,並希望從中得到一定的輸出,明確規定了實現目標的步驟。
  • 機器學習系列|從白富美相親看特徵預處理與選擇
    原標題:機器學習系列|從白富美相親看特徵預處理與選擇 作者授權轉載 作者:龍心塵&寒小陽 摘自:http://blog.csdn.net/longxinchen_ml
  • 換位思考;不同的視角看世界
    站在山頂和站在山下的兩個人,看彼此都是渺小的 !仔細品味,這話很有意思.....「橫看成嶺側成峰,遠近高低各不同;不識廬山真面目,只緣身在此山中」每一個視角都有一個真實的世界,人生就是在不同時空在無數的真實世界切換!(蛇看見的世界,和人類看見的世界。)只有上帝才能擁有「上帝視角」擁有完整的世界。
  • 重磅發布!亞馬遜機器學習服務Amazon SageMaker又添九項新功能
    機器學習是人工智慧的重要分支,機器學習從誕生之日起發展到今天已經走過了20多年的時間。如今,人工智慧和機器學習已經成為新一代信息技術的典型代表,一個好的算法模型的產生,離不開機器學習。作為機器學習領域的倡導者和領先企業,AWS曾於2017年11月推出Amazon SageMaker 機器學習平臺服務。
  • 資料| 機器學習中的數學
    以下書籍介紹來自豆瓣內容簡介 · · · · · ·《機器學習中的數學》是一本系統介紹機器學習中涉及的數學知識的入門圖書,本書從機器學習中的數學入門開始,以展示數學的友好性為原則,講述了機器學習中的一些常見的數學知識
  • 「重磅」高考地理地表形態的塑造專題必背答題模式全在這
    「重磅」高考地理地球上的水專題必背答題模式全在這「重磅」高考地理大氣環境專題必背乾貨全在這「重磅」高考地理交通專題必背乾貨全在這「重磅」高考地理工業專題必背乾貨全在這「重磅」高考地理農業專題必背乾貨全在這
  • 機器學習是什麼
    講解對象:機器學習是什麼作者:融水公子 rsgz對象:機器學習是什麼英文名:machine learning又稱:預測分析(predictive analytics)或統計學習(statistical learning)實質
  • 第一視角看月球
    嫦娥五號月球挖土【第一視角看月球!】12月2日下午,國家航天局公布了由嫦娥五號著陸器和上升器組合體著陸後全景相機環拍成像,腳下的月球一覽無餘。