何愷明ECCV 2018教程:深度學習就是表示學習(41PPT)

2021-03-02 新智元

新智元AI WORLD 2018世界人工智慧峰會

倒計時4

新智元將於9月20日在北京國家會議中心舉辦AI WORLD 2018世界人工智慧峰會,計算機視覺領域先驅、約翰霍普金斯大學認知與計算機科學系教授Alan Yullie將親臨會場,發表主題演講《深度網絡及更多:大數據不是萬能的》。隨著計算機視覺技術的發展,如何利用小數據乃至無數據解決特定應用場景問題,將是最新的一個關鍵點,歡迎到現場交流!


 新智元推薦 

來源:kaiminghe.com

作者:何愷明

【新智元導讀】在今年ECCV 2018上,Facebook的何愷明做了一個題為「Learning Deep Representations for Visual Recognition」的講座。內容重點涵蓋ResNet/ResNeXt的細節結構以及一系列重要模型的回顧。何愷明與吳育昕合作的論文Group Normalization獲得今年ECCV最佳論文提名獎,在這個講座中也有提及。

深度學習即表示學習

機器學習任務的表示(原始)數據:

視覺:像素,.

語言:字母,.

語音:聲波,.

遊戲:狀態,.

表示學習:AlphaGo

Bad representations → 模型(神經網絡)→ good representations

神經網絡的進化

學習表示:通過反向傳播,端到端地學習

LeNet

AlexNet 

AlexNet 保留LeNet風格的骨架,再加上:

ReLU

Dropout

數據增強

VGG-16/19 

「非常深的網絡!」

初始化方法

歸一化前向/後向信號的分析公式

基於強假設(如高斯分布)

GoogLeNet / Inception

GoogLeNet有很多版本,但有3個主要屬性是不變的:

多個分支

短路連接(shortcut)

Bottleneck

批量歸一化(BN)

批量歸一化(BN)

Recap:標準化圖像輸入(LeCun等人1998提出的「Efficient Backprop」)

BN:data-driven的標準化,對每一層、每個mini-batch都是如此

ResNets

只是簡單地堆疊層嗎?

簡單地堆疊層的網絡(Plain nets)堆疊3x3的卷積層,堆到56層的時候比20層的時候訓練誤差和測試誤差都更高。

更深的模型不應該訓練誤差反而更高

通過改善結構的解決方案:

原始層:從已學習的淺層模型複製

額外層:設置為identity

至少保持訓練誤差相同

深度殘差學習

對於Plain net:

H(x) 是任何想要的映射,希望subnet符合H(x)

對於Residual net:

同樣,H(x) 是任何想要的映射,但我們希望subnet符合F(x),即

H(x) = F(x) + x

在這裡,F(x)是一個殘差映射,與它相關的是identity

在CIFAR-10數據集上的實驗

在ImageNet數據集上的實驗

計算機視覺任務之外,residual connections用於神經機器翻譯(NMT)

residual connections 用於語音合成(WaveNet)

AlphaGo Zero:使用了40個 Residual Blocks

ResNeXt:準確率更高,在各類競賽屢獲冠軍

更多架構:

Inception-ResNet [Szegedy et al 2017]

DenseNet [Huang et al CVPR 2017]

Xception [Chollet CVPR 2017]

MobileNets[Howard et al 2017]

ShuffleNet [Zhang et al 2017]

組規範化(GN)

總結

深度學習是表示學習

PPT下載地址:

http://kaiminghe.com/eccv18tutorial/eccv2018_tutorial_kaiminghe.pdf

新智元AI WORLD 2018世界人工智慧峰會

倒計時 

門票已開售!

新智元將於9月20日在北京國家會議中心舉辦AI WORLD 2018世界人工智慧峰會,邀請機器學習教父、CMU教授 Tom Mitchell,邁克思·泰格馬克,周志華,陶大程,陳怡然等AI領袖一起關注機器智能與人類命運。

大會官網:

http://www.aiworld2018.com/ 

相關焦點

  • Yoshua Bengio最新《深度學習》MLSS2020教程,附104頁PPT及視頻
    今年因新冠疫情在線舉行,從6月28號到7月10號講述了眾多機器學習主題。本文推薦來自深度學習大佬Yoshua Bengio教授講述《深度學習教程》,104頁ppt系統性講述了深度學習基礎知識和最新進展,非常乾貨。Yoshua BengioYoshua Bengio,蒙特婁大學教授。
  • ECCV 2018 德國慕尼黑召開,來份 tutorial 預熱 | ECCV 2018
    Tutorial 1 對抗性機器學習包括深度神經網絡在內的機器學習和數據驅動的人工智慧技術目前已經有諸多應用,涵蓋了從計算機視覺到網絡安全等諸多領域。在垃圾郵件和惡意軟體檢測在內的應用中,學習算法必須應對手段高超、適應性強的攻擊者,因為攻擊者可以操縱數據故意破壞學習過程。
  • 谷歌雲官方:一小時掌握深度學習和 TensorFlow(視頻+50PPT)
    材料有兩部分,是面向工程師的實用型講解,分別為只有 3 小時的忙人和只有 1 小時的超級忙人準備。新智元節選後者,讓你在 2017 春節來臨前,拿出 1 小時學會 TensorFlow 和深度學習。另外,視頻也方便已經是熟手的你複習,說不定還能從中得到新的啟示。
  • 何愷明團隊:從特徵金字塔網絡、Mask R-CNN到學習分割一切
    其中w,h分別表示寬度和高度。k是分配RoI的level。K0是w,h=224,224時映射的level。他們對每個模塊的工作進行消融實驗,以證實論文開頭的宣稱。pytorch-retinanet61Keras - https://github.com/fizyr/keras-retinanet61MXNet - https://github.com/unsky/RetinaNetMask R-CNN再次,Mask R-CNN也來自FAIR何愷明團隊
  • 700頁《圖形深度學習》教程「PPT」,限時免費領取!
    學習Pandas最好的方法就是看官方文檔:《10 Minutes to pandas》、《Pandas cookbook》、《Learn Pandas》英文版讀起來稍顯吃力,所以向大家推薦Pandas官方文檔中文版!書籍PDF電子書下載:《pandas官方文檔中文版》PDF已經打包好,可以通過下述步驟來獲取: 2.
  • ...復旦大學邱錫鵬老師】面向自然語言處理的深度學習基礎,199頁ppt
    》講座,總共199頁ppt,講述自然語言處理的理論與實踐,是非常好的學習資料。                                                    報告摘要:本報告主要介紹在自然語言處理中使得的深度學習基礎知識,具體內容分為兩部分:                                                    (1)理論部分:深度學習的基礎知識、主要模型(卷積神經網絡、循環神經網絡、注意力機制等
  • Keras 教程: Python 深度學習終極入門指南
    Keras 是我們推薦的 Python 深度學習庫, 尤其是對於初學者而言. 它很簡約, 模塊化的方法使建立並運行神經網絡變得輕巧. 你可以在這裡讀到更多關於 Keras 的內容:深度學習究竟是什麼?深度學習是指具有多隱層的神經網絡, 其可以學習輸入數據的抽象表示. 這個定義顯然太簡單了, 但對於現在的我們來說, 卻是最有實際意義的.
  • 深度學習導論 - 讀李宏毅《1天搞懂深度學習》
    深度學習的每一個核心概念在文中都有相關案例進行呈現,不誇張地說,這是我看過最系統,也最通俗易懂的,關於深度學習的文章。一天的時間搞懂深度學習?其實並不是沒有可能。原ppt網盤連結:https://pan.baidu.com/s/1kVy41wF 密碼:ra78李宏毅教授一天學會深度學習心得(ppt簡化版的講解,建議剛接觸的可以先看看這個視頻):廢話少說,先上乾貨,整個PPT的思維導圖如下:深度學習概論介紹深度學習作者非常淺顯的指出機器(深度)學習過程非常簡單,分為定義方法、判斷方法的優劣、
  • 2018年學術頂會:深度學習的江山如此多嬌
    深度學習領域會議ICLR 是深度學習領域的盛會,每年舉辦一次。2013 年,深度學習巨頭 Yoshua Bengio、Yann LeCun 主持舉辦了第一屆 ICLR 大會。經過幾年的發展,在深度學習火熱的今天,ICLR 已經成為人工智慧領域不可錯過的盛會之一。
  • 資源|李宏毅中文《機器學習/深度學習》2019上線(附ppt及視頻分享)
    吳恩達、李飛飛等大牛的機器學習、深度學習公開課都乾貨滿滿,惠及很多學者。他的研究方向主要是機器學習(深度學習)和語音識別。課程目錄和截圖回歸、梯度下降誤差來源、分類、邏輯回歸深度學習、反向傳播、異常檢測CNN、Keras、對抗性攻擊訓練深度模型、可解釋 AIRNN、Order LSTMEnsemble半監督式學習、遷移學習、終身學習元學習seq2seq、Transformer
  • MIT深度學習教程:一文看懂CNN、RNN等7種範例(TensorFlow教程)
    新智元報導  來源:medium作者:Lex Fridman  編輯:肖琴【新智元導讀】作為MIT的深度學習基礎系列課程的一部分,本文概述了7種架構範例的深度學習,每個範例都提供了TensorFlow教程的連結。
  • 百度發布《深度學習中文教程》!
    這次由多位百度大佬共同開發的——《深度學習中文教程》發布了,神器高層API會貫穿全程,分分鐘讓你技術提高好幾個level。同時開放了7天學習實踐活動,在7天中,你將直接跳過冗長的理論、懵bi~的調試,讓你掌握深度學習任務的通用套路,能夠獨立完成模型搭建、訓練及部署,能解決面試中最常被問到的深度學習任務,理論實戰雙豐收。
  • 李宏毅-《深度學習人類語言處理2020》中文視頻課程及ppt分享
    由國立臺灣大學李宏毅老師主講的純中文版,2020年深度學習與人類語言處理課程開課了,該課程主要講解深度學習技術在人類語言處理,比如語音識別、自然語言處理相關的知識。
  • 詳解何愷明團隊4篇大作 !(附代碼)| 從特徵金字塔網絡、Mask R-CNN到學習分割一切
    其中w,h分別表示寬度和高度。k是分配RoI的level。Kerashttps://github.com/fizyr/keras-retinanetMXNethttps://github.com/unsky/RetinaNetMask R-CNN再次,Mask R-CNN也來自FAIR
  • 深度學習預習資料:圖靈獎得主Yann LeCun《深度學習》春季課程
    幾年下來,我們積攢了成百上千的教程資料,從基本概念到深度解析,從語言到框架,從讀博到就業…… 既有理論,也有實戰;既有精華文章,也有視頻、教科書、筆記,全都收錄在這幾份教程盤點文章之中:2019:收藏、退出一氣呵成,2019 年機器之心乾貨教程都在這裡了2018
  • WSDM 2019教程—李航、何向南等,深度學習匹配在搜索和推薦中的應用
    過去傳統的匹配問題只要集中在人工定義特徵之上的關係學習,模型的效果很依賴特徵的設計。而深度學習的引入,能夠從大量數據中自動學習特徵表示,並且能夠更好的擬合複雜的交互關係。在WSDM 2019上來自中國人民大學的徐君研究員,中科大的何向南教授,以及今日頭條副總裁李航博士共同帶來深度學習匹配搜索和推薦深度學習匹配在搜索和推薦中這兩個任務中的應用。
  • 超全深度學習細粒度圖像分析:項目、綜述、教程一網打盡
    由於深度學習的蓬勃發展,近年來應用了深度學習的 FGIA 取得了顯著的進步。本文系統地對基於深度學習的 FGIA 技術進行了綜述。具體來說,本文將針對 FGIA 技術的研究分為三大類:細粒度圖像識別、細粒度圖像檢索和細粒度圖像生成。本文還討論了其他 FGIA 的重要問題,比如公開可用的基準數據集及其在相關領域的特定應用。本文在結尾處強調了未來仍需進一步探討的幾個方向以及待解決的問題。
  • 7種架構範例的深度學習,每個範例都提供了TensorFlow教程
    作為MIT的深度學習基礎系列課程的一部分,本文概述了7種架構範例的深度學習,每個範例都提供了TensorFlow教程的連結。 我們不久前介紹了 MIT 的深度學習基礎系列課程,由 MIT 學術研究員 Lex Fridman 開講,將介紹使用神經網絡解決計算機視覺、自然語言處理、遊戲、自動駕駛、機器人等領域問題的基礎知識。
  • 【乾貨】最新深度學習課程,多倫多大學「神經網絡與機器學習導論(2018年Spring)(附課件下載)
    【導讀】多倫多大學計算機系助理教授Roger Grosse 開設的《神經網絡與機器學習導論》課程涵蓋了從機器學習基礎知識到深度學習、強化學習等高階內容
  • 密西根大學-《深度學習與計算機視覺》課程視頻及ppt分享
    本課程深入探討了基於神經網絡的計算機視覺深度學習方法的細節。在本課程中,我們將介紹學習算法,神經網絡架構,學生將學習實現,訓練和調試自己的神經網絡,並獲得對計算機視覺前沿研究的詳細了解。 本書最新版pdf免費下載地址:個人主頁「私信」,回復關鍵字「ecv20」獲取下載地址。。