吳恩達 NIPS 2016:利用深度學習開發人工智慧應用的基本要點(含...

2021-01-10 雷鋒網

雷鋒網按:為了方便讀者學習和收藏,雷鋒網(公眾號:雷鋒網)特地把吳恩達教授在NIPS 2016大會中的PPT做為中文版,由三川和亞峰聯合編譯並製作。

今日,在第 30 屆神經信息處理系統大會(NIPS 2016)中,百度首席科學家吳恩達教授發表演講:《利用深度學習開發人工智慧應用的基本要點(Nuts and Bolts of Building Applications using Deep Learning)》。

此外,吳恩達教授曾在今年 9 月 24/25 日也發表過同為《Nuts and Bolts of Applying Deep Learning》的演講(1小時20分鐘),以下是 YouTube 連結:

https://www.youtube.com/watch?v=F1ka6a13S9I

一、深度學習為何崛起

吳恩達在開場提到:深度學習為何這麼火?

答案很簡單:

第一是因為規模正在推動深度學習的進步。

從傳統算法到小型神經網絡、中型神經網絡最後演化為現在的大型神經網絡。


第二:端到端學習的崛起

從下圖中的上半部分可以看出,傳統端到端學習是把實體數據表達成數字數據,輸出數字值作為結果。如退昂識別最後以整數標籤輸出為結果。

現在的端對端學習更為直接純粹,如機器翻譯:輸入英語文本,輸出法語文本;語音識別:輸入音頻,輸出文本。但端對端學習需要大量的訓練集。

吳恩達先講述了常見的深度學習模型,然後再著分析端到端學習的具體應用。

二、主要的深度學習模型

普通神經網絡

順序模型   (1D  順序)  RNN,  GRU,  LSTM,  CTC,  注意力模型

圖像模型  2D 和  3D 卷積神經網絡

先進/未來 技術:無監督學習(稀疏編碼 ICA,  SFA,)增強學習

三、端到端學習應用案例

傳統模型:語音→運算特徵—(人工設計的 MFCC 特徵)→音素識別器—(音素識別)→最終識別器→輸出。

端到端學習:音頻→學習算法→轉錄結果;在給定了足夠的有標註數據(音頻、轉錄結果)時,這種方法的效果會很好。

傳統模型:攝像頭圖像→檢測汽車+檢測行人→路徑規劃→方向控制。

端到端學習:攝像頭圖像→學習算法→方向控制。

自動駕駛對安全有極高要求,因此需要極高的精確度。採取純粹的端到端學習十分有挑戰性。只在有足夠(x,y)的數據,來學習足夠複雜的函數的情況下,端到端學習才有效果。

四、機器學習策略

你經常有很多改進 AI 系統的主意,應該怎麼做?好的戰略能避免浪費數月精力做無用的事。

以語音識別為例,可以把原語音數據分割成:

這裡面普及幾個概念:

人類水平的誤差與訓練集的誤差之間的差距是可避免的偏差,這部分誤差可以通過進一步的學習/模型調整優化來避免。

訓練集和開發集之間的差距稱為方差,其因為跑了不同的數據從而導致誤差率變化。

上述兩種偏差合在一起,就是偏差-方差權衡(bias-variance trade-off)。

自動數據合成示例不同訓練、測試集的分布

假設你想要為一個汽車後視鏡產品,開發語音識別系統。你有 5000 小時的普通語音數據,還有 10 小時的車內數據。你怎麼對數據分組呢?這是一個不恰當的方式:

更好的方式:讓開發和測試集來自同樣的分配機制。

五、機器學習新方案

當機器學習在處理某項任務上比人類表現還差時,你經常會看到最快的進步。

機器學習超越人後,很快就會靠近貝葉斯最優誤差線。

可以依靠人類的直覺:(i)人類提供加標籤的數據。(ii)進行錯誤分析,來理解人是怎麼對樣本正確處理的(iii)預估偏差/方差。比如,一項圖像識別任務的訓練誤差 8%, 開發誤差 10%,你應該怎麼處理?

六、人工智慧產品管理

新的監督DL算法的存在,意味著對使用 DL開發應用的團隊合作,我們在重新思考工作流程。產品經理能幫助 AI 團隊,優先進行最出成果的機器學習任務。比如,對於汽車噪音、咖啡館的談話聲、低帶寬音頻、帶口音的語音,你是應該提高語音效果呢,還是改善延遲,縮小二進位,還是做別的什麼?

今天的人工智慧能做什麼呢?這裡給產品經理一些啟發:

如果一個普通人完成一項智力任務只需不到一秒的思考時間,我們很可能現在,或者不遠的將來,用 AI 把該任務自動化。

對於我們觀察到的具體的、重複性的事件(比如用戶點擊廣告;快遞花費的時間),我們可以合理地預測下一個事件的結果(用戶是否點擊下一個此類廣告)。

七、吳恩達新書推薦


雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 吳恩達NIPS2016:利用深度學習開發人工智慧應用的基本要點含唯一的...
    雷鋒網按:為了方便讀者學習和收藏,雷鋒網特地把吳恩達教授在NIPS 2016大會中的PPT做為中文版,由三川和亞峰聯合編譯並製作。今日,在第 30 屆神經信息處理系統大會(NIPS 2016)中,百度首席科學家吳恩達教授發表演講:《利用深度學習開發人工智慧應用的基本要點(Nuts and Bolts of Building Applications using Deep Learning)》。
  • NIPS 2016精華大盤點丨吳恩達、LeCun等大師的論文、PPT都在這兒...
    關注微信公眾帳號【AI科技評論】,在微信公眾號後臺回復關鍵詞「大神」,獲取PPT。吳恩達昨日在吳恩達教授在 NIPS 上發表演講:《利用深度學習開發人工智慧應用的基本要點(Nuts and Bolts of Building Applications using Deep Learning)》。
  • 吳恩達授課,斯坦福CS230深度學習課程資源開放
    機器之心整理參與:劉曉坤、雪、思源近日由吳恩達與 Kian Katanforoosh 指導的 CS230(深度學習)課程已經結束並放出了課程資料。這一門課程結合 Coursera 課外教學與課內教學展示了深度學習的基本概念與完整結構,機器之心簡要介紹了該課程及基本內容。
  • 吳恩達的課上完了?如何科學開啟你的深度學習論文閱讀生涯
    谷歌大腦創始人之一、百度人工智慧小組前負責人吳恩達(Andrew Ng)如是說:任何人都有資格。當你上過一些機器學習相關的課程後,想要更進一步時,可以閱讀一些研究論文。最好能做到重現論文中的方法,得到相似的結果。OpenAI研究者達裡奧·阿莫迪(Dario Amodei)對這個問題的回答是:「為了驗證你是否適合在人工智慧安全或者機器學習領域工作,請快速嘗試使用各種模型。
  • 吳恩達演講直指AI落地三大挑戰,並提出解決方案
    HAI(「以人為本」人工智慧研究院)成立於 2019 年 3 月,由史丹福大學人工智慧科學家李飛飛和哲學教授約翰 · 埃切曼迪(John Etchemendy)共同領導,致力於推動人工智慧領域的跨學科合作,讓科技以人為中心,並加強對人工智慧社會影響的研究。HAI 定期舉辦研討會,此前吳恩達參加研討會並做了演講。
  • 【NIPS2017最新Tutorial】幾何深度學習(Geometric Deep Learning )講解(附slide下載)
    NIPS是人工智慧和機器學習領域的頂會,來自世界範圍內優秀的科學家、研究人員和從業者都將匯聚一堂,相互切磋工作,將在未來的五天裡共同討論和分享人工智慧的前沿想法和未來發展。每年 NIPS 的會議上,都會有非常重量級的 tutorial 和工作發表。
  • 126篇殿堂級深度學習論文分類整理 從入門到應用 | 乾貨
    [pdf] (Ian Goodfellow 等大牛所著的教科書,乃深度學習聖經。[pdf] (最前沿的語音識別, 微軟) ★★★★地址:https://arxiv.org/pdf/1610.05256v1研讀以上論文之後,你將對深度學習歷史、模型的基本架構(包括 CNN, RNN, LSTM)有一個基礎的了解,並理解深度學習如何應用於圖像和語音識別問題。
  • 人工智慧利用單眼強度圖像進行面部深度圖估計的對抗架構深度學習
    人工智慧利用單眼強度圖像進行面部深度圖估計的對抗架構深度學習 人工智慧利用單眼強度圖像進行面部深度圖估計的對抗架構深度學習 2018-06-05 11:36:53  來源:今日頭條
  • 吳恩達被diss了
    生物學家、醫生、以及吳恩達的半個機器學習同行們對這條Twitter的不滿,很大程度上也是因為吳恩達老師的學術地位和影響力。對公眾和科學家群體來說,基本的信任就是這麼被消滅的:公眾一次又一次這樣被言過其實地忽悠,誰還會相信科學家?事情就是這麼個事情。Lior Pachter其人Lior Pachter是計算生物學、計算和數學科學教授,目前任教於加州理工大學。目前其團隊主要研發基因組學的計算和實驗方法,專注於單細胞測序技術的發展及其在RNA生物學中的應用。
  • 深度學習引爆下一次科技革命
    直到深度學習出現才改善了這種局面,他把數據比作火箭的燃料,把深度學習比作發動機,是深度學習將數據這種燃料點燃從而將人工智慧推到另外一個高度。而值得一提的是,在今天BIG TALK以及其他活動的演講中,各領域專家都直接或間接的提到了深度學習。所以,我大膽的得出一個結論,深度學習不僅是人工智慧的發動機,更是其他眾多領域、甚至是整個社會科技進步的動力。
  • 如何區分人工智慧、機器學習和深度學習?
    在深度學習網絡中,每一個節點層在前一層輸出的基礎上學習識別一組特定的特徵。隨著神經網絡深度增加,節點所能識別的特徵也就越來越複雜,因為每一層會整合併重組前一層的特徵。半監督學習介於監督學習與無監督學習之間。它主要考慮如何利用少量的標註樣本和大量的未標註樣本進行訓練和分類的問題。。增強學習通過觀察來學習做成如何的動作。每個動作都會對環境有所影響,學習對象根據觀察到的周圍環境的反饋來做出判斷。在傳統的機器學習領域,監督學習最大的問題是訓練數據標註成本比較高,而無監督學習應用範圍有限。
  • 高效「煉丹」必備技能:一文實現深度學習數學原理入門,還有吳恩達...
    尤其是深度學習算法開發人員,追求模型結構優化和提高編程效率是永遠的目標。但是,如果只做代碼「搬運工」,不了解神經網絡背後的數學原理,很難對項目有深刻全面的理解,debug反而會更難、耗時更長。就以深度學習中常用的神經網絡來說,典型模型包括多層感知機(DLP)、卷積神經網絡(CNN)、循環神經網絡(RNN)等等,不同的項目,對神經網絡的調參需求也不相同。
  • 專題| 深度強化學習綜述:從AlphaGo背後的力量到學習資源分享(附...
    ., 2016)。DeepMind 及暴雪會合作以發布星際爭霸 2 的人工智慧研究環境(goo.gl/Ptiwfg)。OpenAI Gym(https://gym.openai.com/)是一個用於開發強化學習算法的工具包。它由一系列環境構成,包括了 Atari 遊戲及模擬的機器人構成,以及一個用於比較及復現結果的網站。
  • ...深度強化學習綜述:從AlphaGo背後的力量到學習資源分享(附論文)
    ., 2016)。DeepMind 及暴雪會合作以發布星際爭霸 2 的人工智慧研究環境(goo.gl/Ptiwfg)。OpenAI Gym(https://gym.openai.com/)是一個用於開發強化學習算法的工具包。它由一系列環境構成,包括了 Atari 遊戲及模擬的機器人構成,以及一個用於比較及復現結果的網站。
  • 吳恩達最新醫學 AI 成果:利用 AI 提高腦動脈瘤檢測準確率,顯著...
    吳恩達團隊建立了一種基於CTA的顱內動脈瘤自動檢測深度學習模型,模型顯著提高了臨床醫生的敏感性,準確性和評估者間可靠性。團隊未來的工作是進一步調查這個模型的表現,並應用其他機構和醫院的數據。   作者 | 李雨晨   從百度離職後,吳恩達重新回到史丹福大學繼續進行學術研究,醫療是他最為看重的垂直應用方向之一,兩年的時間裡,吳恩達和團隊陸續發表了多項成果:包括用CNN算法識別肺炎、公布最大醫學影像數據集 MURA等等。  近日,史丹福大學官網發布了吳恩達團隊的一項最新成果:藉助人工智慧算法,幫助放射科醫師改進腦動脈瘤的診斷。
  • 一文告訴你,NIPS 2017有多火爆 | 附PPT、視頻、代碼大總結
    v=YJnddoa8sHk 使用概率程序、程序歸納和深度學習的工程與可逆工程智能 概率編程是非常出色的,但或許出於其複雜性的原因,它的應用並不廣泛。它為你提供了一種以概率方式描述問題的途徑,這是現實世界的自然表現。你可以在參數、模型輸入和輸出中編碼不確定性,並獲得一組程序執行的預估痕跡。
  • 人工智慧系統利用深度學習算法,能夠預測癲癇發作,準確率達到99.6%
    人工智慧系統利用深度學習算法,能夠預測癲癇發作,準確率達到99.6%Artificial intelligence system uses deep learning algorism to predict seisures
  • 吳恩達創業關你什麼事?
    我們不知道百度和Deeplearning.ai 之間的關係——以及它與吳恩達離去之間的關係。當然,也可能純粹只是個錯誤。 吳恩達今年3 月下旬離開公司,承諾將繼續把AI 的好處帶給大家。百度以自然語言處理的專業技術聞名,最近一直將資源投入到自動駕駛汽車和其他特定的深度學習應用中。
  • ...首席科學家鄧力:深度學習十年簡史和人工智慧未來展望(33PDF...
    鄧力博士回顧了他與 Hinton 的合作及其產業影響,重點講述語音識別如何隨深度學習發展進入商用階段,還介紹了微軟近兩年的人工智慧進展,並對深度學習技術、應用和產業進行展望。演講最後,鄧力分享了他最新的思想和工作——將符號式邏輯推理和數值張量式神經網絡結合到一起,有望解決深度學習黑箱問題、常識嵌入與充實問題,以及邏輯推理規則的自動學習問題。
  • 吳恩達:史上最通俗易懂的人工智慧概念解釋
    編者按:本文來自微信公眾號"筆記俠「(ID:Notesman),作者:吳恩達,責編:戈多內容來源:2017年9月11日,斯坦福,吳恩達為GASA大學作主題為「探索人工智慧」的分享。筆記俠作為獨家課程筆記合作夥伴,經主辦方審閱授權發布。筆記君邀您,先思考:1. 為什麼AI會突然在這幾年進步這麼快?2.