一文帶你深入了解,什麼是深度學習及其工作原理

2021-01-09 CDA數據分析師

作者 | CraigStedman 編譯 | CDA數據科學研究院

深度學習是機器學習(ML)和人工智慧(AI)的一種,它模仿人類獲取某些類型的知識的方式。深度學習是數據科學的重要元素,其中包括統計和預測模型。對於負責收集,分析和解釋大量數據的數據科學家而言,這是極為有益的。深度學習使此過程更快,更輕鬆。

從最簡單的角度講,可以將深度學習視為自動化預測分析的一種方式。儘管傳統的機器學習算法是線性的,但深度學習算法卻以越來越複雜和抽象的層次結構堆疊在一起。

要了解深度學習,請想像一個第一個單詞是dog的小孩。幼兒通過指向物體並說出「 狗」一詞來了解狗是什麼—不是狗。父母說:「是,那是狗」,或者:「否,那不是狗」。隨著幼兒繼續指向物體,他逐漸意識到所有狗所具有的特徵。幼兒在不知情的情況下通過建立層次結構來闡明複雜的抽象概念(狗的概念),在層次結構中,每個抽象層次都是使用從層次結構的上一層獲得的知識來創建的。

深度學習如何工作

使用深度學習的電腦程式所經歷的過程與蹣跚學步的學習來識別狗的過程幾乎相同。層次結構中的每個算法都對其輸入應用非線性變換,並使用其學習的知識來創建統計模型作為輸出。迭代一直持續到輸出達到可接受的精度水平為止。數據必須經過的處理層數是促使標籤產生深刻影響的原因。

在傳統的機器學習中,學習過程是受監督的,並且程式設計師在告訴計算機應尋找哪種類型的事物以決定圖像包含狗還是不包含狗時,必須非常具體。這是一個費力的過程,稱為特徵提取,計算機的成功率完全取決於程式設計師為「狗」準確定義特徵集的能力。深度學習的優勢是程序無需監督即可自行構建功能集。無監督學習不僅更快,而且通常更準確。

最初,電腦程式可能會提供訓練數據-一組圖像,人類已經為這些圖像使用元標籤將每個圖像標記為「狗」或「非狗」 。該程序使用從訓練數據中接收到的信息來創建「狗」的功能集並建立預測模型。在這種情況下,計算機首先創建的模型可能會預測圖像中具有四隻腿和一條尾巴的任何東西都應標記為「狗」。當然,該程序不知道標籤「四腿」或「尾巴」。它將僅查找數字數據中的像素模式。每次迭代,預測模型都會變得更加複雜和準確。

與需要花費數周甚至數月才能了解「狗」概念的幼兒不同,可以向使用深度學習算法的電腦程式顯示一個訓練集,並對數百萬張圖像進行分類,以準確識別其中包含狗的圖像。

為了達到可接受的精度水平,深度學習程序需要訪問大量的培訓數據和處理能力,在大數據和雲計算時代之前,程式設計師都無法輕鬆獲得這兩種數據。因為深度學習編程可以直接從其自己的迭代輸出中創建複雜的統計模型,所以它能夠從大量未標記,未結構化的數據中創建準確的預測模型。這一點很重要,因為物聯網(IoT)繼續變得越來越普及,因為人類和機器創建的大多數數據都是非結構化的,並且沒有標籤。

什麼是深度學習神經網絡?

一種高級的機器學習算法,稱為人工神經網絡,是大多數深度學習模型的基礎。結果,深度學習有時可能被稱為深度神經學習或深度神經網絡。

神經網絡有幾種不同的形式,包括遞歸神經網絡,卷積神經網絡,人工神經網絡和前饋神經網絡-每種都有針對特定用例的好處。但是,它們都以某種相似的方式發揮作用,通過輸入數據並讓模型自己確定模型是否對給定的數據元素做出了正確的解釋或決策。

神經網絡涉及反覆試驗的過程,因此它們需要大量的數據進行訓練。僅在大多數企業接受大數據分析並積累大量數據存儲之後,神經網絡才流行起來,這並非巧合。由於模型的前幾次迭代涉及對圖像或語音部分的內容進行過某種程度的猜測,因此必須標記訓練階段使用的數據,以便模型可以查看其猜測是否準確。這意味著,儘管許多使用大數據的企業擁有大量數據,但非結構化數據的幫助較小。非結構化數據只有經過訓練並達到可接受的準確性水平,才能通過深度學習模型進行分析,但是深度學習模型無法對非結構化數據進行訓練。

深度學習方法

可以使用各種不同的方法來創建強大的深度學習模型。這些技術包括學習率衰減,遷移學習,從頭開始和輟學訓練。

學習率下降。學習速率是一個超參數-一個在學習過程之前定義系統或為其系統設置條件的因素-每次更改模型權重時,該模型將控制模型對響應於估計誤差的變化量。太高的學習率可能會導致訓練過程不穩定或無法獲得最佳的權重。太小的學習率可能會導致冗長的培訓過程,從而有可能被卡住。

學習速率衰減方法-也稱為學習速率退火或自適應學習速率-是調整學習速率以提高性能並減少訓練時間的過程。訓練過程中最簡單,最常見的學習率調整包括隨時間降低學習率的技術。

轉移學習。這個過程涉及完善先前訓練過的模型;它需要一個到現有網絡內部接口。首先,用戶向現有網絡提供包含以前未知分類的新數據。一旦對網絡進行了調整,就可以使用更具體的分類功能執行新任務。這種方法的優點是所需數據比其他方法少得多,從而將計算時間減少到數分鐘或數小時。

從頭開始訓練。此方法要求開發人員收集大標籤的數據集並配置可以學習功能和模型的網絡體系結構。該技術對於新應用程式以及具有大量輸出類別的應用程式特別有用。但是,總的來說,這是一種不太常見的方法,因為它需要大量的數據,導致培訓需要幾天或幾周的時間。

退出。該方法試圖通過在訓練過程中從神經網絡中隨機刪除單元及其連接來解決具有大量參數的網絡的過擬合問題。已經證明,輟學方法可以提高神經網絡在語音識別,文檔分類和計算生物學等領域的監督學習任務上的性能。

深度學習應用示例

由於深度學習模型以類似於人腦的方式處理信息,因此它們可以應用於人們執行的許多任務。目前,深度學習已用於大多數常見的圖像識別工具,自然語言處理和語音識別軟體中。這些工具開始在自動駕駛汽車和語言翻譯服務等各種應用程式中出現。

深度學習有什麼用?

如今,深度學習的用例包括所有類型的大數據分析應用程式,尤其是那些側重於自然語言處理,語言翻譯,醫學診斷,股市交易信號,網絡安全和圖像識別的應用程式。

當前正在使用深度學習的特定領域包括:

客戶體驗。深度學習模型已經用於聊天機器人。並且,隨著它的不斷成熟,有望在各種業務中實施深度學習,以改善客戶體驗並提高客戶滿意度。文字生成。正在教機器文本的語法和樣式,然後使用該模型自動創建與原始文本的正確拼寫,語法和樣式匹配的全新文本。航空航天和軍事。深度學習被用於從衛星中檢測物體,以識別出感興趣的區域以及部隊的安全區域或不安全區域。工業自動化。深度學習通過提供自動檢測何時工人或物體離機器太近的服務來改善工廠和倉庫等環境中的工人安全。添加顏色。可以使用深度學習模型將顏色添加到黑白照片和視頻中。過去,這是一個非常耗時的手動過程。醫學研究。癌症研究人員已開始在其實踐中實施深度學習,以自動檢測癌細胞。計算機視覺。深度學習極大地增強了計算機視覺,為計算機提供了極高的精度,可進行對象檢測以及圖像分類,恢復和分割。局限與挑戰

深度學習模型的最大局限性在於它們通過觀察來學習。這意味著他們只知道他們所訓練的數據中包含的內容。如果用戶的數據量很少或來自某個特定來源(不一定代表更廣泛的功能區域),則模型將無法以可推廣的方式學習。

偏差問題也是深度學習模型的主要問題。如果模型訓練包含偏差的數據,則該模型將在其預測中重現這些偏差。對於模型深度學習的程式設計師來說,這是一個令人頭疼的問題,因為模型會根據數據元素的細微變化來學習區分。通常,程式設計師所確定的因素往往很重要。這意味著,例如,面部識別模型可能會基於種族或性別等事物來確定人的性格,而程式設計師不會意識到。

學習率也可能成為深度學習模型的主要挑戰。如果速率太高,則該模型將收斂太快,從而產生次優解決方案。如果速率太低,則該過程可能會卡住,甚至很難找到解決方案。

深度學習模型的硬體要求也會造成限制。需要多核高性能圖形處理單元(GPU)和其他類似的處理單元,以確保提高效率和減少時間消耗。但是,這些單元價格昂貴並且消耗大量能量。其他硬體要求包括隨機存取存儲器(RAM)和硬碟驅動器或基於RAM的固態驅動器(SSD)。

其他限制和挑戰包括:

深度學習需要大量數據。此外,功能更強大,更準確的模型將需要更多參數,進而需要更多數據。訓練後,深度學習模型將變得僵化,無法處理多任務。他們可以提供有效且準確的解決方案,但只能解決一個特定問題。即使解決類似的問題,也需要重新培訓系統。任何需要推理的應用程式(例如編程或應用科學方法)的長期規劃和類似算法的數據處理,即使對於大數據,也完全超出了當前深度學習技術的能力範圍。深度學習與機器學習

深度學習是機器學習的一個子集,它通過解決問題的方式與眾不同。機器學習需要領域專家來識別大多數應用功能。另一方面,深度學習會逐步學習特徵,從而消除了對領域專業知識的需求。這使得深度學習算法的訓練時間比機器學習算法要長得多,機器學習算法只需要幾秒鐘到幾小時。但是,在測試期間反之亦然。深度學習算法運行測試所需的時間比機器學習算法要少得多,後者的測試時間隨數據量的增加而增加。

此外,機器學習不需要像深度學習那樣昂貴的高端機器和高性能GPU。

最後,由於其卓越的可解釋性或理解解決方案的能力,許多數據科學家選擇傳統的機器學習而非深度學習。當數據較小時,機器學習算法也是首選。

深度學習變得更可取的情況包括:數據量大,特徵自省或對諸如語音識別和自然語言處理之類的複雜問題缺乏領域理解的情況。

歷史

深度學習的歷史可以追溯到1943年,當時Warren McCulloch和Walter Pitts使用數學和算法為神經網絡創建了一個計算模型。但是,直到2000年代中期才出現「深度學習」一詞。在Geoffrey Hinton和Ruslan Salakhutdinov發表論文之後,它得到了普及,該論文顯示了如何一次訓練多層神經網絡。

2012年,Google的算法揭示了識別貓的能力,從而在深度學習方面給人留下了深刻的印象。兩年後的2014年,谷歌從英國收購了人工智慧初創公司DeepMind。兩年後,2016年,谷歌DeepMind的算法AlphaGo掌握了複雜的棋盤遊戲Go,在漢城的一場比賽中擊敗了職業玩家Lee Sedol。

最近,深度學習模型已在人工智慧領域產生了大部分進步。深度強化學習已經成為一種將AI與複雜的應用程式集成的方法,例如機器人技術,視頻遊戲和自動駕駛汽車。深度學習與強化學習之間的主要區別在於,深度學習從訓練集學習,然後將學到的知識應用於新的數據集,而深度強化學習則通過使用連續反饋調整動作來動態學習,以優化獎勵。

強化學習代理具有提供對生成對抗網絡(GAN)的快速而強大的控制的能力。對抗閾值神經計算機(ATNC)將深度強化學習與GAN結合在一起,以設計具有特定的所需藥理學性質的有機小分子。

GAN還被用於生成用於機器學習任務的人工訓練數據,可用於數據集不平衡的情況或數據包含敏感信息的情況。

相關焦點

  • 高效「煉丹」必備技能:一文實現深度學習數學原理入門,還有吳恩達...
    尤其是深度學習算法開發人員,追求模型結構優化和提高編程效率是永遠的目標。但是,如果只做代碼「搬運工」,不了解神經網絡背後的數學原理,很難對項目有深刻全面的理解,debug反而會更難、耗時更長。就以深度學習中常用的神經網絡來說,典型模型包括多層感知機(DLP)、卷積神經網絡(CNN)、循環神經網絡(RNN)等等,不同的項目,對神經網絡的調參需求也不相同。
  • 「修煉開始」一文帶你入門深度學習
    這樣,當有新的病人時,我們可以利用總結出來的規律來判斷這個病人得了什麼疾病。深度學習主要由上圖所示的幾個部分組成,想學一個深度學習算法的原理,就看它是什麼樣的網絡結構,Loss 是怎麼計算的,預處理和後處理都是怎麼做的。
  • 初步了解霍爾傳感器及其工作原理
    對霍爾傳感器及其工作原理的初步認識霍爾元件是世界第三大傳感器產品。它被廣泛應用於工業、汽車、計算機、手機和新興消費電子產品。什麼是霍爾傳感器?霍爾元件是根據霍爾效應製成的磁場傳感器,廣泛應用於工業自動化技術、檢測技術和信息處理。霍爾效應實驗測得的霍爾係數可以用來判斷半導體材料的導電類型、載流子濃度和載流子遷移率等重要參數。
  • 股票漲跌原理是什麼 馬上帶你去了解清楚!
    其實,炒股需要學習一定的炒股知識、長期炒股的經驗累積、以及所謂的好運氣等等因素相結合下,才能在股市中賺到錢。那麼,股票漲跌原理是什麼呢?接下來,小編馬上帶你去了解清楚股票漲跌原理根源所在。其實,影響股票價格的主要因素是供求關係,漲跌不由個人控制,而是由市場決定的。簡單來說,股票價格是市場中所有買方賣方共同博弈出來的結果。
  • 什麼是Drand及其工作原理?
    這篇文章會深入探討什麼是Drand及其工作原理。例如,當生成介於1到10之間的隨機整數時,您應該有十分之一的機會正確猜出它。但是,如果您的隨機性生成器表現出偏差或模式,則正確猜測整數的機率可能會大於十分之一。換句話說,一個關鍵問題是使用「可預測」生成器。可預測的隨機性再次為欺詐和黑客行為打開了大門。我們不僅需要隨機性,還需要良好的隨機性。好的隨機性比您想像的要難。
  • 深度學習與計算機視覺群|文末送書
    深度學習與計算機視覺③群已組建,上次開放進群,沒來得及進的小夥伴,抓緊啦 。之後,我們會在交流群開展「你挑我送」為主題的送書活動喲~ 歡迎加入!!!同時也感謝長期以來支持深度學習與計算機視覺的朋友們,感謝你們的一路支持,你們是我們堅持走下去的源動力。深度學習與計算機視覺公眾號會不忘初心,堅持分享優質技術文章。
  • 如何深入地進行工作——讀《深度工作》
    在第二部分,準則部分,作者通過工作要深入、擁抱無聊、遠離社交媒體和摒棄浮淺這四個準則,向我們詳細地闡述如何將深度工作從一種渴望轉變為你日常工作計劃中的常規安排和重要組成部分,活出專注的人生。 工作開始之後你將如何繼續工作?立下深度工作時的規矩,比如深度工作時不使用任何網絡。 你如何支持自己的工作?可以設置獎勵機制,比如深度工作一段時間之後獎勵自己一杯咖啡或者自己喜歡的美食。
  • 一本入門深度學習的好書
    而與此同時學習深度學習的人也開始變得多了起來,但由於深度學習涉及面比較廣,很多學者會對此望而卻步。然而如果學好深度學習,不僅僅可以給你帶來高薪資,也有可能會給你帶來很多的榮譽!因為在此領域還是非常缺乏人才的!最近經常有朋友提及,想要入門深度學習,該如何學習?關於深度學習,網上的資料很多,不過貌似大部分都不太適合初學者。
  • 一文讀懂深度學習中的矩陣微積分,fast.ai創始人&ANTLR之父出品
    魚羊 編譯整理量子位 報導 | 公眾號 QbitAI想要真正了解深度神經網絡是如何訓練的,免不了從矩陣微積分說起。雖然網絡上已經有不少關於多元微積分和線性代數的在線資料,但它們通常都被視作兩門獨立的課程,資料相對孤立,也相對晦澀。
  • 一文看懂功放的工作原理與作用
    什麼是功放   功率放大器簡稱功放,俗稱「擴音機」,是音響系統中最基本的設備,它的任務是把來自信號源(專業音響系統中則是來自調音臺)的微弱電信號進行放大以驅動揚聲器發出聲音。
  • 液位帶浮球控制箱特點及工作原理
    液位帶浮球控制箱特點及作用在使用各種排汙泵時如果沒有專人看管所以排汙泵必須採用水位控制原理才能使用,不然例如WQ潛水排汙泵在把水抽乾之後不能及時停泵會造成排汙泵缺水工作潛水排汙泵如果缺水會因為潛水排汙泵汙水冷卻而導致潛水排汙泵電機燒毀的現象,
  • 一文了解防抱死制動系統的工作原理
    蓋世汽車訊 據外媒報導,防抱死制動系統(ABS)的應用已十分普及,本文將簡單介紹其工作原理。防抱死剎車系統可以提高行車時,車輛緊急制動的安全係數。否則,汽車在遇緊急情況採取緊急剎車時,容易出現輪胎抱死,也就是方向盤不能轉動,這樣危險係數就會隨之增加,很容易造成嚴重後果。
  • 一文帶你了解什麼是MCC教學體系
    經過數百次迭代,這些自行開發的工具更適合幼兒學習編程,並且免費開放給世界。編程貓致力於使用「好的工具,好的課程,好的老師」來培訓未來的創作者,以便讓更多的孩子能夠以有趣的方式玩轉少兒編程。特別是必須提及用於編程貓的MCC課程系統。對於不同年級,不同認知水平的孩子,他們可以找到相應的系統編程學習課程。
  • 深入了解庫裡式投籃的原理,可以升華我們的投籃技術
    在我們在籃球場上拿起籃球朝向籃筐去投籃的時候,你有沒有想過為什麼籃球會掉進籃筐,這個問題是每個想要學習投籃的人都必須明白的,但是卻是被絕大多數人所忽略的,這個問題的答案就是一切投籃的原理,也是庫裡式投籃的原理,那就是:主動意識(這個詞學習自池邊的樹籃球教程)。
  • 挑戰性任務:如何走向深入? ——從深度學習的角度談起
    從這個角度理解,深度學習要圍繞挑戰性任務,吸引學習者全身心投入,開展持久、深入、有意義的學習探索過程並獲得發展。一、深度理解:挑戰性任務的意蘊、內核、特徵「挑戰性任務」,顧名思義,其核心是「任務」,關鍵是「挑戰」。
  • 超聲波風速風向傳感器監測及其工作原理
    打開APP 超聲波風速風向傳感器監測及其工作原理 發表於 2020-04-13 14:38:13 超聲波風速風向傳感器工作原理 超聲波風速傳感器的工作原理是利用超聲波時差法來實現風速風向的測量。由於聲音在空氣中的傳播速度,會和風向上的氣流速度疊加。
  • 卡內基梅隆大學機器人學院博士後胡耀鈺:基於深度學習的雙目深度...
    而隨著深度學習的發展,基於深度學習的三維重建方法也開始不斷出現。在傳統三維重建方法中引入深度學習算法進行改進,或者將深度學習算法與傳統算法進行融合、優勢互補,又或者模仿動物視覺,直接利用深度學習算法進行三維重建。
  • 帶您深入了解忻州刑事審判工作!
    帶您深入了解忻州刑事審判工作!堅持把宣傳引導作為掃黑除惡「先手棋」,深入開展「法律六進」活動,利用「兩微一網」等新媒體平臺廣泛宣傳掃黑除惡法律常識,製作出品的掃黑除惡專題微電影《勇敢站起來》,在全國法院第七屆微電影微視頻「金法槌獎」評選、第四屆平安山西「三微」
  • 深圳華強北的一手貨源,一文帶你了解香港統貨
    一文帶你了解香港統貨中國香港觀塘區香港是一個自由港,貿易的成本低,而且香港背靠大陸擁有巨大額市場需求一文帶你了解香港統貨什麼是統貨機呢?一文帶你了解香港統貨華強北稍微有點實力的老闆都會到香港公司統貨,我沒去過,只是聽一些老闆講過,統貨有四種方式:現貨競標、現貨議價、來貨預售、為客尋貨等(都是字面意思
  • 雷射雷達工作原理及應用
    打開APP 雷射雷達工作原理及應用 周碧俊 發表於 2018-08-27 17:24:50 通常,為了統計高速公路卡口在一定時間內所通過的車輛