最常見的深度學習應用

2020-12-05 老白說圖像

深度學習技術在人工智慧領域目前佔有絕對的統治地位,因為相比於傳統的機器學習算法而言,深度學習在某些領域展現出了最接近人類所期望的智能效果,同時也在悄悄的走進我們的生活,例如刷臉支付、語音識別、智能翻譯、汽車上的智能輔助駕駛等等,這讓我們的生活開始慢慢智能化,那具體在哪些方向深度學習表現的最為耀眼吶?

1 計算機視覺

圖像識別:圖像識別是最早深度學習的應用領域之一,其本質是一個圖像分類問題,早在神經網絡剛剛出現的時候,美國人就實現了對手寫數字的識別,並進行了商業化,基本的原理就是輸入圖像,輸出為該圖像屬於每個類別的概率,例如輸入一種狗的圖片,我們就期望其輸出屬於狗這個類別的概率值最大,這樣我們就可以認為這張圖片拍的是一個狗。經典的圖像識別的網絡有VGG系列、Inception系列、ResNet系列等。

目標檢測:目標檢測就是通過深度學習網絡的訓練和學習,能夠自動找到圖片中目標的大致位置,通常用一個矩形邊界框來表示,並將邊界框所包含的目標進行圖像分類,目前比較優秀的目標檢測算法有:YOLO、SSD、RCNN、FastRCNN、FasterRCNN、MaskRCNN等系列算法。

語義分割:圖像分類是對整張圖片進行分類處理,而語義分割就是對圖片中每個像素進行分類處理,通過算法設計自動將圖片中不同物體的像素進行分類識別,準確的標註出物體在圖像的位置。常見的語義分割算法有FCN、U-net、SegNet、DeepLab等系列算法。

視頻理解:視頻可以理解為在二維圖像上加入了時間信息,變成了具有3維信息的圖像分析,視頻理解囊括了視頻分類、行為檢測等常見任務,常見的算法模型有C3D、TSN、DOVF、TS_LSTM等。

圖像生成:圖像採集一般都是通過相機等外界設備拍攝真實環境得來的,但通過一定的學習算法,可以從大量真實的圖片中學習到真實圖像的分布情況,進而生成具有與真實圖像高度相似的圖像,這就是圖像生成技術。目前最流行的技術有VAE系列和GAN,其中GAN系列發展迅猛。

超解析度圖像:超解析度圖像生成技術(SR)可以將觀測到的低分率的圖像重建出高分辨圖像,說白了就是通過軟體的方法提高圖像的解析度,這種技術目前也在各大手機攝像頭解析度上有所使用,一般我們看到的攝像頭解析度參數並不是實際物理成像sensor的解析度,都會加入數字解析度的。

藝術風格遷移:通俗點講就是學習一副畫的style,然後採用學習到的style,將一副內容圖像進行重畫,也是一個非常有意思的研究方向。

2 自然語言處理

機器翻譯:傳統的機器翻譯模型採用是基於統計分析的算法模型,可想而知,對於複雜的語言表達邏輯,效果並不佳,而基於深度學習的機器翻譯,讓機器翻譯出來的結果更加接近人類的表達邏輯,正確率得到了大大的提高,創建的機器翻譯模型有:Seq2Seq、BERT、GPT、GPT-2等。

聊天機器人:讓機器人能夠理解人類的語言,並作出一定的語言反應,進而達到人機對話的目的。聊天機器人已經廣泛的應用在諮詢系統、智能家居等。

3 強化學習

虛擬遊戲:在虛擬遊戲中,機器可以通過自我模擬,自我訓練,自我測試,讓機器在一定遊戲規則下,學習到好的戰勝策略。在圍棋界,Google訓練的DeepMindAlphaGo就戰勝了圍棋高手李世石,這讓深度學習輕鬆攻陷了人類自以為傲的思維頂端遊戲。

機器人:藉助深度學習的力量,機器人可以在真實複雜的環境中,可以代替人執行一定的特殊任務,如人員跟蹤、排爆等,這在過去是完全不可能的事。做的最好的要屬美國波士頓動力公司開發的機器人,其在複雜地形行走、肢體協調等方面取得了巨大的進步。

自動駕駛:現在很多網際網路大公司都在自動駕駛上投入了大量的資源,如國內的百度、美國的Google公司、Uber公司等,在自動駕駛中,就應用了大量的深度學習技術,如馬路線與路標的檢測、周邊行走車輛的3維信息等。

相關焦點

  • 深度學習中常見的損失函數
    》這本書,今天我把這本書中關於常見的損失函數這一節的內容公開出來,希望能對大家有所幫助。 在深度學習分類任務中,我們經常會使用到損失函數,今天我們就來總結一下深度學習中常見的損失函數。但邏輯回歸併沒有極大化似然函數,而是轉變為最小化負的似然函數,因此有了上式。已知邏輯函數(sigmoid函數)為:
  • 淺析深度學習在半導體行業的應用
    打開APP 淺析深度學習在半導體行業的應用 胡薇 發表於 2018-08-16 14:09:27 深度學習是機器學習的一個分支,而機器學習是AI的一個分支。可以預見,深度學習包含了較多的非連續性、顛覆性的技術與重大的機遇。但它不像1980年代的Lisp機器熱潮。因為Lisp程式語言並不適於一般編程人群。深度學習卻顛覆了編程,與往常的編程 ——即編程者寫代碼並將一組輸入轉化成一組輸出——不一樣的是:深度學習會消化許多輸入與輸出的示例,並學習該模式下的匹配。
  • 關於深度學習在各個領域的應用分析
    深度學習網絡作為一個功能多樣的工具,雖然最初僅用於圖像分析,但它已逐漸被應用到各種不同的任務和領域中。高準確性和高處理速度,使得用戶無需成為領域專家即可對大型數據集執行複雜分析。 小編邀請 MathWorks 產品經理 Johanna 分享一些深度學習網絡的使用示例以供參考: 文本分析 在本例中,我們將分析推特數據,了解針對特定詞或短語的情感是積極的還是消極的。情感分析有很多實際的應用,如品牌推廣、競選活動和廣告營銷。 過去(目前仍然)進行情感分析通常使用機器學習。
  • 自然語言處理深度學習的7個應用
    然而,深度學習方法在一些特定的語言問題上取得了最新的成果。這不僅僅是深度學習模型在基準問題上的表現,基準問題也是最有趣的;事實上,一個單一的模型可以學習詞義和執行語言任務,從而消除了對專業手工製作方法渠道的需要。在這篇文章中,你會發現7個有趣的自然語言處理任務,也會了解深度學習方法取得的一些進展。
  • 前沿研究丨深度學習在醫學超聲圖像分析中的應用
    文章指出,在醫學超聲圖像分析中,深度學習展示了巨大的應用潛力,簡要介紹了一些流行的深度學習結構,討論了深度學習方法在超聲圖像分析的各種特定任務(如圖像分類、物體檢測與目標分割)中的應用。文章指出了深度學習在醫學超聲圖像分析應用中所面臨的挑戰以及潛在的發展趨勢。
  • .| 深度學習理論與實戰:提高篇(5)——深度學習在語音識別中的應用
    編者按:本文節選自《深度學習理論與實戰:提高篇 》一書,原文連結http://fancyerii.github.io/2019/03/14/dl-book/。提起深度學習的再次興起,大家首先可能會想到2012年AlexNet在圖像分類上的突破,但是最早深度學習的大規模應用發生在語音識別領域。自從2006年Geoffrey Hinton提出逐層的Pretraining之後,神經網絡再次進入大家的視野。
  • 吳恩達 NIPS 2016:利用深度學習開發人工智慧應用的基本要點(含...
    今日,在第 30 屆神經信息處理系統大會(NIPS 2016)中,百度首席科學家吳恩達教授發表演講:《利用深度學習開發人工智慧應用的基本要點(Nuts and Bolts of Building Applications using Deep Learning)》。
  • 機器學習算法盤點:人工神經網絡、深度學習
    在建立預測模型的時候,監督式學習建立一個學習過程,將預測結果與「訓練數據」的實際結果進行比較,不斷的調整預測模型,直到模型的預測結果達到一個預期的準確率。監督式學習的常見應用場景如分類問題和回歸問題。   在非監督式學習中,數據並不被特別標識,學習模型是為了推斷出數據的一些內在結構。常見的應用場景包括關聯規則的學習以及聚類等。常見算法包括Apriori算法以及k-Means算法。
  • 吳恩達NIPS2016:利用深度學習開發人工智慧應用的基本要點含唯一的...
    今日,在第 30 屆神經信息處理系統大會(NIPS 2016)中,百度首席科學家吳恩達教授發表演講:《利用深度學習開發人工智慧應用的基本要點(Nuts and Bolts of Building Applications using Deep Learning)》。
  • iDST院長金榕IJCAI演講:阿里巴巴的深度學習應用(附PPT)
    :深度學習過去十年在各個領域都取得了巨大的成功,但當把深度學習技術應用到實際問題中時,常會遇到諸多挑戰。阿里巴巴作為在電商領域有諸多業務的企業,對深度學習有很大的需求,不可避免地當他們將深度學習應用到業務中時會遇到許多學界人士不可能遇到的問題。
  • ARXIV:深度學習在金融領域中的應用 | 唧唧堂論文解析
    然而,相比較ML領域,DL(深度學習)是一個新興領域,越來越多的 DL 模型開始應用在金融中。本文的重點是介紹DL模型在不同金融領域的已實現應用,以便幫助對DL感興趣的研究人員和從業人員決定研究方向。因此本文提出了如下問題:1. 哪些金融領域是深度學習的應用熱門?2. 這些領域的現存研究是否成熟?
  • 機器學習算法匯總:人工神經網絡、深度學習及其它
    在建立預測模型的時候,監督式學習建立一個學習過程,將預測結果與「訓練數據」的實際結果進行比較,不斷的調整預測模型,直到模型的預測結果達到一個預期的準確率。監督式學習的常見應用場景如分類問題和回歸問題。常見的應用場景包括關聯規則的學習以及聚類等。常見算法包括Apriori算法以及k-Means算法。
  • 科學家找到深度學習基因組學應用的一頂「黑帽子」—新聞—科學網
    ■本報記者 趙廣立 在生命科研領域,常有人說深度學習的基因組學應用好比是「一個盲人在一間黑暗的房子裡尋找一頂並不存在的黑色帽子」。言下之意,是遺憾深度學習的基因組學應用並沒有給人們帶來太多驚喜。不過,近日賓夕法尼亞大學和費城兒童醫院教授邢毅團隊的一項研究,找到了這樣一頂「黑帽子」。
  • 深度學習在3-D環境重建中的應用
    因為CNN已經在特徵匹配、運動估計和立體匹配得到應用,這樣在SLAM/SFM/VO/MVS的應用探索也就成了必然。這些約束構造最後的損失函數並使其最小化,而UnDeepVO學習端對端無監督方式估計尺度化的6-DoF姿勢和深度圖。
  • 一文全覽深度學習在計算機視覺領域的應用
    已經是很熱的深度學習,大家都看到不少精彩的故事,我就不一一重複。簡單的回顧的話,2006年Geoffrey Hinton的論文點燃了「這把火」,現在已經有不少人開始潑「冷水」了,主要是AI泡沫太大,而且深度學習不是包治百病的藥方。計算機視覺不是深度學習最早看到突破的領域,真正讓大家大吃一驚的顛覆傳統方法的應用領域是語音識別,做出來的公司是微軟,而不是當時如日中天的谷歌。
  • FPGA的應用領域主要是深度學習和神經網絡算法
    打開APP FPGA的應用領域主要是深度學習和神經網絡算法 中關村在線 發表於 2019-09-06 17:50:27 我們可以看到,FPGA的應用領域主要是深度學習和神經網絡算法,而傳統的CPU更關注的是「通用」,GPU雖然更注重計算速度,但是其指令仍然是固定的
  • 資料|白話深度學習與TensorFlow
    基礎篇(第1~3章),講解了機器學習、深度學習與實踐的上下文知識,如基本的機器學習與深度學習算法,TensorFlow框架的安全與配置,簡單的深度學習實踐。該篇是閱讀和實踐的基石。原理與實踐篇(第4~8章),介紹「老牌」的深度學習網絡的數學原理和工程實現原理,尤其是第4章,如果能基本讀懂,後面的網絡實現層面的問題基本都可以迎刃而解。
  • 深度學習新應用:在PyTorch中用單個2D圖像創建3D模型
    選自Medium作者:Phúc Lê機器之心編譯參與:李詩萌、王淑婷深度學習在諸多 2D 圖像任務中表現出色,毋庸置疑。但如何將它應用於 3D 圖像問題中呢?文本通過探索,將深度學習擴展到了單個 2D 圖像的 3D 重建任務中,並成功實現了這一應用。
  • PyTorch版《動手學深度學習》開源了,最美DL書遇上最贊DL框架
    機器之心報導項目作者:ShusenTang參與:思想要入門最前沿的深度學習,想要玩最常見的深度學習框架?那就用 PyTorch 版的《動手學深度學習》吧,零基礎也能入門 DL。項目地址:https://github.com/ShusenTang/Dive-into-DL-PyTorch近年來,不論是計算機專業的學生,還是已在科技網際網路行業從業多年的技術人員和其他從業者,人們對深度學習的興趣從未如此高漲。但是,由於語言等因素,中文版本的優秀深度學習教材也是鳳毛麟角。
  • AR算法原理及深度學習在計算機視覺中的應用
    但一段時間內,真正掌握識別追蹤核心技術和應用的國內團隊並不多,甚至出現了專門提供AR識別SDK的小公司創業機會。那麼,AR識別技術背後的算法原理是什麼,以及計算機視覺與深度學習在AR中的應用熱點趨勢有哪些?本次分享會從圖像特徵提取、特徵匹配與圖像變換、深度學習算法等方面給你進行深入淺出的技術展現,讓AR識別技術不再成為難以逾越的技術壁壘。