關於深度學習在各個領域的應用分析

2021-01-10 電子發燒友

深度學習網絡作為一個功能多樣的工具,雖然最初僅用於圖像分析,但它已逐漸被應用到各種不同的任務和領域中。高準確性和高處理速度,使得用戶無需成為領域專家即可對大型數據集執行複雜分析。

小編邀請 MathWorks 產品經理 Johanna 分享一些深度學習網絡的使用示例以供參考:

文本分析

在本例中,我們將分析推特數據,了解針對特定詞或短語的情感是積極的還是消極的。情感分析有很多實際的應用,如品牌推廣、競選活動和廣告營銷。

過去(目前仍然)進行情感分析通常使用機器學習。機器學習模型可分析單個詞,但深度學習網絡可應用於完整的句子,大大地提高了準確性。

訓練組由數以千計正面或負面的推特樣本組成。這裡是訓練示例:

我們通過去除「the」和「and」等「停滯詞」對數據進行了清理,這些詞對於算法的學習毫無用處。然後,我們上傳了長短期記憶(longshort-term memory, LSTM)網絡,它是一種遞歸神經網絡(recurrent neural network, RNN),可學習時間上的依賴關係。

LSTM 擅長對序列和時序數據進行分類。當分析文本時,LSTM 不僅會考慮單個詞,還會考慮句子結構和詞的組合。

網絡本身的 MATLAB 代碼非常簡單:

layers = [ sequenceInputLayer(inputSize)    

lstmLayer(outputSize,'OutputMode','last')

fullyConnectedLayer(numClasses)

softmaxLayer

classificationLayer ] 

在 GPU 上運行時,它訓練的非常快速,30 次迭代(完整遍歷一次所有數據)只需 6 分鐘。

完成對模型的訓練後,我們就可對新數據使用該模型。例如:我們可用它確定情感分數與股票價格之間是否相關。

語音識別

在本例中,我們需要將語音音頻文件分類到其對應的詞類。初看上去,此問題與圖像分類完全不同,但實則非常相似。頻譜是 1D 音頻文件中信號的二維顯示(圖 1)。我們可以將其用作對卷積神經網絡(CNN)的輸入,如同使用「真實」圖像一樣。

圖1. 上部:原始音頻信號。底部:對應頻譜。

spectrogram() 函數是一種將音頻文件轉換為其對應時頻的簡單方式。但是,語音是音頻處理的一種特定形式,其中重要特徵會包含在特定的頻率處。由於我們希望 CNN 專注於這些特定的頻率處,我們將使用美爾倒譜係數,該係數會鎖定跟語音最相關的頻率區域。

我們在希望分類的詞類之間均勻地分配訓練數據。

為減少偽正面情感,我們納入了容易與目標類別混淆的詞類。例如,如果目標詞是「on」,則「mom」、「dawn」和「won」等詞會放到「未知」類別中。網絡不需要知道這些詞是什麼,只需要知道它們不是目標詞。

我們隨後定義了一個 CNN。由於我們使用頻譜作為輸入值,因此 CNN 的結構可以是類似於用於圖像的結構。

模型訓練完畢後,它會將輸入圖像(頻譜圖)分類到相應的類別(圖 2)。驗證集的準確性約為 96%。

圖2. 詞「yes」的分類結果。

圖像降噪

小波和濾波器是(仍然是)降噪的常見方法。在本例中,我們將了解到經過預訓練的圖像降噪 CNN(DnCNN) 將如何應用於包含高斯噪聲的一組圖像中(圖 3)。

圖3. 添加了高斯噪聲的原始圖像。

我們首先下載一個包含高斯噪聲的圖像。

imshow(noisyRGB);

由於這是彩色圖像,但網絡是在灰階圖像上受訓的,因此該過程的唯一難點是需要將圖像分為三個不同通道:紅(R)、綠(G)、藍(B)。

oisyR = noisyRGB(:,:,1);

noisyG = noisyRGB(:,:,2);

noisyB = noisyRGB(:,:,3);

加載預先訓練的 DnCNN 網絡:

net= denoisingNetwork('dncnn');

現在我們可以使用它去除每個顏色通道中的噪聲。

denoisedR = denoiseImage(noisyR,net);

denoisedG = denoiseImage(noisyG,net);

denoisedB =denoiseImage(noisyB,net);

重新組合經過降噪處理的顏色通道,形成降噪後的 RGB 圖像。

denoisedRGB =cat(3,denoisedR,denoisedG,denoisedB);

imshow(denoisedRGB)

title('Denoised Image')

原始(非噪聲)圖像與降噪圖像的快速視覺對比圖說明結果是合理的(圖 4)。

圖4. 左:原始(非噪音)圖像。右:已降噪圖像。

讓我們放大幾個細節:

rect = [120 440  130  130];

cropped_orig = imcrop(RGB,rect);

cropped_denoise = imcrop(denoisedRGB,rect);

imshowpair(cropped_orig,cropped_denoise,'montage');

圖 5 中的放大視圖顯示降噪結果造成了一些負面影響。顯而易見,原始(非噪聲)圖像具有更高的清晰度,尤其是屋頂和草地。這一結果可能是可接受的,或者圖像需要進一步處理,這取決於它將用於哪些應用。

圖5. 放大視圖。

如果考慮使用 DnCNN 進行圖像降噪,請記住,它只能識別其接受過訓練的噪聲類型,在本例中是高斯噪聲。為提高靈活性,您可以使用 MATLAB 和 Deep Learning Toolbox 通過預定義層訓練自己的網絡,也可以訓練完全自定義的降噪神經網絡。

打開APP閱讀更多精彩內容

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容圖片侵權或者其他問題,請聯繫本站作侵刪。 侵權投訴

相關焦點

  • ARXIV:深度學習在金融領域中的應用 | 唧唧堂論文解析
    研究背景和問題股票市場預測、算法交易、信用風險評估、投資組合配置、資產定價和衍生品市場是ML(機器學習)研究人員專注於開發模型的領域,這些模型可以為金融行業解決一些問題。因此,關於這方面的文獻和其它出版物有很多。
  • 關於深度學習未來發展方向的六項預測
    關於深度學習未來發展方向的六項預測 隨著深度學習在大規模市場化應用領域的快速推進,其將與數據可視化、商務智能與預測分析一道成為眾多行業的立足基石。本文將與大家一同探討關於深度學習未來發展方向的六項預測。
  • 前沿研究丨深度學習在醫學超聲圖像分析中的應用
    中國工程院院刊《Engineering》刊發《深度學習在醫學超聲圖像分析中的應用綜述》一文,旨在全面而系統地總結深度學習在醫學超聲圖像分析中的應用,主要是在典型的任務及其在不同解剖結構中的應用。文章指出,在醫學超聲圖像分析中,深度學習展示了巨大的應用潛力,簡要介紹了一些流行的深度學習結構,討論了深度學習方法在超聲圖像分析的各種特定任務(如圖像分類、物體檢測與目標分割)中的應用。文章指出了深度學習在醫學超聲圖像分析應用中所面臨的挑戰以及潛在的發展趨勢。
  • 深度| 變革的開始,深度學習將如何改變醫療成像領域?
    選自IEEE Xplore機器之心編譯不久之前,IEEE Xplore 出了一期 Guest Editorial 探討深度學習在醫療圖像中的應用。點擊閱讀原文可查看英文原文。導語深度學習在數據分析方面正在呈現持續增長的趨勢,並被稱為 2013 年的 10 項突破性技術之一 [1]。
  • 自然語言處理深度學習的7個應用
    原文:7 Applications of Deep Learning for Natural Language Processing作者:Jason Brownlee翻譯:無阻我飛揚摘要:在這篇文章中,作者詳細介紹了自然語言處理深度學習的7種應用,以下是譯文。自然語言處理領域正在從統計方法轉變為神經網絡方法。
  • 一文全覽深度學習在計算機視覺領域的應用
    已經是很熱的深度學習,大家都看到不少精彩的故事,我就不一一重複。簡單的回顧的話,2006年Geoffrey Hinton的論文點燃了「這把火」,現在已經有不少人開始潑「冷水」了,主要是AI泡沫太大,而且深度學習不是包治百病的藥方。計算機視覺不是深度學習最早看到突破的領域,真正讓大家大吃一驚的顛覆傳統方法的應用領域是語音識別,做出來的公司是微軟,而不是當時如日中天的谷歌。
  • 關於MATLAB 圖像處理與深度學習的作用分析和介紹
    接下來我們將介紹如何創建該算法,並說明為何深度學習和圖像處理對於對象檢測和圖像分類同樣十分有用。 圖像處理與深度學習 我們重點介紹兩種技術: 圖像處理 按像素級別變換或者修改圖像。比如,過濾、模糊、去模糊和邊緣檢測等; 深度學習 通過學習樣本圖像自動識別圖像特點。近幾年,深度學習已經徹底改變了圖像處理領域。
  • FPGA的應用領域主要是深度學習和神經網絡算法
    打開APP FPGA的應用領域主要是深度學習和神經網絡算法 中關村在線 發表於 2019-09-06 17:50:27 我們可以看到,FPGA的應用領域主要是深度學習和神經網絡算法,而傳統的CPU更關注的是「通用」,GPU雖然更注重計算速度,但是其指令仍然是固定的
  • 超全深度學習細粒度圖像分析:項目、綜述、教程一網打盡
    選自arXiv作者:Xiu-Shen Wei、Jianxin Wu、Quan Cui機器之心編譯參與:李詩萌、張倩在本文中,來自曠視科技、南京大學和早稻田大學的研究者對基於深度學習的細粒度圖像分析進行了綜述,從細粒度圖像識別、檢索和生成三個方向展開論述。此外,他們還對該領域未來的發展方向進行了討論。
  • 最常見的深度學習應用
    深度學習技術在人工智慧領域目前佔有絕對的統治地位,因為相比於傳統的機器學習算法而言,深度學習在某些領域展現出了最接近人類所期望的智能效果,同時也在悄悄的走進我們的生活,例如刷臉支付、語音識別、智能翻譯、汽車上的智能輔助駕駛等等,這讓我們的生活開始慢慢智能化,那具體在哪些方向深度學習表現的最為耀眼吶
  • .| 深度學習理論與實戰:提高篇(5)——深度學習在語音識別中的應用
    編者按:本文節選自《深度學習理論與實戰:提高篇 》一書,原文連結http://fancyerii.github.io/2019/03/14/dl-book/。作者李理,環信人工智慧研發中心vp,有十多年自然語言處理和人工智慧研發經驗,主持研發過多款智能硬體的問答和對話系統,負責環信中文語義分析開放平臺和環信智慧機器人的設計與研發。以下為正文。提起深度學習的再次興起,大家首先可能會想到2012年AlexNet在圖像分類上的突破,但是最早深度學習的大規模應用發生在語音識別領域。
  • 盤點金融領域裡常用的深度學習模型
    我們跟隨 Sonam Srivastava 的分析,並展望深度學習在金融領域的運用前景。雖然金融是計算密集型最多的領域,但廣泛使用的金融模型:監督和無監督模型、基於狀態的模型、計量經濟學模型甚至隨機模型都受到過度擬合和啟發式問題帶來的影響,抽樣結果很差。因為金融生態圈異常複雜,其非線性充斥著大量的相互影響的因素。
  • 壓縮感知和深度學習在圖書情報領域的應用講座
    各會員單位圖書館、各位會員:應上海圖書館、上海市圖書館學會邀請,2019年2月15日上午,瑞典隆德大學(Lund University)王政軍博士將在上海圖書館做主題為「 『壓縮感知』 和深度學習在圖書情報領域的應用
  • 淺析深度學習在半導體行業的應用
    深度學習是機器學習的一個分支,而機器學習是AI的一個分支。可以預見,深度學習包含了較多的非連續性、顛覆性的技術與重大的機遇。但它不像1980年代的Lisp機器熱潮。因為Lisp程式語言並不適於一般編程人群。深度學習卻顛覆了編程,與往常的編程 ——即編程者寫代碼並將一組輸入轉化成一組輸出——不一樣的是:深度學習會消化許多輸入與輸出的示例,並學習該模式下的匹配。
  • 多智能體系統創始人 Victor Lesser:深度學習之外,AI 其他領域亦有...
    不過同時他也指出,雖然深度學習這些年的成功為 AI 領域帶來的影響巨大,但是其他傳統 AI 領域所取得的成果同樣也值得大家關注,也希望深度學習的光環不會因此而掩蓋掉其他 AI 領域所取得的成就。而在回顧自己的研究生涯時, Victor Lesser 特別強調了「熱愛」是他選擇這一研究領域並始終堅持在這一領域深耕的動力,而這也是他分享給後輩研究者的人生經驗和建議:熱愛永遠是最重要的驅動力。
  • 入門| 獻給新手的深度學習綜述
    用準確的話總結就是,深度學習是機器學習的一個子領域,它使用了多層次的非線性信息處理和抽象,用於有監督或無監督的特徵學習、表示、分類和模式識別。 深度學習即表徵學習是機器學習的一個分支或子領域,大多數人認為近代深度學習方法是從 2006 開始發展起來的。本文是關於最新的深度學習技術的綜述,主要推薦給即將涉足該領域的研究者。
  • iDST院長金榕IJCAI演講:阿里巴巴的深度學習應用(附PPT)
    :深度學習過去十年在各個領域都取得了巨大的成功,但當把深度學習技術應用到實際問題中時,常會遇到諸多挑戰。阿里巴巴作為在電商領域有諸多業務的企業,對深度學習有很大的需求,不可避免地當他們將深度學習應用到業務中時會遇到許多學界人士不可能遇到的問題。
  • 如何區分人工智慧、機器學習和深度學習?
    在深度學習網絡中,每一個節點層在前一層輸出的基礎上學習識別一組特定的特徵。隨著神經網絡深度增加,節點所能識別的特徵也就越來越複雜,因為每一層會整合併重組前一層的特徵。半監督學習介於監督學習與無監督學習之間。它主要考慮如何利用少量的標註樣本和大量的未標註樣本進行訓練和分類的問題。。增強學習通過觀察來學習做成如何的動作。每個動作都會對環境有所影響,學習對象根據觀察到的周圍環境的反饋來做出判斷。在傳統的機器學習領域,監督學習最大的問題是訓練數據標註成本比較高,而無監督學習應用範圍有限。
  • 關於深度學習你必須知道的幾個信息理論概念
    ,它對深度學習和人工智慧作出了重大貢獻,但很多人對它卻並不了解。在諸如卷積神經網絡的深度學習架構中,最終輸出的softmax層經常使用交叉熵作為損失函數。 交互信息交互信息是兩種概率分布或隨機變量之間相互依賴性的度量。它告訴我們另一個變量有多少關於該變量的信息。
  • 一文探討可解釋深度學習技術在醫療圖像診斷中的應用
    但是,這些方法都沒有在醫學領域中得以廣泛推廣,除了計算成本高、訓練樣本數據缺乏等因素外,深度學習方法本身的黑盒特性是阻礙其應用的主要原因。儘管深度學習方法有著比較完備的數學統計原理,但對於給定任務的知識表徵學習尚缺乏明確解釋。深度學習的黑盒特性以及檢查黑盒模型行為工具的缺乏影響了其在眾多領域中的應用,比如醫學領域以及金融領域、自動駕駛領域等。