Nuance語音識別技術

2020-12-11 電子產品世界

　　1.語音識別概述

本文引用地址：http://www.eepw.com.cn/article/268339.htm

　　語音識別技術，Automatic Speech Recognition，簡稱ASR，是一種讓機器聽懂人類語言的技術。語言是人類進行信息交流的最主要、最長用、最直接的方式。語音識別技術是實現人機對話的一項重大突破，在國外近年來發展十分迅速，其應用也逐步得到推廣。近幾年逐漸普及的IVR(自動電話應答)處理了不少簡單而又重複的諮詢工作，節省了不少人力，但這種按鍵式的語音自動應答卻讓客戶花費很多時間按指引來完成簡單的查詢，令用戶倍感不便。

　　語音識別無疑可以解決該方面的問題。語音識別系統的開發成功，充分發揮了計算機技術和網絡技術的優勢，採用先進的人機對話方式，擺脫電話按鍵的束縛，人們只要象平常一樣對著電話簡單的說出所需服務項目，即可輕鬆獲取自動系統提供的所需信息。

　　語音識別系統結構

　　2.語音識別應用

　　Nuance公司是自然語音接口軟體的佼佼者。使用自然語音接口軟體，人們可以通過電話方便安全地獲取信息、服務並進行交易。每天，千千萬萬的人通過撥打運行Nuance公司語音識別、語言理解和聲紋鑑別軟體的電話，進行出遊預訂、股票交易、與其它通訊媒體、企業和網際網路系統進行交往等活動。NUANCE的應用：美國航空、Bell Atlantic、Charles Schwab、家庭購物網絡、Lloyds TSB、Sears、UPS.

　　3.NUANCE語音識別特點

　　(1)海量詞彙、獨立於講話者的健壯識別功能

　　Nuance系統能可靠地對多種語言進行大詞彙量的識別，並可提供識別結果的置信度。該系統對商業上使用的大量詞彙提供最準確的語音識別技術。利用Nuance系統開發的應用程式，在市場上具有最高的準確率。生產中的應用程式經測試，準確性超過96%.

　　(2)基於主機的客戶/服務機結構

　　Nuance系統基於開放式客戶/服務機結構，特別為大型應用程式所需的健壯性和可伸縮性而設計。呼叫者的講話由客戶端收集，而識別和鑑別處理的負載被平均分配到網絡上的多個分開的伺服器上。

　　(3)N-Best處理

　　對於有些應用程式，可能需要識別引擎產生可能的識別結果集，而不是一個最好的結果。Nuance系統的N-best識別處理方法便有這個功能，它提供了可能的識別結果列表，並按可能性從高到低排列。

　　(4)語法概率

　　Nuance系統允許對呼叫者所講的特定詞語或短語的在語法中的概率進行指定。當被講的詞語或短語的概率可根據實際使用進行估計時，非常有用。對語法增加概率可提高識別的準確率和速度。

　　(5)降低噪音

　　當進來的呼叫包含穩定的背景噪音時，Nuance系統通過一種機制，使識別伺服器更準確地進行識別。識別伺服器將進來的話語進行增強，以有效地將語氣、嗡嗡聲、哼叫聲、噓噓聲等噪聲過濾。如果相當數量的電話均含有穩定的背景噪聲，比如在汽車上免提打電話時，這個機制效果較理想。

相關焦點

語音識別巨頭Nuance的救贖之法

隨著人工智慧技術的不斷突破，AI也更多的應用於人類生活。在談人工智慧的時候，一定不能不談語音識別，在近幾年來，藉助機器學習領域深度學習研究的發展，以及大數據語料的積累，語音識別技術得到突飛猛進的發展。那麼在談論語音識別技術時就不得不提起一家公司，Nuance 公司，它是全球最大的語音識別公司。你可能沒聽過它的名字，但是你肯定知道蘋果的Siri，Siri就是由Nuance和蘋果公司合作開發的智能語音交互系統。
小企業不配談技術門檻?從語音識別巨頭Nuance(NUAN.US)的興衰說起

全球超過80%的語音識別都使用過Nuance（NUAN.US）識別引擎技術，蘋果、亞馬遜、三星、諾基亞等科技巨頭都曾用過Nuance的語音技術解決方案。最巔峰時，Nuance的技術支持世界上50種語言，擁有近20億用戶。為什麼說曾經?因為Siri發布兩年後，Nuance非但沒有賺的盆滿缽滿，反而業績由盈轉虧，並從此一蹶不振。這其中究竟發生了什麼?
玩人工智慧的你必須知道的語音識別技術原理

在人工智慧快速發展的今天，語音識別開始成為很多設備的標配，語音識別開始被越來越多的人關注，國外微軟、蘋果、谷歌、nuance，國內的科大訊飛、思必馳等廠商都在研發語音識別新策略新算法，似乎人類與語音的自然交互漸行漸近。
語音識別技術簡史

但是，語音識別自誕生以來的半個多世紀，一直沒有在實際應用過程得到普遍認可，一方面這與語音識別的技術缺陷有關，其識別精度和速度都達不到實際應用的要求；另一方面，與業界對語音識別的期望過高有關，實際上語音識別與鍵盤、滑鼠或觸控螢幕等應是融合關係，而非替代關係。深度學習技術自 2009 年興起之後，已經取得了長足進步。
語音識別技術

自然語音交互語音識別的核心技術特點在說語音識別的特點之前，我問問大家目前接觸比較多的智能語音助手是哪些啊，是不是蘋果手機的Siri，還有智能音箱，還有一些智能車載語音助手以下是機哥在做可科大訊飛研究報告中的PPT內容，可以看到科大訊飛的核心技術就在於語音識別、語義理解、自然語音理解、機器翻譯、聲紋識別，其實在應用上的領域就比較好理解，比如智能可穿戴設備，智慧機器人，智慧型手機上的語音識別，最初級的應用就是語音識別，比如在法庭上的庭審記錄直接就可以把語音轉換為文字作為記錄，省去很大一部分的人力時間提升人工效率，智能語音客服可以回答80%左右的用戶問題等等
語音識別技術概述

除了傳統語音識別技術之外，基於深度學習的語音識別技術也逐漸發展起來。本文對廣義的自然語言處理應用領域之一的語音識別進行一次簡單的技術綜述。概述自動語音識別（Automatic Speech Recognition， ASR），也可以簡稱為語音識別。語音識別可以作為一種廣義的自然語言處理技術，是用於人與人、人與機器進行更順暢的交流的技術。
語音識別巨頭 Nuance 推出 ACI 技術,「無感體驗」讓醫生擺脫臨床...

Nuance公司開發了一種名為Ambient Clinical Intelligence（ACI）的技術，旨在讓醫生擺脫臨床文檔的負擔，臨床文檔往往會耗費醫生大量的精力。這家上市公司在今年2月份的HIMSS年度會議上公布了ACI技術。除了以醫療保健為目標，Nuance的對話和認知人工智慧產品還用於汽車、電信、金融服務和政府部門。
語音識別技術的發展及難點分析

語音識別技術的發展與機器進行語音交流，讓它聽明白你在說什麼。語音識別技術將人類這一曾經的夢想變成了現實。語音識別就好比「機器的聽覺系統」，該技術讓機器通過識別和理解，把語音信號轉變為相應的文本或命令。
語音識別技術原理概述!

聲學信號預處理作為語音識別的前提與基礎，語音信號的預處理過程至關重要。在最終進行模板匹配的時候，是將輸入語音信號的特徵參數同模板庫中的特徵參數進行對比，因此，只有在預處理階段得到能夠表徵語音信號本質特徵的特徵參數，才能夠將這些特徵參數進行匹配進行識別率高的語音識別。
NUANCE T9 Trace支持中文不間斷滑行輸入

Nuance T9 Trace滑行輸入技術的誕生，為觸控螢幕用戶增添了一種全新的體驗，使其可以在文本輸入過程領略更加順暢和便捷的感受。藉助該技術，只需要一個手指的一次無間斷滑行，就可以輕鬆準確的識別出鍵盤上單行、乃至其他位置的字符，並容許拼寫過程中重複字符識別。
語音識別的技術原理是什麼?

在開始語音識別之前，有時需要把首尾端的靜音切除，降低對後續步驟造成的幹擾。這個靜音切除的操作一般稱為VAD，需要用到信號處理的一些技術。要對聲音進行分析，需要對聲音分幀，也就是把聲音切開成一小段一小段，每小段稱為一幀。分幀操作一般不是簡單的切開，而是使用移動窗函數來實現，這裡不詳述。幀與幀之間一般是有交疊的，就像下圖這樣：
百度語音識別技術突破巨頭崛起

與學術研究不同，百度語音聚焦於技術的實際應用，技術難度和實現程度更高。針對語音識別產品而言，首先要具備在大規模語音資料庫上體現性能提升，其次就是具有適合語音在線識別產品運行的模型。正是基於以上這些優勢，讓百度語音識別真正成為大規模產業化的基礎，帶來真正的人機互動變革。
淺談語音識別技術的發展趨勢與應用前景

與說話人識別及說話人確認不同，後者嘗試識別或確認發出語音的說話人而非其中所包含的詞彙內容。　　語音識別技術的應用包括語音撥號、語音導航、室內設備控制、語音文檔檢索、簡單的聽寫數據錄入等。語音識別技術與其他自然語言處理技術如機器翻譯及語音合成技術相結合，可以構建出更加複雜的應用，例如語音到語音的翻譯。
語音識別技術離我們有多遠?

直到今天，像人一樣的機器人依然顯得遙不可及，但作為機器人的耳朵，語音識別技術近幾年有了許多突破性進展，終於從實驗室走進了我們的生活。首先，將隱馬爾科夫模型引入語音識別是該領域的重要突破。它有效體現了語音信號的隨機概率過程，它成熟的訓練算法又為語音模型的建立提供了基礎。
語音是如何變為文字的?詳解語音識別技術原理

在開始語音識別之前，有時需要把首尾端的靜音切除，降低對後續步驟造成的幹擾。這個靜音切除的操作一般稱為VAD，需要用到信號處理的一些技術。要對聲音進行分析，需要對聲音分幀，也就是把聲音切開成一小段一小段，每小段稱為一幀。分幀操作一般不是簡單的切開，而是使用移動窗函數來實現，這裡不詳述。幀與幀之間一般是有交疊的，就像下圖這樣：
Nuance瑞典市場推出語音廣告

【搜狐IT消息】8月20日消息，據國外媒體報導，智能語音技術公司Nuance已經向市場推出語音廣告，一家歐洲廣告商率先採用該項技術。　　今年4月，Nuance決定將其語音識別和自然語言理解技術帶入廣告領域。
Nuance在德國開設歐洲DRIVE實驗室創新汽車助手

新設立的DRIVE 實驗室的主要研究領域包括：●汽車內外的人性化交互 - 測試駕駛員和乘客對於使駕駛體驗更加人性化技術的回饋。其中包括情感識別技術，使移動助手能夠通過面部和語音識別了解複雜的認知和情感狀態，並相應地進行行為調整。
語音識別技術發展史與行業最佳實踐全解析

在人工智慧技術的探索徵程裡,語音語義識別技術一直扮演著先驅的角色,不管是在技術探索還是商業落地方面都走在了前面。近兩年來隨著深度學習技術的進一步深入,其識別準確率更是得以大大提升。為教育、客服、電信等傳統行業的產業升級帶來了一大助力,在車載、家居、醫療、智能硬體等領域又開闢出了新的商業應用探索實踐。語音語義技術目前發展到了哪個階段?
百度的語音識別技術或將超越谷歌和蘋果

但是，現在他終於忍不住披露了更出色的語音識別技術，這是智慧型手機時代引人關注的關鍵領域。具體來說，Deep Speech在車內或人群中等嘈雜環境下比其他語音識別系統的表現更出色。當然，關鍵是讓語音識別技術在現實世界中真正發揮作用。
SoapBox Lab開發兒童語音識別技術,打造最懂孩子的語音助手

開發兒童語音識別軟體，創建獨特的兒童語音數據集，對於兒童語音和行為模式的理解互相結合，專屬的算法能隨時識別出兒童的語音，保護兒童的安全。近日，極客爸爸了解到，語音識別研究過程中會發現成人建立的語音庫並不能很好地理解兒童語音，很多存在著識別錯誤的問題。為解決這種尷尬的情況，愛爾蘭初創公司SoapBox Lab致力於「為孩童創造世界上最精準的語音識別技術」。

Nuance語音識別技術

相關焦點

語音識別巨頭Nuance的救贖之法

小企業不配談技術門檻?從語音識別巨頭Nuance(NUAN.US)的興衰說起

玩人工智慧的你必須知道的語音識別技術原理

語音識別技術簡史

語音識別技術

語音識別技術概述

語音識別巨頭 Nuance 推出 ACI 技術,「無感體驗」讓醫生擺脫臨床...

語音識別技術的發展及難點分析

語音識別技術原理概述!

NUANCE T9 Trace支持中文不間斷滑行輸入

語音識別的技術原理是什麼?

百度語音識別技術突破 巨頭崛起

淺談語音識別技術的發展趨勢與應用前景

語音識別技術離我們有多遠?

語音是如何變為文字的?詳解語音識別技術原理

Nuance瑞典市場推出語音廣告

Nuance在德國開設歐洲DRIVE實驗室 創新汽車助手

語音識別技術發展史與行業最佳實踐全解析

百度的語音識別技術或將超越谷歌和蘋果

SoapBox Lab開發兒童語音識別技術,打造最懂孩子的語音助手

百度語音識別技術突破巨頭崛起

Nuance在德國開設歐洲DRIVE實驗室創新汽車助手