百度研發全新語音識別系統準確率超谷歌

2021-01-09 中關村在線

北京時間12月19日消息，據《福布斯》雜誌網絡版報導，百度在美國康奈爾大學arXiv.org網站發表論文稱，已經研發出了全新語音識別系統Deep Speech，準確率超過了谷歌和蘋果的產品。

百度研發全新語音識別系統準確率超谷歌（圖片來自Forbes）

百度首席科學家吳恩達表示，Deep Speech使用了端對端的深度學習技術，如果按照衡量語音識別系統出錯率的標準基準，這套系統的準確性已經超越了蘋果、谷歌的語音識別系統。尤其是在噪音環境下，Deep Speech的表現更為出色。

目前，語音識別已經成為了一項重要技術，被蘋果、谷歌等公司整合到了相關服務中。吳恩達稱，Deep Speech在噪音環境下的語音識別出錯率比其他同類產品低10%以上。

據了解，百度團隊在Deep Speech的研發過程中搜集了9600人的7000個小時語音。為了提升噪音環境下的語音識別質量，百度向樣本中添加了約15種類型的噪音，從而將語音樣本中的數據擴充至10萬小時。之後，Deep Speech將在這種環境下學習識別語音。

http://news.zol.com.cn/497/4975111.html news.zol.com.cn true 中關村在線 http://news.zol.com.cn/497/4975111.html report 836 北京時間12月19日消息，據《福布斯》雜誌網絡版報導，百度在美國康奈爾大學arXiv.org網站發表論文稱，已經研發出了全新語音識別系統Deep Speech，準確率超過了谷歌和蘋果的產品。百度研發全新語音識別系統準確率超谷歌（圖片來自Forbes）百度首席科學家吳恩達...

相關焦點

百度上線英語語音輸入功能識別準確率高得驚人

百度自研平臺開發實踐上萬小時數據的聲學建模　　據百度技術人員介紹，Facemoji更新的英語語音輸入功能完全基於百度自研的深度學習平臺進行開發，使用上萬小時的語音數據進行模型訓練，識別結果快速準確。

百度發布DeepSpeech 嘈雜環境下識別率超谷歌蘋果

【環球科技綜合報導】據美國《福布斯》雜誌12月18日報導，自2013年5月人工智慧專家、「谷歌大腦之父」吳恩達(Andrew Ng)擔任百度首席科學家起，他就攜數名百度人工智慧實驗室的研究人員專注於語音識別技術的研究。

百度語音識別系統DeepSpeech 2:算法識別中英文

【環球科技綜合報導】據Inside Bigdata網站11月27日報導，百度研究院(baidu research)宣布矽谷人工智慧實驗室 (SVAIL)已經開發出了一種新型語音識別系統——深度語音識別系統(Deep Speech 2)。該系統能通過簡單學習算法準確的識別英語和漢語。

離線中英混合語音識別準確率超98%!百度輸入法帶你體驗「有網沒網...

這項基於中英文SMLTA模型的創新功能，讓用戶在弱網甚至無網絡環境中，依然可以順暢地進行中英文語音混輸，且識別準確率和有網絡時一樣優秀, 準確率超過98%。百度輸入法在此前推出的「在線中英自由說」功能基礎上，藉助AI技術賦能對語音輸入進行了又一次重大升級，大幅提升了用戶交互效率，全感官輸入2.0再迎重磅升級。

百度、斯坦福研究表明語音輸入比打字快3倍且準確率更高

中新網8月25日電近日，百度、史丹福大學和華盛頓大學共同完成了一項有關智慧型手機輸入方式對比的研究，該研究利用百度深度語音識別技術Deep Speech 2與32名測試者進行「人機對戰」。研究結果表明，智慧型手機利用語音輸入的速度比鍵盤輸入快3倍，且輸入準確率更高。

語音識別準確率行業第一,中英、方言混輸百度輸入法都沒在怕的!

業內首創的流式截斷多層注意力建模使其在語音輸入功能精準度方面表現突出，實現了在線語音識別、離線語音識別、中英自由說和方言自由說四大能力突出的「最強語音輸入」，語音輸入準確率及綜合表現體驗方面均處於行業首位。

百度輸入法提升手寫識別準確率至96%,字跡潦草也不怕

還以為手寫輸入速度慢，識別不準，甚至是「老年人專用」？No，百度輸入法要用實力顛覆你的想法。近日，百度輸入法AI功能全新升級，不僅推出新功能「AI滑行輸入」，同時也迎來了「手寫」和「方言自由說」兩大功能的重磅升級。

百度語音的「一小步」,可能是語音技術「登月計劃」的一大步

一方面，這是業界第一個基於注意力模型的在線語音產品，凸顯出百度在語音技術研發的領先；另一方面，作為 AI 的基礎功能，語音技術在百度 AI 技術賦能產品創新的作用越來越大，這也是當下百度 AI 戰略落地的重要觀察窗口。

百度語音識別技術突破巨頭崛起

百度對此做了對比實驗，最終發現Deep CNN架構不僅能夠顯著提升HMM語音識別系統的性能，而且也能提升CTC語音識別系統的性能。在此同時，百度也嘗試了將LSTM或GRU的循環隱層和CNN結合，這是相對較好的選擇。這也推導出了百度發布的新型語音識別架構：Deep CNN + LSTM + CTC。模型結構採用：Deep CNN + Deep LSTM。

百度語音識別新算法準確率提升超30%,鴻鵠晶片彰顯AI落地新打法

在發布會上，百度語音識別新算法和百度鴻鵠晶片的最新進展最引人注目。它們無疑是對進化和賦能兩詞最好的註解。完全端到端，深度學習再次顛覆語音識別在論壇上，百度語音首席架構師賈磊介紹了百度近一段時間的語音技術突破。

...學習語音識別系統DeepSpeech,嘈雜環境下識別率超Google、蘋果

不久前，百度的首席科學家吳恩達（Andrew Ng）在接受採訪時曾談到了百度最近人工智慧項目的進展情況，強調了近期百度重點是攻關語音識別。現在他們已經在這方面取得了突破。這項成果的名字叫做Deep Speech，是一款採用深度學習技術的語音識別系統系統。其獨特之處在於，它可以在飯店等嘈雜環境下實現將近81%的辨識準確率。 81%的準確率聽起來似乎不算高。但是同樣環境下，其他的商業版語音識別API，包括Bing、Google以及Wit.AI等的最高識別率也只有65%。相比之下這就算十分突出的表現了。

百度展現車聯網黑科技語音技術解放雙手

然而在感受了網際網路為汽車行業帶來的全新動力之後，會議現場的小夥伴們也近距離的感受到了百度語音技術這一超級「黑科技」——它不但能夠助力搭建車聯網系統，成為支撐下一個時代汽車控制的基礎技術，還展示了全方位改造所有電子設備與人類交互的邏輯，堪稱通過技術驅動未來加速到來。

百度語音識別功能以及優勢

百度語音識別是採用國際領先的流式端到端語音語言一體化建模算法，將語音快速準確識別為文字，支持手機應用語音交互、語音內容分析、機器人對話等多個場景。百度雲語音識別功能優勢：一、技術領先採用領先國際的流式端到端語音語言一體化建模方法，融合百度自然語言處理技術，近場中文普通話識別準確率達98%二、自助訓練專屬模型

超越整句的流式多級Attention:解密百度輸入法背後的語音識別模型

關於在線語音識別，百度發布了流式多級的截斷注意力建模（SMLTA），將在線語音識別準確率相對於上一代 Deep Peak 2 再次提升 15%，並實現了基於 SMLTA 模型的在線語音識別服務大規模上線應用。

中英混合和六大方言語音輕鬆識別,百度輸入法讓你想怎麼說就怎麼說

首先，百度輸入法洞察到年輕圈層的「中英文混合」表達方式，以及不同地區用戶的「方言輸入」需求，因此通過不斷優化技術和訓練新的識別模型，從而實現了「中英文混合識別」與「方言自動識別」兩大功能突破。讓用戶可以自由地使用自己熟悉的表達方式。據悉，百度輸入法是目前唯一實現了高精準中英文混合語音輸入、唯一實現了方言免切換語音輸入的輸入法產品。

中英混合和六大方言語音輕鬆識別百度輸入法讓你想怎麼說就怎麼說

百度語音識別上線新版本長語音轉寫告別時間限制

隨著用戶對移動端語音功能需求的增長，開發者也開始紛紛將產品接入語音功能。目前，開發者多通過第三方接入語音識別技術，以減少研發時間、降低研發成本。為解決這些痛點，百度基於原有語音識別技術，新增長語音識別功能，讓語音識別不再局限於60秒，並且為開發者免費開放。比如開發者可將長語音識別用於會議記錄、實時字幕和語音筆記等場景，讓產品實現不同時長的音頻轉換為文字信息，或將直播、視頻、現場演講等音頻進行實時字幕轉換等功能，方便後期文字處理和內容存檔，省去記錄的人力和時間成本，大幅提升了轉換效率，給予開發者和用戶更好的使用體驗。

百度研發全新語音識別系統準確率超谷歌

相關焦點

百度上線英語語音輸入功能識別準確率高得驚人

百度發布DeepSpeech 嘈雜環境下識別率超谷歌蘋果

百度語音識別系統DeepSpeech 2:算法識別中英文

離線中英混合語音識別準確率超98%!百度輸入法帶你體驗「有網沒網...

百度、斯坦福研究表明語音輸入比打字快3倍且準確率更高

語音識別準確率行業第一,中英、方言混輸百度輸入法都沒在怕的!

百度輸入法提升手寫識別準確率至96%,字跡潦草也不怕

百度語音的「一小步」,可能是語音技術「登月計劃」的一大步

百度語音識別技術突破巨頭崛起

百度語音識別新算法準確率提升超30%,鴻鵠晶片彰顯AI落地新打法

...學習語音識別系統DeepSpeech,嘈雜環境下識別率超Google、蘋果

百度展現車聯網黑科技語音技術解放雙手

百度語音識別功能以及優勢

超越整句的流式多級Attention:解密百度輸入法背後的語音識別模型

中英混合和六大方言語音輕鬆識別,百度輸入法讓你想怎麼說就怎麼說

中英混合和六大方言語音輕鬆識別百度輸入法讓你想怎麼說就怎麼說

百度語音識別上線新版本長語音轉寫告別時間限制

百度大腦產品上新&技術升級:圖像處理、智能寫作平臺、語音識別

百度AI開發者大會輸入法現場大飆Rap!高難度中英文混合語音識別...

百度輸入法AI新版正式上線增加「語音速記」「AR表情」全新AI功能

百度研發全新語音識別系統 準確率超谷歌

相關焦點

百度上線英語語音輸入功能識別準確率高得驚人

百度發布DeepSpeech 嘈雜環境下識別率超谷歌蘋果

百度語音識別系統DeepSpeech 2:算法識別中英文

離線中英混合語音識別準確率超98%!百度輸入法帶你體驗「有網沒網...

百度、斯坦福研究表明 語音輸入比打字快3倍且準確率更高

語音識別準確率行業第一,中英、方言混輸百度輸入法都沒在怕的!

百度輸入法提升手寫識別準確率至96%,字跡潦草也不怕

百度語音的「一小步」,可能是語音技術「登月計劃」的一大步

百度語音識別技術突破 巨頭崛起

百度語音識別新算法準確率提升超30%,鴻鵠晶片彰顯AI落地新打法

...學習語音識別系統DeepSpeech,嘈雜環境下識別率超Google、蘋果

百度展現車聯網黑科技 語音技術解放雙手

百度語音識別功能以及優勢

超越整句的流式多級Attention:解密百度輸入法背後的語音識別模型

中英混合和六大方言語音輕鬆識別,百度輸入法讓你想怎麼說就怎麼說

中英混合和六大方言語音輕鬆識別 百度輸入法讓你想怎麼說就怎麼說

百度語音識別上線新版本 長語音轉寫告別時間限制

百度大腦產品上新&技術升級:圖像處理、智能寫作平臺、語音識別

百度AI開發者大會輸入法現場大飆Rap!高難度中英文混合語音識別...

百度輸入法AI新版正式上線 增加「語音速記」「AR表情」全新AI功能

百度研發全新語音識別系統準確率超谷歌

百度、斯坦福研究表明語音輸入比打字快3倍且準確率更高

百度語音識別技術突破巨頭崛起

百度展現車聯網黑科技語音技術解放雙手

中英混合和六大方言語音輕鬆識別百度輸入法讓你想怎麼說就怎麼說

百度語音識別上線新版本長語音轉寫告別時間限制

百度輸入法AI新版正式上線增加「語音速記」「AR表情」全新AI功能