雙麥陣列離線語音識別(音頻模塊)你一定不能錯過

2020-12-19 安服優AFUIoT

隨著人工智慧理論和技術日益成熟，應用領域也不斷擴大，該領域包括機器人、語言識別、圖像識別、自然語言處理和專家系統等的研究也越來越多的在實際產品中運用。今天我們將對作為AI功能最早也是運用最廣的語言識別做些分享。

語音識別在目前市場上以人機溝通交互和解放雙手的特點，在產品運用中更多的替代了遙控器的功能。最早也是大家最熟悉的就是在線的語音識別天貓精靈和小愛同學了。但由於在線的語音識別需要產品具備聯網功能及需要雲端後臺的支出，以至於單一產品需要實現語音識別功能需要做出巨大的投入，導致產品本身也較為臃腫。所以單一產品增加語音識別的功能用這樣的方式實現方式也變得難以落地。技術普及在於產品價格親民，而且價格親民在於技術易落地易實現。如此也迫使語音晶片的原廠考慮在本地做語音識別的處理，從而有了離線語音識別的晶片。離線語音識別同樣運用深度學習等技術，且其只需在本地進行運算，實現人機語音交互，而且具備實時的響應速度、無需聯網的特點，能更好的應用在大小家電、照明、車載、健康儀器、教育設備等行業。

安服優AFU-QSH-0013

安服優AFU-QSH-0013是用於智能語音處理的集成模塊，模塊上包括主晶片、FLASH存儲晶片、晶振和電源晶片（LDO），對外接口為31腳郵票孔形式。

該模塊用於基本的智能語音處理，功能完備，接口完整，非常適合以貼裝模組的形式與電子設備主板進行配合，提供離線語音識別與控制功能。

特點概要：

1.支持多級喚醒和多個本地固定詞命令詞，支持多通道/多麥克回聲消除功能;

2.內置深度定製的神經網絡處理單元、邏輯控制單元及特殊專利的其它輔助運算技術;

3.拾音距離：10m

4.反饋時間: 0.1 s

5.識別率：雙麥陣列技術，在60dB環境噪音下，識別率達到98%以上;

6.命令詞：支持自定義命令集;

7.支持命令字數量：200個

8.無需聯網、無需下載APP

參數詳情

尺寸：長23.0mmX寬20.0mmX高3.1mm

電源和功耗：5V電源供電，靜態電流85mA,播放時根據音量設定電流可達1A

揚聲器：可外接驅動1個4歐姆瓦揚聲器

麥克風：支持外接2個模擬駐極體麥克風或模擬矽麥克風、1路數字麥克風信號（立體聲）

PCB工藝：2層板

IO邏輯電平：3.3V

連接方式：31 pin腳郵票孔

交互步驟：喚醒詞-響應-命令語音輸入-識別-反饋（語音和電路動作）

反饋方式：語音輸出，執行電路控制

該產品可輕鬆應用於：風扇，空調，油煙機，集成灶，熱水器，馬桶，空氣淨化器，取暖桌，取暖器，茶吧機，掃地機，魔鏡，檯燈，聲控吊燈，聲控壁燈，紅外語音遙控器，車載音控，晾衣機，電動窗簾，窗簾、音控音箱，按摩椅，按摩器等。

相關焦點

應用、算法、晶片,「三位一體」淺析語音識別

遠場語音識別領域，由於存在強噪聲、迴響等問題，麥克風陣列波束成形仍然是主導方法。另外，現階段，基於深度學習的波束成形方法在自動特徵提取方面亦取得了眾多研究成果。3、識別建模語音識別本質上是音頻序列到文字序列轉化的過程，即在給定語音輸入的情況下，找到概率最大的文字序列。
輕鬆離線語音轉寫、視頻加字幕訊飛智能錄音筆SR502評測

此次SR502在SR501錄音、轉寫功能的基礎上，加入了離線轉寫功能，不需要網絡也可以提供語音轉寫文字的功能，同時還加入了高清攝像頭，支持OCR文字提取外，錄製的視頻還能實時生成字幕，非常方便。功能再升級：離線轉寫、OCR識別效率更高作為智能錄音筆，訊飛智能錄音筆SR502的系統是基於安卓8.1深度定製，和安卓手機的操作類似；內置全新升級的科大訊飛轉寫ED引擎，基於端到端的全新語音識別框架，除了純中文、純英文模式識別，同時支持中英混合識別場景，以及普通話-部分方言混合識別，實現語種無縫切換。
翻譯「黑科技」語音識別晶片讓你無所顧忌

打開APP 翻譯「黑科技」語音識別晶片讓你無所顧忌電子發燒友發表於 2019-03-11 17:16:20 準備來一場「說走就走的旅行
智能語音新技術搭載海凌科應用自定義150條語音命令控制喚醒詞

海凌科電子是集研發生產銷售於一體的高新技術企業，關鍵時刻優勢凸顯，能很快捕捉市場與物聯網模塊行業發展趨勢，在部門間的默契配合下，我們以最短的時間研發出了HLK-V20，並批量生產。從上圖可知，海凌科相較於HLK-V01，在各方面完勝，是一款優秀的離線語音控制模塊。
隨時喚醒語音助手,真不是一句話的事兒

在算法層面，思必馳提供了從 DSP 到 AP 的一整套集成方案，包括雙麥定向波束、命令詞檢測、骨傳導特徵檢測等多項技術方案，實現設備從低功耗喚醒、到喚醒驗證、再到聲紋識別的多級喚醒。
語音識別技術簡史

由於語音交互提供了更自然、更便利、更高效的溝通形式，語音必定將成為未來最主要的人機互動接口之一。當然，當前技術還存在很多不足，如對於強噪聲、超遠場、強幹擾、多語種、大詞彙等場景下的語音識別還需要很大的提升；另外，多人語音識別和離線語音識別也是當前需要重點解決的問題。雖然語音識別還無法做到無限制領域、無限制人群的應用，但是至少從應用實踐中我們看到了一些希望。
君子動嘴不動手,百度輸入法離線中英文,語音混輸不再困難

很多人是不是都習慣了用微信語音來進行文字的輸入，其實語音輸入確實是非常方便，特別是在目前AI功能加持下的語音，準確率與識別速度都很高，大大方便了內容輸入的速度，並且解放了雙手，動動嘴就可以進行輸入文字，特別是一些雙手不方便的場景，比如開車的時候就非常便捷。
智能語音識別技術入門系列(上)

這些內容對建立一個成功的語音對話系統都是很關鍵的，我們的關注重點主要是在語音識別系統。下面展示的語音識別系統的典型結構，語音識別系統主要由圖中四個部分組成：信號處理和特徵提取、聲學模型、語言模型和解碼搜索部分。信號處理和特徵提取部分是以音頻信號作為輸入，通過消除噪聲和信道失真對語音進行增強，為後面的聲學模型提取合適的有代表性的特徵向量。
靈雲多方言、多語種語音識別,這個技術很「要得」

商務洽談，面對中-英、法、日、韓等多語交流，你是否會覺得勞心費力，把握不住重點?　　會議中，需要做各種會議記錄的你，是否還在為面前普通話與地方方言不斷切換而一籌莫展?　　工作中，需要整理錄音的你，是否會為冗長的信息、模糊的發音而心煩不已?
如何通過低延遲語音響應改善用戶體驗和安全性

使用基於雲的系統來添加語音識別是一種選擇，但這會帶來用戶隱私和延遲問題。它們還要求最終用戶具有可訪問的網絡，並且對於許多智能家居和消費物聯網應用而言，這往往會產生高昂成本。本文引用地址：http://www.eepw.com.cn/article/202004/411608.htm為了幫助設計師應對這些挑戰，恩智浦將離線語音控制帶到了邊緣。
智能助手推動語音革命

短短幾年內，語音助手技術支持的人機互動將成為數十億人日常生活中司空見慣的事。針對智能語音助手而開發的技術所具備的用電特性，使得採用小型電池供電的智能音頻識別也能在許多其他應用中大展拳腳。想想你聽到的聲音如何影響你與世界的互動，就能預見到這項技術還在哪些領域發揮價值。除了日常生活中的應用，語音助手技術也將成為物聯網（IoT）和工業4.0智能機器傳感器系統的組成部分。
中科院劉斌:基於聯合對抗增強訓練的魯棒性端到端語音識別

「AI未來說·青年學術論壇」第四期「語音技術」專場已於2019年4月27日下午在中科院舉行。中科院劉斌為大家帶來報告《基於聯合對抗增強訓練的魯棒性端到端語音識別》。劉斌，中科院自動化研究所模式識別國家重點實驗室博士生，導師是劉文舉研究員。主要研究興趣為魯棒性語音識別、聲紋識別、語音喚醒、對抗學習。
從不溫不火到炙手可熱:語音識別技術簡史

由於語音交互提供了更自然、更便利、更高效的溝通形式，語音必定將成為未來最主要的人機互動接口之一。當然，當前技術還存在很多不足，如對於強噪聲、超遠場、強幹擾、多語種、大詞彙等場景下的語音識別還需要很大的提升;另外，多人語音識別和離線語音識別也是當前需要重點解決的問題。雖然語音識別還無法做到無限制領域、無限制人群的應用，但是至少從應用實踐中我們看到了一些希望。
搜狗奪食科大訊飛語音識別

在語音識別領域，代表語音技術圈領先水平的INTERSPEECH為促進語音識別技術的進步，舉辦了2020屆語音識別挑戰賽。在今年舉辦的INTERSPEECH 2020 DNS挑戰賽中，搜狗以4.01的MOS評分奪得冠軍。AI降噪技術取得的喜人成績，讓搜狗在語音識別技術的商業化推進中有了更足的底氣。
訊飛翻譯機3.0評測:新增藏、維離線翻譯功能

因此，訊飛翻譯機3.0帶來了端到端語音識別技術和端到端神經機器翻譯技術，其通過自研的INMT翻譯引擎技術，以句式文法、詞模文法、關鍵字等多重機制從而使得語音識別效果大幅提升，並且匹配用詞和語句的習慣，使上下文的語義理解，更為準確、真實的表達出翻譯效果。
沒有混合雙麥不算真降噪,酷狗M9頭戴降噪耳機全新上市

但大部分耳機實際上只是噱頭響亮，真正想要達到一定的降噪深度，需要真正的技術。酷狗音樂研發的前後混合雙麥降噪耳機——M9，採用ANC前饋加後饋麥克風，分別拾取耳機外部噪音和穿透耳機噪音，由DSP系統處理髮出和噪音完全相反的信號來產生抵消作用，以及music cancle技術還原音頻信號，降噪深度達到30分貝，覆蓋日常聽到的大部分聲音。
訊飛智能錄音筆SR502:離線轉寫+視頻字幕識別這才是生產力工具

在純中文、純英文模式識別之外，同時支持中英混合識別場景，以及普通話-部分方言混合識別。最多支持8種語言、12門方言、2種少數民族語言。離線轉寫+OCR識別提升效率看過外觀設計後，接下來實際體驗一下。訊飛智能錄音筆SR502用上了新升級的轉寫ED引擎。這套引擎基於端到端的全新語音識別框架，配上4核處理器，轉寫準確率達到了98%。

雙麥陣列離線語音識別(音頻模塊)你一定不能錯過

相關焦點

應用、算法、晶片,「三位一體」淺析語音識別

輕鬆離線語音轉寫、視頻加字幕 訊飛智能錄音筆SR502評測

翻譯「黑科技」語音識別晶片讓你無所顧忌

智能語音新技術 搭載海凌科應用自定義150條語音命令控制喚醒詞

隨時喚醒語音助手,真不是一句話的事兒

語音識別技術簡史

君子動嘴不動手,百度輸入法離線中英文,語音混輸不再困難

智能語音識別技術入門系列(上)

靈雲多方言、多語種語音識別,這個技術很「要得」

如何通過低延遲語音響應改善用戶體驗和安全性

智能助手推動語音革命

中科院劉斌:基於聯合對抗增強訓練的魯棒性端到端語音識別

從不溫不火到炙手可熱:語音識別技術簡史

搜狗奪食科大訊飛語音識別

訊飛翻譯機3.0評測:新增藏、維離線翻譯功能

沒有混合雙麥不算真降噪,酷狗M9頭戴降噪耳機全新上市

訊飛智能錄音筆SR502:離線轉寫+視頻字幕識別 這才是生產力工具

輕鬆離線語音轉寫、視頻加字幕訊飛智能錄音筆SR502評測

智能語音新技術搭載海凌科應用自定義150條語音命令控制喚醒詞

訊飛智能錄音筆SR502:離線轉寫+視頻字幕識別這才是生產力工具