基於非特定人車載音響語音控制系統的設計與實現

2021-01-11 電子產品世界

隨著現代電子技術的發展，越來越多的車載電器被加入到車身電子行列中，其在使得汽車性能改善的同時，增加了汽車駕駛操作的複雜度，也給行車過程帶來了不安全的隱患。隨著語音識別算法的改進和新一代專用語音處理晶片的問世，出現了使用語音控制代替手動控制的車載電器，從而減輕駕駛員手動操作負擔，大大提高行車安全係數。
　目前我國的車身電子語音控制主要集中在汽車導航系統的應用上，沒有充分發揮語音識別技術在車身電子中的應用價值。本文首次提出了一種的以專用語音處理晶片UniSpeech-SDA80D51為核心組成非特定人車載音響語音控制系統的設計方案，並實現了系統樣機的研製。該系統在江淮同悅SL1102C1型車載音響上進行了語音控制實驗，實驗數據表明系統語音識別率可達到95%，為下一步項目產品化開發奠定了基礎。
1 車載音響語音控制系統
　非特定人車載音響語音控制系統結構框圖如圖1 所示。

本文引用地址：http://www.eepw.com.cn/article/197388.htm

　系統的主要功能是：語音採集模塊(由定向拾音器組成)用於採集駕駛員發出的語音命令信號，由語音識別模塊實現信號的A/D轉換，並對轉換的數位訊號進行語音識別處理，最終輸出與語音命令相對應的詞條編碼信息。控制模塊對接收的詞條編碼信號進行邏輯分析與處理並產生對應的控制信號，通過系統I/O接口驅動車載音響動作，完成駕駛員的語音命令。
1.1 語音識別模塊
　語音識別模塊主要由UniSpeech-SDA80D51晶片及外圍電路組成。
SDA80D51是德國Infineon公司專為語音識別和語音處理應用領域新推出的專用晶片，採用高集成度的SoC系統結構，以0.18 μm半導體工藝製造，SDA80D51的基本結構如圖2所示。

　SDA80D51片內集成了直接雙訪問快速SRAM、2路ADC和2路DAC、多種通信接口和通用GPIO等部件。SDA80D51工作方式以M8051為主控制晶片，主要完成系統配置和SPI、PWM、I2C、GPIO等接口的控制以及語音數據的傳輸工作；DSP核心OAK為協處理器，完成語音識別算法、語音編解碼算法等語音處理工作。
非特定人語音信號由定向拾音器輸入，經過SDA80D51內部的數據採集模塊進行A/D轉換，再經過識別程序的預處理、端點檢測、特徵參數提取、模板匹配等處理，選擇識別詞表中最接近的詞條序號作為識別結果，識別結果通過GPIO口輸出。
1.2 控制模塊
　控制模塊由MCU和模擬開關電路構成，本模塊主要完成對語音識別模塊輸出的詞條編碼信號進行邏輯分析和處理，通過模擬開關電路產生對應功能的控制信號控制音響的動作。其中MCU選用美國ATMEL公司產品AT89S51，綜合AT89S51輸出I/O信號電壓特性和SL1102C1音響控制面板電阻式分流鍵盤電路的特點，確定使用繼電器模擬SL1102C1控制面板按鍵的閉合和斷開動作。AT89S51和繼電器模擬開關電路原理圖如圖3所示。

1.3 音響模塊
　本設計是基於SL1102C1型汽車音響。SL1102C1是專門為中檔轎車設計的汽車音響，具有MP3播放、收音機和顯示時間等功能，目前大量使用在江淮同悅轎車上。SL1102C1前板共有開關機/靜音、音效、播放/暫停等15個按鍵和一個用來調節音量的編碼開關。
　SL1102C1前板上的按鍵為電壓採樣識別方式，按鍵包含短按和長按兩種動作，AT89S51輸出電壓為TTL電平，直接採用I/O信號驅動音響按鍵動作容易引起誤識別，造成系統誤操作，因此本文採用圖3所示的模擬開關電路，很好地解決了上述問題。當AT89S51接收到語音編碼信號後，立即進行邏輯分析並輸出對應的控制信號驅動相應繼電器吸合模擬按鍵動作，按鍵的短按和長按功能是通過軟體實現的。
　模擬開關電路還適用於SL1102C1前板上的編碼開關，編碼開關具有音量調節功能，其工作原理如圖4所示。
由圖4可知，編碼開關上有A、B、C三個端子，開關旋鈕左、右旋轉時，A、B端子輸出對應的脈衝信號。當MCU收到操作編碼開關的語音命令信號後，驅動繼電器動作，控制端子A、B輸出信號，模擬開關旋鈕功能。

2 系統軟體設計
　系統的軟體包括非特定人語音識別模塊和邏輯控制模塊。
2.1 非特定人語音識別模塊
　非特定人語音識別模塊基於HMM模型算法。該算法通過對大量語音數據進行數據統計，建立識別詞條的統計模型語音庫，然後從待識別語音中提取特徵，與模型庫進行匹配，由比較匹配分數得到識別結果，並通過SDA80D51的GPIO口輸出識別結果對應的詞條編碼信號。語音識別模塊主要由信號預處理、特徵參數提取、模型匹配和Viterbi算法部分組成，非特定人語音識別模塊框圖如圖5所示。

2.1.1 信號預處理
　信號預處理部分主要完成輸入語音信號的採樣、模/數轉換功能。A/D變換由SDA80D51內嵌12位A/D變換器實現，採樣頻率固定為8 kHz。
2.1.2 特徵參數提取
　特徵參數提取基於語音幀，採用分幀提取特片。先對語音信號進行重疊分幀，前一幀和後一幀重疊一半(幀信號重疊是體現相鄰兩幀數據之間的相關性)，幀長為25 ms，對每幀提取一次語音特片。
語音信號是聲道響應和聲門激勵信號的卷積。分別求聲道傳輸函數和聲門激勵信號的對數頻率響應，由於聲門激勵信號的頻率響應和聲道傳輸函數在頻譜的變化快慢不同，如將頻率軸視為時間軸，則聲門激勵信號的頻率響應對應於「高頻」區；而聲道傳輸函數對應於「低頻」區，處在不同區域就易於分辨。
MFCC參數屬於感知頻域倒譜參數，反映了語音信號短時幅度譜的特徵。p維MFCC參數的具體計算提取過程如下：
　(1)用DFFT對每幀s(n：m)計算線性頻譜，計算頻譜模的平方為功率譜；
　(2)功率譜經過Mel濾波器組獲得D個參數X(i)，D是Mel濾波器組中三角形濾波器的數量；
　(3)對X(i)做對數運算和離散餘弦變換，餘弦變換計算公式如下：

　式中的Y(i)是第i個Mel濾波器的對數能量輸出，i=1，2，…，D。
2.1.3 HMM語音識別算法
　隱馬爾可夫採用概率統計模型描述語音信號，HMM模型建立在Markov鏈基礎上，使用Markov鏈來模擬語音信號統計特性的變化。HMM模型為雙重隨機過程，其一是Markov鏈，由(π，A)描述狀態的轉移，輸出為狀態序列；另一個是隨機過程，由B描述，在統計意義上B反映了狀態和觀察值之間的對應關係，輸出為觀察值矢量序列。Markov鏈中狀態和時間參數都是離散的Markov過程。
　Viterbi算法是一種幀同步動態規整算法，在給定觀察值序列和模型時，Viterbi算法給出了一個概率密度P(Q，O|λ)最大的狀態序列。Viterbi算法包括初始化、遞推、終止、路徑回溯和確定最佳狀態序列。

相關焦點

語音識別在生活中的七個經典應用

本文引用地址：http://www.eepw.com.cn/article/201706/350998.htm基於聲紋識別的通用語音控制系統設計隨著物聯網的發展，對家庭電器的控制將會有更多的發展，而語音作為一種自然簡單的方法將是一種有效便捷的控制方式。如果可以把語音控制與安全控制結合起來，系統就變得更自然直接更人性化了。
生活中的七個語音識別經典應用

語音識別技術主要包括特徵提取技術、模式匹配準則及模型訓練技術三個方面。基於聲紋識別的通用語音控制系統設計隨著物聯網的發展，對家庭電器的控制將會有更多的發展，而語音作為一種自然簡單的方法將是一種有效便捷的控制方式。如果可以把語音控制與安全控制結合起來，系統就變得更自然直接更人性化了。
基於嵌入式Linux的語音識別系統硬軟體設計

圖1語音識別原理框圖　　語音識別技術可分為：特定人識別和非特定人識別兩種。特定人識別是指需要對待識別人的語音進行採集訓練，識別對象為專門的人;非特定人識別是指識別對象為大多數用戶，一般要採集多個人的語音進行錄音、訓練和學習，從而達到較高的識別率。　　在實際應用中，現代技術開發嵌入式語音識別有兩種實現方式：調入嵌入式語音開發包和外擴語音識別晶片。
基於DSP的語音識別系統的實現及分析

針對發音人範圍來分，分為特定人語音識別、非特定人語音識別、自適應語音識別。　　本文主要研究非特定人小詞彙量連續語音實時識別系統。　　1.1 語音識別系統　　語音識別本質上是一種模式識別的過程，即未知語音的模式與已知語音的參考模式逐一進行比較，最佳匹配的參考模式被作為識別結果。
基於片上系統SoC的孤立詞語音識別算法設計

它具有速度快，體積小，成本低，可擴展性強等優點，有著廣泛的應用前景，已經成為語音識別技術應用發展的一個重要方向[2-3]。研究和開發應用於片上系統SoC晶片的語音識別算法有著非常重要的意義。2. 孤立詞語音識別系統孤立詞語音識別系統應用於嵌入式控制領域，例如數字家庭控制、車載語音控制和智能語音可控玩具等。
基於DSP和FPGA的機器人聲控系統設計與實現

一個體積小、低功耗、高速度能完成特定範圍語音識別和動作指令的機器人系統的研製具有很大的實際意義。 2 系統硬體總體設計系統的硬體功能是實現語音指令的採集和步進電機的驅動控制，為系統軟體提供開發和調試平臺。如圖1所示。
基於Julius的機器人語音識別系統構建

語音識別技術的發展，使得這一理想得以實現，把語音識別技術與機器人控制技術相結合，正成為目前研究的熱點，不但具有較好的理論意義，而且有較大的實用價值。　　語音識別技術應用於機器人系統大多是針對特定的環境，設計出語音命令來進行控制的。
從原理入手,解析基於DSP的漢字語音識別系統的實現方式

語音識別是機器通過識別和理解過程把語音信號轉變為相應的文本文件或命令的高技術。作為專門的研究領域，語音識別又是一門交叉學科，它與聲學、語音學、語言學、數位訊號處理理論、資訊理論、計算機科學等眾多學科緊密相連。語音識別經過四十多年的發展，已經顯示出巨大的應用前景。本文從實現原理入手，介紹語音識別系統的實現方式。
基於DSP的漢字語音識別系統的實現方式解析

語音識別是機器通過識別和理解過程把語音信號轉變為相應的文本文件或命令的高技術。作為專門的研究領域，語音識別又是一門交叉學科，它與聲學、語音學、語言學、數位訊號處理理論、資訊理論、計算機科學等眾多學科緊密相連。語音識別經過四十多年的發展，已經顯示出巨大的應用前景。本文從實現原理入手，介紹語音識別系統的實現方式。
基於Atmega128的智能教學無人車控制系統設計

摘要：針對市場上大多數教學無人車設計採用單片機單一控制導致其功能擴展性弱、靈活度低等問題，設計了一種基於Atmega128單片機和無線通信的智能教學無人車控制系統，該系統包括PC機控制部分和無人車控制部分，通過PC控制端軟體可以經無線通信模塊實現對無人車的準確運動控制。
語音識別技術原理全面解析

動態時間規整算法（Dynamic Time Warping，DTW）是在非特定人語音識別中一種簡單有效的方法，該算法基於動態規劃的思想，解決了發音長短不一的模板匹配問題，是語音識別技術中出現較早、較常用的一種算法。
基於DSP與FPGA的機器人聲控系統設計方案

本次設計採用了性價比較高的數位訊號處理晶片TMS320VC5509作為語音識別處理器，具有較快的處理速度，使機器人在脫機狀態下，獨立完成複雜的語音信號處理和動作指令控制，FPGA系統的開發降低了時序控制電路和邏輯電路在PCB板所佔的面積，使機器人的"大腦"的語音處理部分微型化、低功耗。一個體積小、低功耗、高速度能完成特定範圍語音識別和動作指令的機器人系統的研製具有很大的實際意義。
電能質量監測系統的設計實現和車載應用

萬用表、電流表、示波器等可在一定程度滿足應用需求，但均有其使用限制，例如萬用表和電流表只能實現部分電氣參數的實時測量，無法進行記錄；示波器由於輸入端為共地接口，難以滿足同時測試多路交流電壓的要求。專業廠商的專業電能質量記錄儀可滿足電能質量檢測需求，但價格高昂，難以滿足特定應用要求或定製化需求，例如車載運行記錄等。
車載MP3音響系統―――汽車+MP3=DATUM(丹丁) MH328

這就是來自韓國JNC的DATUM（丹丁） MH328 MP3，她獨有的「車載MP3音響系統」能滿足我們一切的願望。和蘋果TransPod有異曲同工之妙的MH328MP3，開創了超炫的「汽車＋MP3」新時代的發展空間，她可將MP3播放器內存儲的音樂通過FM廣播方式發送，再利用車內電臺接收，通過車內音響播放。
基於DSP的語音識別計算器電路設計

根據實際的應用，語音識別可以分為：特定人與非特定人的識別、孤立詞與連續詞的識別、中小詞彙量與無限詞彙量的識別。考慮到成本及使用範圍因素，本文中應用的是基於TMS320VC5509 DSP的非特定人、孤立詞、小詞彙量的語音識別系統。
電能質量監測系統的設計實現和車載應用詳解

萬用表、電流表、示波器等可在一定程度滿足應用需求，但均有其使用限制，例如萬用表和電流表只能實現部分電氣參數的實時測量，無法進行記錄；示波器由於輸入端為共地接口，難以滿足同時測試多路交流電壓的要求。專業廠商的專業電能質量記錄儀可滿足電能質量檢測需求，但價格高昂，難以滿足特定應用要求或定製化需求，例如車載運行記錄等。
以SPCE061A單片機為主控制器的語音控制家用電器系統設計

它能夠實現對家電設備的自動控制和管理、對家庭的安全進行監測報警，能夠為用戶提供安全舒適、高效便利的生活環境。本文結合語音識別技術，利用SPCE061A 豐富的語音處理功能，在已有的電力線和電話線的基礎上，設計了一套智能家居系統，該系統結構簡單、功能完善並且具有較高的性價比。
基於C語言的設計流優化語音識別晶片結構設計

據預測，市場對語音控制應用設備的需求將急劇增長，其推動力來自電話機市場。電話機將更多地採用語音命令進行控制。其他應用領域包括玩具和手持設備如計算器、語音控制的安全系統、家用電器及車載設備(立體聲、視窗、環境控制、車燈和導航控制)。本文從可復用和優化晶片空間的角度出發介紹語音識別晶片結構設計的種種考慮，其思路有利於開發一系列其它語音識別晶片。
基於FPGA的語音智能操控系統

基於FPGA實現語音智能操控系統具有：（一）設計靈活、操作方便、快捷（二）準確度高，工作範圍大（三）可隨時用語音操控帶有遙控裝置的用電器（四）可擴展性強，增強了系統的外接功能（五）便於更新和系統升級，可隨時嵌入更新系統程序
西北工業大學教授張雯:空間主動噪聲控制如何實現?| CCF-GAIR 2020

非常高興今天能在這裡和大家分享一些我們近期的工作，我今天報告的主題是開放空間聲場主動控制技術。眾所周知，當下智能語音交互產品形態眾多，數目呈指數增長，應用領域非常廣泛，產品線涉及到手機終端、智能可穿戴設備、智能音響、智能大屏、智能家居以及車載環境內的導航交互等等。實際的語音交互環境是非常複雜的，比如說聲源可能處於近場或是遠場，同一環境下可能存在多個聲源，有幹擾、噪聲和混響等等。

基於非特定人車載音響語音控制系統的設計與實現

相關焦點

語音識別在生活中的七個經典應用

生活中的七個語音識別經典應用

基於嵌入式Linux的語音識別系統硬軟體設計

基於DSP的語音識別系統的實現及分析

基於片上系統SoC的孤立詞語音識別算法設計

基於DSP和FPGA的機器人聲控系統設計與實現

基於Julius的機器人語音識別系統構建

從原理入手,解析基於DSP的漢字語音識別系統的實現方式

基於DSP的漢字語音識別系統的實現方式解析

基於Atmega128的智能教學無人車控制系統設計

語音識別技術原理全面解析

基於DSP與FPGA的機器人聲控系統設計方案

電能質量監測系統的設計實現和車載應用

車載MP3音響系統―――汽車+MP3=DATUM(丹丁) MH328

基於DSP的語音識別計算器電路設計

電能質量監測系統的設計實現和車載應用詳解

以SPCE061A單片機為主控制器的語音控制家用電器系統設計

基於C語言的設計流優化語音識別晶片結構設計

基於FPGA的語音智能操控系統

西北工業大學教授張雯:空間主動噪聲控制如何實現?| CCF-GAIR 2020