基於FPGA的語音智能操控系統

2021-01-08 電子產品世界

本文引用地址:http://www.eepw.com.cn/article/201706/348697.htm

設計摘要:

1、設計意圖

科學技術水平的發展,使人們的生活受到潛移默化的影響,並逐漸改變人們的生活習慣,不斷地提高人們的生活質量。比如由於全自動洗衣機、微波爐等智能化設備的出現,我們不必按鍵操控每一步過程,機器可以自動完成整個過程,用戶也可以遙控他們。

智能化所帶來的方便、快捷帶給人們更加舒適的生活,但是隨著家用電器的不斷增多,需要的遙控器也不斷增多,給人們造成許多的不便,因此,一種能夠解放人們雙手並且實時、快速、方便的語音智能操控系統的概念應運而生。語音智能操控系統可以取代多個遙控器,當需要控制某一家電時,只需說出所需調節的內容(如,空調開,溫度25℃),語音智能操控系統就能通過對操控者的語音識別,完成匹配並發出遙控信息完成相應的操作。

基於FPGA實現語音智能操控系統具有:

(一)設計靈活、操作方便、快捷

(二)準確度高,工作範圍大

(三)可隨時用語音操控帶有遙控裝置的用電器

(四)可擴展性強,增強了系統的外接功能

(五)便於更新和系統升級,可隨時嵌入更新系統程序

(六)設計周期短、開發費用低、功耗低等獨特優點。

2、適用範圍

語音智能操控系統主要控制的家用電器有兩類,第一類是開關型家電,包括家居照明、飲水機、電飯煲、抽風機、充電器、電風扇等;第二類是紅外遙控型家電,包括空調、電視機、DVD、電動窗簾、電動閘門等。還有很多有待開發的應用領域,範圍很廣。

3、主板

該系統利用FPGA板塊,可自主嵌入應用程式,用戶可根據自己需求植入語音信息,以待匹配。如果用戶不需要某項語音匹配信息,可刪除,靈活性非常高。同時,由FPGA主板設計ASIC電路,具有設計周期短、開發費用低、功耗低的優點。系統控制核心都在FPGA內部實現,可以極為方便的更新和升級系統,大大的提高了系統的通用性和可提高性。

功能描述:

由FPGA實現語音智能操控系統的系統構架圖如圖2-1所示,它是以FPGA為主板,嵌入語音識別系統並結合紅外遙控系統完成的智能操控系統。

圖2‑1 由FPGA實現語音智能操控系統的系統構架圖

FPGA中嵌入的語音識別系統分為兩種工作模式:訓練模式和識別模式首先,用戶在訓練模式下,完成相應的語音信息的輸入和特徵存儲工作,建立完整的語音信息特徵資料庫。然後,在識別模式下,由語音輸入設備輸入語音信息進行比對,匹配後即發出相應操作的信號,遙控設備。系統框圖如圖2-2所示

圖2-2 語音識別系統的框圖

該系統分為五個模塊:語音信息特徵提取模塊、語音信息特徵資料庫建立模塊、語音信息輸入採集與預處理模塊、語音信息比對模塊、操控指令連接發送模塊。

1、語音信息特徵提取模塊,即對接收到的語音信息通過語音識別算法提取相關特徵匹配數據,其中用到語音信息輸入採集模塊。

2、語音信息特徵資料庫建立模塊,即對特徵提取模塊所得匹配數據存儲到存儲器中,以備對比匹配使用。

3、語音信息輸入採集模塊,即通過麥克風輸入語音信息,當滿足要求時,通過信息特徵提取模塊對輸入的語音信息的特徵數據進行提取,保存到緩衝區,等待對比。

4、語音信息比對模塊,即用保存到緩衝區的特徵數據和資料庫中的數據進行比對,是否與某一數據匹配。

5、操控指令連接發送模塊,即當輸入的語音信息與某一庫存信息匹配時,就完成主板與紅外發射裝置的連接並發出相應的操作指令信息,完成操作。

整個過程由嵌入到FPGA晶片內的程序完成。另外,基於NiosII的SOPC系統幫助我們完成了上述功能。同時,我們通過開發工具SOPC Builder,在FPGA上創建軟硬體開發的基礎平臺,可以很快的將硬體系統(包括處理器、存儲器、外設接口和用戶邏輯電路)與常規軟體集成在單一可編程晶片中。而且,SOPC Builder 還提供了標準的接口方式以便我們將自己的外圍電路做成Nios Ⅱ軟核可以添加的外設模塊。這種設計方式更加方便了我們對系統的調試。

性能參數:

系統的性能參數:

麥克風參數:

靈敏度:-34~2dB(0dB=1V/Pa at 1kHz)

頻率響應:20Hz~20KHz

阻抗:50Ω±30% (at 1kHz) 負載阻抗:≥1000Ω

等效噪聲級:13/14/15dB

信噪比:81/80/79 dB

最大聲壓級:135dB (at 1kHz≤1% T.H.D)

耗電電流:3mA

2、 工作環境:

工作溫度:

相對溼度:

3、 通信協議參數:

波特率:9600bit/s;起始位;1bit;

數據位:8bit; 停止位:1bit.

4、 算法參數:

5、 耗時:

6、 系統資源利用情況:

設計結構:

本設計以FPGA 系列Spartan-6開發板為設計平臺,開發板、麥克風、紅外模塊組成完整的硬體平臺,整個系統簡潔美觀,無雜亂的連線,系統中語音採集和控制輸出由外圍設備實現外,其他部分處理全部有FPGA系列Spartan-6實現。圖4-1為基於FPGA實現語音智能操控系統硬體設計圖。

圖4-1 基於FPGA實現語音智能操控系統的硬體設計圖

系統上電後,軟體即開始運行一系列初始化程序完成系統的初始化工作,然後要求用戶選擇工作模式,工作模式分為訓練模式和識別模式,模式的選擇由用戶通過主板的按鍵進行,若不選擇,則默認為進入識別模式。下面是這兩種工作模式軟體流程的簡要說明。圖4-2是語音智能操控系統總體設計流程圖。

圖4-2語音智能操控系統總體設計流程圖

訓練模式:在該模式下,對語音信息進行訓練(就是把所用到的目標語音信息特徵數據進行存儲,建立資料庫)。進入訓練模式後,用戶根據指示燈的提示,輸入相應的語音信息,計算機內部程序對輸入的語音信息進行特徵提取並將特徵數據存入緩衝區,每一遍提取後都會進行檢測,判斷是否充分,若不充分,返回上一單元繼續提取,直到充分為止。然後進行數據存儲,將存入緩衝區的數據存入存儲器中。系統發出提示是否繼續訓練,用戶根據主板的指示燈,通過按鍵選擇,若結束訓練,系統返回模式選擇單元,結束訓練。

識別模式:在識別模式下,用戶輸入語音指令信息,系統檢測是否滿足識別條件(比如是否是正常的語音信號),然後進行特徵數據提取,整個過程和訓練模式中的一樣,提取後再進行匹配,在資料庫中尋找與提取的特徵數據相匹配的數據。若沒有找到,則返回輸入單元,繼續輸入;若找到匹配後,進入下一單元。根據存儲的特徵數據在系統中找到相應的操作指令,連接紅外發射裝置,發出操控指令信號,操控其他設備。完成之後,返回模式選擇單元。

設計方法:

本系統設計開發中主要使用的硬體工具和軟體設備:

Spartan—6、音頻編解碼晶片、麥克風、ISE仿真軟體。

以下分模塊介紹所用算法:

5.1語音信息輸入採集與預處理模塊

本模塊要實現的功能是採集語音信號,並對其進行FIR濾波、語音數據歸一化、語音的端點檢測處理。語音採集部分採用外加的音頻編解碼器進行設計,通過VERILOG HDL編寫對晶片的工作模式進行設置,是晶片在上電後對工作模式設置在系統要求的狀態下。

語音預處理包含三部分,語音歸一化處理單元、FIR濾波器運算單元、語音端點檢測單元。圖5-1.1是預處理的結構功能圖:

圖5-1.1預處理的結構功能圖

在分析處理之前必須進行端點檢測過程,以確定語音信號的開始點和結束點。其中包括對語音信號短時能量和短時過零率的分析。

短時能量

其中,為原樣本序列在窗函數所切取出的第n段短時語音,N為幀長。

短時過零率

其中,為符號函數。

圖5-1.2語音的端點檢測狀態圖

5..2語音信息特徵數據的提取模塊

這裡利用到MFCC音頻特徵提取算法,語音信號輸入系統後,先進行加窗、濾波等預處理,再進行採樣等過程,最終完成特徵數據的提取。在識別模式下,語音信息的採集也是用到了這個算法,過程相同。

MFCC算法是有效的基於內容的音頻特徵提取算法,其處理過程如下:

(1) 對音頻信號進行預處理,即預加重、分幀、加窗處理;

(2)將每幀音頻信號進行傅立葉變換得到其頻譜:

(3)用Mel濾波器組在頻域進行帶通濾波,並對每個頻帶的能量疊加得到頻譜能量x(k);

(4)將濾波器組的能量取對數,然後做離散餘弦變換,即得到MFCC特徵。

圖5-2為MFCC特徵提取算法的流程圖。

圖5-2 MFCC特徵提取算法的流程圖

計算公式為:

此時所提取的特徵為音頻信號的靜態特徵,該信號再經一階差分後即得到音頻的動態特徵。

5.3 特徵數據匹配模塊

完成特徵數據提取後,系統需要完成匹配的過程,這裡用到了DTW算法,即在資料庫裡重複尋找與輸入的音頻特徵差別最小的數據信息,完成匹配。

DTW算法是典型的DP人算法,它利用動態時間規整方法將模板特徵序列和語音特徵序列進行匹配,比較二者之間的失真,得出識別判決的依據。DTW算法的具體過程如下:

假設存儲的一個詞條模板包括M幀倒譜特徵R={r(m);m=1,2,...,M};識別特徵序列包括N幀倒譜特徵T={t(n);n=1,2,...,N}。在r(i)和t(i)之間定義幀局部失真D(I,j),D(I,j)=|r(i)-t(i)|*2,通過動態搜索路徑中找到的累積失真最小的路徑,即最優的匹配結果。採用對稱形式DTW:

其中S(i,j)是累積失真,D(i,j)是局部失真。

當動態規划過程計算到固定節點(N,M)時,可以計算出該模板動態匹配的歸一化距離,識別結果即該歸一化距離,最小的模板詞條

計算過程中,為了減少計算量,我們採取以下方法:

全局路徑約束,即只計算四條直線:y=0.5x,y=2x,y=0.5x+(M-0.5N)

,y=2x+(M-2N)所謂的平行四邊形內部的點;

端點約束為固定起點、終點,即從左下角開始計算,到右上角點截止;

對進行模式匹配的兩條語音命令的長度N和M進行了約束,如果兩者之間相差太大則直接放棄該參數模板,不進行DTW運算。

圖5-3 DTW算法流程圖

設計特點:

該設計的主要特點:

該設計採用MFCC音頻特徵提取算法和DTW特徵匹配算法,對音頻進行了加窗、濾波預處理,特徵數據的提取和比對都比較精確,系統的穩定性和準確性都得到了提高。

系統採用Spartan-6主板,將程序編寫後嵌入到晶片內部,外部只是採用簡單的線,用於連接輸入、輸出設備,主板採用集成電路,減少了連線錯誤的可能性。同時,內嵌的程序可作修改,更具實用性,也節省了製作材料。

當系統出現錯誤時,可調出內部程序,在仿真軟體上進行模擬查詢錯誤;若問題出在外部電路,由於電路連線簡單,用戶便於查找和更改。相比於單純的電路結構,該系統結構明了,無需大範圍的改動,更加實用和節省材料。

系統採用紅外模塊操控家電設備,結構簡單,控制方便。

紅外操控本身就具有可遙控的特點,即晶片可固定於某一位置,連接多個紅外發射埠,就可完成對多個設備的操控。

相關焦點

  • 基於DSP和FPGA的機器人聲控系統設計與實現
    系統硬體分為語音信號的採集和播放,基於dsp的語音識別,fpga動作指令控制、步進電機及其驅動、dsp外接快閃記憶體晶片,jtag口仿真調試和鍵盤控制幾個部分。工作流程是麥克風將人的語音信號轉化為模擬信號,在經過音頻晶片tlv320aic23量化轉化成數位訊號輸入dsp.dsp完成識別後,輸出動作指令。 fpga根據dsp輸入的動作指令產生正確的正反轉信號和準確的脈衝給步進電機驅動晶片,驅動晶片提供步進電機的驅動信號,控制步進電機的轉動。片外flash用於存儲系統程序和語音庫並完成系統的上電加載。
  • 基於FPGA的無損圖像壓縮系統設計
    編者按:  摘要:本文簡要介紹了圖像壓縮的重要性和常用的無損圖像壓縮算法,分析了快速高效無損圖像壓縮算法(FELICS)的優勢,隨後詳細分析了該算法的編碼步驟和硬體實現方案,最後公布了基於該方案的FPGA性能指標。
  • 基於FPGA高精度浮點運算器的FFT設計與仿真
    摘要 基於IEEE浮點表示格式及FFT算法,提出一種基2FFT的FPGA方法,完成了基於FPGA高精度浮點運算器的FFT的設計。利用VHDL語言描述了蝶形運算過程及地址產生單元,其仿真波形基本能正確的表示輸出結果。
  • 基於FPGA的手勢語音轉換器
    我們的手語語音轉換器目的就是就是通過它提供一種有效的途徑將聾啞人的手勢識別出來,並轉換成我們普通人所習慣的語音信息,從而實現聾啞人與我們的有效溝通。目前手語識別可以分為基於視覺的識別系統和基於數據手套的識別系統。基於視覺的手勢識別系統採用常見的視頻採集設備作為手勢感知輸入設備,價格便宜、便於安裝。
  • 基於FPGA的RCN226絕對式編碼器通信接口設計
    0 引言 光電碼盤是一種基本的位置、速度檢測反饋單元,非常廣泛地應用於變頻器、直流伺服、交流伺服等系統的閉環控制中。目前國內外高端交流伺服系統中普遍採用FPGA+DSP結構。DSP用來實現矢量變換和其它算法流程;FPGA用以實現解碼、A、B、 Z信號輸出、I/O擴展等功能,FPGA中尚有很多資源沒有得到充分利用。
  • 基於Julius的機器人語音識別系統構建
    只需要對幾十個字或詞的命令行進語音識別,便可使得原本需要手工操作的工作由語音輕鬆完成。本文針對現有機器人平臺,設計一個非特定人的孤立詞語音識別系統。  1 語音識別原理及JuliUS簡介  1.1 基於HMM的語音識別原理  語音識別系統是一種模式識別系統,系統首先對語音信號進行分析,得到語音的特徵參數,然後對這些參數進行處理,形成標準的模板。這個過程稱為訓練或學習。
  • 基於fpga二維小波變換核的實時可重構電路
    項目背景及可行性分析本文引用地址:http://www.eepw.com.cn/article/266432.htm  2.1 項目名稱及摘要:  基於fpga二維小波變換核的實時可重構電路  現場可編程門陣列為可進化設計提供了一個理想的模板
  • 基於FPGA+MATLAB的串行多階FIR濾波器設計
    本文引用地址:http://www.eepw.com.cn/article/236081.htm關鍵詞 FPGA;FIR數字濾波器;Matlab;仿真數字濾波器是用於過濾時間離散信號的數字系統,通過對抽樣數據進行數學處理達到頻域濾波的目的。
  • 大學生發明智能輪椅 可手機操控也可語音指揮
    大學生發明智能輪椅 可手機操控也可語音指揮 如果有了「臥居智能輪椅」和成熟的物聯網技術,關窗戶這種小事就可以交給輪椅了。今天上午,記者在合肥工業大學看到了這種「臥居智能輪椅」,它是由一群學生花了5年時間研製成的。  輪椅能用手機控制  「左轉、右轉、加速」,一聲令下,輪椅自己就動了起來。從外觀看,臥居智能輪椅跟普通輪椅差不多,長得更像沙發。
  • 好家聲智能語音酒店系統讓酒店迅速脫穎而出
    「當然有」,好家聲酒店智能語音控制系統解決方案-人與科技融合,個性定製化智慧酒店打造溫情個性的生活場景;徹底將人從煩冗複雜的居住流程中解放出來;給予用戶最舒適、放鬆的入住體驗!1、人體感應,人來即亮,人走即滅智能人體感應照明功能,可感應到3米範圍的移動人體,從而打開你眼前的燈光,無論人走到哪,燈就亮到哪,當客人離開感應範圍20秒後燈關自動熄滅。
  • APP遠程+智能語音提,火星人E6BZ智能烹飪時代
    物聯網和智能家居大行其道,越來越多的家電正在朝「智能化」變革,廚房電器也不例外。人們對廚電的需求,不單單停留在易用、好用,而是更注重廚房的高效、靈活,多種功能集成化和解放雙手的交互方式成為新的潮流。擁有APP遠程操作和智能語音提醒,還有讓你擺脫油煙煩惱的超強吸力,以及快速烹製全家美食的超大蒸箱,為你打造全新的廚房烹飪體驗。01 智慧升級,操控更隨心火星人E6BZ集成灶也像智能音箱那樣加入了「語音助手」的功能,給廚房烹飪帶來完全不一樣的體驗。火星人E6BZ集成灶內置的語音助手可實現烹飪全程語音播報,機器的工作狀態、操控的反饋、操作的提示都可以通過語音來告知你。
  • 基於DSP的語音識別系統的實現及分析
    尤其在會話任務上,自動語音識別系統遠不及人類。因此,語音識別技術的應用已成為一個極具競爭性和挑戰性的高新技術產業。  隨著DSP技術的快速發展及性能不斷完善,基於DSP的語音識別算法得到了實現,並且在費用、功耗、速度、精確度和體積等方面有著PC機所不具備的優勢,具有廣闊的應用前景。
  • 智能翻譯機逆襲,智能語音技術起了什麼作用?
    智能語音技術經年之後的不斷完善,尤其是隨著語音識別準確率的不斷提高,基於智能語音技術的智能硬體紛至沓來,除了智能音箱一再受眾人追捧外,智能翻譯機也悄然逆襲,併入這條快車道。
  • 語音轉錄神器,靈雲智會打造智能高效的會議系統
    語音識別等人工智慧技術的出現,從根本上了解決這一問題。  靈雲智會是一款面向政府報告、內部討論會、商業洽談、學術交流等各種會議場景設計的智能化會議管理系統。該系統以語音識別技術為核心,結合機器翻譯、語義理解等多種人工智慧技術,提供多角色分離、會議語音識別、 文本翻譯、語音播報、錄音轉寫等多種特色功能,為工作人員在會議過程中提供智能化幫助。
  • 基於嵌入式Linux的語音識別系統硬軟體設計
    在嵌入式Linux作業系統下,運用多進程機制完成了對語音識別晶片、超聲波測距和雲臺的控制,並將語音識別技術應用於多角度超聲波測距系統中。通過測試,系統可以通過識別語音指令控制測量方向,無需手動幹預,最後將測量結果通過語音播放出來。
  • 用語音竟可操控你的電腦 想幹什麼只要說出來
    相信看完以後,很多人都希望有朝一日人類真的能用意念操控事物,雖然現在看來有些天馬行空,但在不久的將來也許真的能實現。如今大家操控電腦都採用滑鼠,而你想過通過語音來操控你的電腦嗎?近日,科大訊飛推出了一款名為飛鼠的智能語音滑鼠,在操控電腦方面只需把滑鼠放在身邊,說出你想做的事情,比如「打開軟體」、「想吃火鍋」等,電腦就會自動為你打開軟體,或為你搜索推薦附近的火鍋店,相當智能,完全不用打字去操控,僅憑語音就可以做到。
  • 一種基於FPGA的實時紅外圖像預處理方法
    針對這一問題,提出一種基於FPGA的實時紅外圖像預處理方法。該方法採用了流水線技術來並行完成非均勻校正、空間濾波、直方圖統計等多個紅外圖像預處理算法,對系統結構進行了改進和優化。經過實驗測試驗證,該方法合理可行,能夠實時高效地完成紅外圖像預處理任務。與DSP圖像預處理系統相比可以節約將近50%的處理時間。
  • 基於FPGA的實時中值濾波器硬體實現
    但是以上研究都是基於標清圖像的中值濾波器,處理的圖像大小一般為256×256、512×512的灰度圖等,很少有實現高清圖像的中值濾波器。本文在文獻[3]、[4]的理論基礎上,在蘇光大主持研製成功的NIPC-3鄰域圖像並行處理機上實時實現了1 920×1 080×8 bit的高清圖像的中值濾波器。
  • 達摩院語音實驗室負責人鄢志傑:智能語音爆發進入倒計時,2019語音...
    新智元專訪達摩院語音實驗室負責人鄢志傑及高級算法專家雷鳴,深度解讀核心技術。鄢志傑認為,智能語音正處於爆發前夜,2019年語音AI將在特定領域通過圖靈測試。通過提出KAN-TTS,並發布基於這一技術的實時在線語音合成雲服務,達摩院語音實驗室在傳統TTS系統和End2End系統中找到了一個槓桿。
  • 基於FPGA IP核的FFT實現
    這裡從Altera IP核出發,建立了基4算法的512點FFT工程,對不同參數設置造成的誤差問題進行分析,並在EP2C70F896C8器件上進行基於Quartus II的綜合仿真,得到利用FFT IP核的FFT算法高效實現,最後利用Matlab進行的計算機仿真分析證明了工程結果的正確性。