基於中英文數字語音登陸系統的仿真研究

2020-12-11 電子產品世界

  引言

本文引用地址:http://www.eepw.com.cn/article/142175.htm

  語言是人與人之間在日常交往中最直接也是最強大的工具,然而我們並不滿足於人與人之間的對話,而是通過語音識別技術來實現人機對話,語音識別技術的終極目標就是能夠讓人類與計算機進行自由地交談。隨著語音識別技術的逐漸成熟及近些年來已經取得的進步,英文數字語音識別在其發展的20多年間已達到了很高的識別率,漢語數字語音識別也經過多年研究在PC平臺和實驗室條件下達到了高性能,但中英文混合連續數字語音識別還有待進一步研究,張晴晴等人研究的中英雙語混合語音識別的識別率為16.8%,遠低於理想中的識別率。為使識別效果達到可實用的水平,本系統首先從基本的中英文數字語音識別出發,從而為相應的登錄註冊系統做出一些嘗試。

  本文研究的中英文連續數字語音識別,包含中文0-10和英文zero-ten的數字語音識別,其中包括對語音信號的預處理、特徵參數提取、中英文聲學模型與語言模型的訓練及模版匹配等,適合於研究數字語音登錄系統,比如用戶用中英文任何語言念學號或是身份證號就能登陸,免去書寫的麻煩,同時也對後續研究中英文混合連續語音識別奠定了基礎。

  語音識別原理

  根據對說話人說話方式的要求,語音識別可以分為孤立字(詞)語音識別系統,連接字語音識別系統以及連續語音識別系統;根據對說話人的依賴程度,語音識別可以分為特定人和非特定人語音識別系統;根據詞彙量大小,又可以分為小詞彙量、中等詞彙量、大詞彙量以及無限詞彙量的語音識別系統。不同的語音識別系統,其目的和功能各不相同,但它們所採用的基本框架大體一致,語音識別基本流程如圖1。  

 

  語音識別的過程,其本質就是模式匹配的過程。語音信號經過預處理、語音信號的特徵提取、聲學模型的訓練與模式匹配後,經過處理輸出識別結果。其中:

  1)預處理是對輸入的原始語音信號進行處理,濾除掉其中不重要的信息和背景噪聲,並進行語音信號的端點檢測、語音分幀以及預加重等處理。

  2)特徵提取主要負責計算語音的聲學參數,並進行特徵的計算,以便提取出反映信號特徵的關鍵特徵參數,從而用於後續處理。因Mel頻率倒譜係數(MFCC)具有良好的抗噪性和魯棒性,故本文採用MFCC提取特徵參數。

  3)訓練階段是用戶通過輸入若干次訓練語音後,經預處理和特徵提取後得到特徵矢量參數,建立或修改訓練語音的參考模式庫。

  4)識別階段是將輸入的語音提取特徵矢量參數與參考模式庫中的模式進行匹配,得出最終的識別結果。


相關焦點

  • 基於LMS算法的回聲消除系統仿真研究
    本文基於LMS算法,應用MATLAB進行仿真研究,並改進了LMS算法,得出更好的回聲消除系統。本文基於LMS算法,應用MATLAB進行仿真研究,並改進了LMS算法,得出更好的回聲消除系統。0 引言  現在,各種各樣的通訊方式越來越多,極大的方便了人們的生活。
  • 基於Matlab/Simulink的二階控制系統仿真研究
    打開APP 基於Matlab/Simulink的二階控制系統仿真研究 李雲海等 發表於 2014-02-12 11:16:28
  • 基於Matiab/Simulink的QAM通信系統的仿真
    該仿真模型簡單,而且達到了預期的效果。仿真結果表明:通過Matlab仿真數字通信系統具有較強的可實現性,為實際應用和科學合理地設計QAM通信系統,提供了高效的仿真平臺。關鍵詞:Matlab;Simulink;QAM;仿真模型;數字通信 在眾多系統仿真平臺中,Matlab及其Simulink工具箱較之於其它仿真軟體,有著獨到的優勢,它使通信技術人員擺脫系統仿真中繁瑣的編程過程,有效地提高了仿真的效率,而且易學易用。
  • 基於VeriStand的制導系統半實物仿真平臺的研究
    作者/ 範勇 劉曌 李釗 上海航天控制技術研究所(上海 201109)本文引用地址:http://www.eepw.com.cn/article/201708/363625.htm範勇(1987-),男,碩士,助理工程師,研究方向:實時仿真系統設計。
  • 基於LabVIEW的SIP系統仿真的設計與實現
    基於LabVIEW的SIP系統仿真的設計與實現將虛擬儀器的概念引入大亞灣核電站的SIP系統的仿真,利用計算機仿真技術參與其系統設計有助於縮短設計周期,降低設計費用和提高設計質量,基於這些優點利用LabVIEW進行了SIP系統的虛擬仿真設計,目前已經取得了預期的效果,主要以SIP系統的RCP10通道為例進行詳細地仿真設計介紹。
  • 基於信號完整性理論的PCB仿真設計與分析研究
    在基於信號完整性計算機分析的 PCB設計方法中,最為核心的部分就是PCB板級信號完整性模型的建立,這是與傳統的設計方法的主要區別之處。SI模型的準確性將決定設計的正確性,而 SI模型的可建立性則決定了這種設計方法的可行性。
  • 基於DSP的語音降噪系統設計
    本文所介紹的語音降噪系統能夠有效地實現數字降噪功能,由於降噪處理時不但要進行信號的採集與回放,還要進行降噪算法的實時處理,採用具有高速實時處理能力的DSP TMS320VC5509進行處理,能夠滿足日常生活中語音通信中的降噪要求。
  • 虛擬仿真技術 | 基於數字孿生的新型四工位刀架設計
    數字孿生即建立物理實體的數位化虛擬模型來仿真物理實體在真實環境中的屬性和行為[1-2]。數字孿生被中國科協列為世界智能製造十大科技進展之一[3],作為踐行「中國製造2025」與「工業4.0」的重要技術手段,能有效實現產品設計階段與製造階段的虛實映射,提升產品開發和優化的迭代循環效率。美國國家航空航天局(NASA)應用數字孿生技術開展了宇航設備健康狀態預測[4]。
  • 中文語音處理在數字助聽器系統的開發
    目前國外對助聽器研究發展的一個熱點則是集中在中國,確切地講是基於對漢語語言和語音研究,開發相關的語音識別技術和產品。為中心的中文聽力學也不例外。我們已經知道聽覺科學是一門發展迅速、知識更新很快的一門學科,它所研究的對象以人的聽覺為中心,現在我們將介紹和討論科學家和聽力學家更關心的是怎樣將聽覺科學運用到中國人的聽覺和言語實際中去。
  • 基於FPGA的磁浮軸承控制系統研究
    本文引用地址:http://www.eepw.com.cn/article/163435.htm1 磁軸承控制系統 磁軸承控制系統的研究一直是磁軸承技術研究的熱點和難點,磁軸承控制系統一般包括無接觸的位移傳感器、功率放大器、控制器和電磁激勵器(即電磁線圈和轉軸)四部分。
  • 基於Multisim的集成放大運算器仿真分析
    摘要:為了了解Multisim在實際電路設計與仿真中的應用,在此以集成運算放大器為研究對象,基於Multisim對其進行了仿真分析
  • 齊家文化數字博物館中英文語音切換新版上線
    原標題:齊家文化數字博物館中英文語音切換新版上線  中國甘肅網11月8日訊據民族日報報導(記者幸福)近日,廣河縣齊家文化數字博物館中英文語音切換新版上線,將全視角生動呈現4000多年華夏文化歷史陳跡。
  • 基於Virtuoso 平臺的單片射頻收發系統電路仿真與版圖設計
    圖1 典型的射頻收發系統Virtuoso 是Cadence 公司推出的用於模擬/數字混合電路仿真和射頻電路仿真的專業軟體。基於Virtuoso 的行為仿真和系統規劃射頻收發系統的設計最終能否成功,以及模塊指標分配是否合理可行,都有賴於具體電路設計之前對系統的行為建模和計算,即所謂的行為仿真。這也是自頂向下設計模式的關鍵一步。Cadence 內置的Verilog-A 和VHDL仿真器,以及混合輸入模式的仿真方法提供了這種可能性。
  • 基於DSP的多路語音實時採集與壓縮處理系統
    在語音的數字通信和數字存儲等應用領域,需要對多路語音信號進行實時採集和壓縮處理。  由於VLSI技術的迅速發展,DSP(Digitalsig-nal processor數位訊號處理器)的性能價格比得到了很大的提高,使得利用DSP的高速數據管理能力和處理能力來實現高速數據採集和處理成為實時數據採集和處理的一個新的發展方向。基於此,本文介紹的多路語音實時採集與壓縮處理系統採用了高速DSP技術。
  • 解析基於DSP的漢字語音識別系統的實現方式
    語音識別是機器通過識別和理解過程把語音信號轉變為相應的文本文件或命令的高技術。作為專門的研究領域,語音識別又是一門交叉學科,它與聲學、語音學、語言學、數位訊號處理理論、資訊理論、計算機科學等眾多學科緊密相連。
  • 支持全球主流中英文語音平臺 瑞芯微發布AI語音助手方案
    2017年4月13日香港春季電子展,瑞芯微Rockchip發布了旗下「AI語音助手」方案,應用於語音智能音箱系統。基於RK3036與RK3229兩顆晶片,分別針對入門級與中高端產品的語音智能音箱方案。瑞芯微「AI語音助手方案」具備三大技術特性:1、率先集成1-8 DMIC陣列直連接口2、支持全球主流中英文語音平臺3、支持Linux/Android OS官方資料顯示
  • 【國家虛仿遠程實驗中心】基於ELVIS III數字循環LED仿真與遠程實驗-大連理工大學
    2.開始仿真實驗設計     為了驗證電路的實驗結果和可行性,我們可以先使用NI Multisim 電子電路軟體或者NI在線Multisim平臺(https://www.multisim.com)進行電路的搭建和仿真。  下圖是我們通過Multisim軟體搭建出來的數字循環電路實驗的原理圖,此電路模擬了一段7位數字循環LED燈的效果:
  • 基於MMC子模塊獨立控制的光伏併網系統仿真分析
    針對這種情況,許多研究人員都在從事模塊化多電平換流器(MMC)的研究,文獻 [3-5] 針對MMC展開了一系列研究,可是並沒有應用在光伏併網系統;文獻 [6-7] 把MMC應用到了光伏併網系統,但是其仿真模型都是在Matlab/Simulink上搭建的,具有局限性;文獻 [8] 提出將MMC 運用在低壓集中式併網模式的光伏系統中,並把雙閉環控制與
  • 基於Verilog HDL的SVPWM算法的設計與仿真
    摘要:空間矢量脈寬調製算法是電壓型逆變器控制方面的研究熱點,廣泛應用於三相電力系統中。基於硬體的FPGA/CPLD晶片能滿足該算法對處理速度、實時性、可靠性較高的要求,本文利用Verilog HDL實現空間矢量脈寬調製算法,設計24矢量7段式的實現方法,對轉速調節和轉矩調節進行仿真,驗證了設計的實現結果與預期相符。
  • 關於數字孿生的冷思考及其背後的建模和仿真技術
    、基於數字模型的各種活動(仿真)、物理對象以及數字模型和物理對象之間的連接(數據及仿真結果)形成一個信息物理系統,如圖2所示。基於數字孿生可進行分析、預測、診斷、訓練等(即仿真),並將仿真結果反饋給物理對象,從而幫助對物理對象進行優化和決策。物理對象、數字孿生以及基於數字孿生的仿真及反饋一起構成一個信息物理系統 (cyberphysical systems)。