樂鑫發布 AI 語音麥克風陣列開發板 ESP32-Korvo

2020-11-28 電子產品世界

樂鑫信息科技發布 AI 語音麥克風陣列開發板 ESP32-Korvo 。這是一款針對物聯網嵌入式設備的 AI 語音開發板,基於樂鑫的旗艦晶片 ESP32,搭載多麥克風陣列,能夠實現高性能、低功耗的遠場語音喚醒和命令詞識別功能。

本文引用地址:http://www.eepw.com.cn/article/202004/411927.htm

近年來,隨著人工智慧和物聯網的興起,語音逐漸成為我們與智能設備交互的一種典型方式。在連接設備(例如智能家居設備、智能辦公設備、智能穿戴設備等)上嵌入 AI 語音也成為了一大熱點。ESP32-Korvo 僅搭載單顆 ESP32 晶片,支持 2 麥 / 3 麥陣列,適用於遠場、低功耗的語音識別應用 / 場景,如智能語音電器、智能語音顯示屏、智能語音開關……

ESP32 配合麥克風陣列語音增強 (Mic-Array Speech Enhancement,簡稱 MASE) 和回聲消除 (Acoustic echo cancellation,簡稱 AEC) 等前端聲學算法,能夠有效地對遠場語音實施降噪,提升語音喚醒和識別的性能。

ESP32-Korvo 可搭配樂鑫智能語音助手 (AI 語音識別 SDK)— ESP-Skainet 一起使用,實現豐富的應用開發。基於語音喚醒引擎 WakeNet,用戶可實現設備的語音喚醒功能,同時還可自定義喚醒詞。基於命令詞識別網絡 MultiNet,用戶可輕鬆設置豐富的本地命令詞,添加自己的語音命令,實現智能設備的本地語音控制。

在不久的將來,我們還將開放聲源定位 (DOA detection)、混響消除 (dereverberation) 等功能,敬請關注 ESP-Skainet 的後續更新。 


相關焦點

  • 智能語音技術中麥克風陣列的原理
    早在20世紀70、80年代,麥克風陣列已經被應用於語音信號處理的研究中,進入90年代以來,基於麥克風陣列的語音信號處理算法逐漸成為一個新的研究熱點。而到了「聲控時代」,這項技術的重要性顯得尤為突出。
  • 利用MEMS麥克風陣列定位並識別音頻或語音信源的技術方案
    特別是基於微機電系統(MEMS) 的麥克風陣列出現後,麥克風陣列音頻定位方案引起科研企業和開發人員的廣泛關注。麥克風陣列可捕捉從不同方向傳來的聲音,通過算法運算使麥克風指向某一個特定方向,放大從該方向捕捉到的音頻信號,同時衰減從其它方向捕捉的音頻信號,整個動作就像一個智能麥克風。
  • 盤點麥克風技術及市場,遠場語音交互如何選型麥克風?
    智能語音交互市場的火熱逐漸輻射到產業鏈的供應商,其中最直接受益就是作為聲音的傳感設備——麥克風。特別是麥克風陣列的興起,未來可以讓麥克風廠家的銷量翻倍增長。在此之前,由於受制於智慧型手機和平板電腦的增長速度下滑,樓氏、歌爾和瑞聲的股票相繼在2016年中旬左右創下了低谷。2017年的語音交互局勢趨於明朗,資本市場專注研究智能語音交互的投資機構也明顯多了起來。
  • 鴻蒙HarmonyOS開發板訊飛平臺+語音控制開關燈
    ,我們可以實現語音控制開關燈。大致流程如下:1、創建應用,下載sdk,編譯demo可執行程序(本文採用的Linux SDK);2、通過應用的唯一APPID,登錄到訊飛開放平臺;3、用戶輸入語音,Linux SDK程序通過麥克風接收到語音數據,上傳到訊飛開放平臺;4、平臺返回語音翻譯的文字,由Linux SDK程序通過udp socket通信的方式發送給開發板;
  • 基於MEMS麥克風陣列的四通道語音採集系統設計
    單個孤立麥克風作為傳統的語音拾取工具,在噪聲處理、聲源定位和跟蹤,語音增強等方面存在不足,在噪聲環境下會嚴重影響語音質量。一些文章探討了多通道麥克風的降噪技術,在理論上提高了噪聲環境下語音的信噪比。但是實際應用中,多通道的語音實時採集是一個尚待解決的問題。
  • 一文帶你全面熟悉智能語音之麥克風陣列技術的原理
    也就是說由一定數目的聲學傳感器(一般是麥克風)組成,用來對聲場的空間特性進行採樣並處理的系統。   早在20世紀70、80年代,麥克風陣列已經被應用於語音信號處理的研究中,進入90年代以來,基於麥克風陣列的語音信號處理算法逐漸成為一個新的研究熱點。而到了「聲控時代」,這項技術的重要性顯得尤為突出。   麥克風陣列能幹什麼?
  • 大熱的麥克風陣列語音識別系統的設計和輕鬆實現,提供軟硬體解決方案
    本文引用地址:http://www.eepw.com.cn/article/201706/348732.htm摘要:在非近距離語音識別中,由於衰減、幹擾、混響等因素的影響,使語音識別率顯著降低。使用麥克風陣進行語音識別的好處是通過提高信噪比來提高語音識別率。
  • 廣播百科 麥克風陣列
    ∧     更多內容推薦        請關注為星標麥克風陣列
  • 基於麥克風陣列的聲源跟蹤系統
    聲源目標跟蹤技術可以應用在視頻錄製、安防監控、鳴笛抓拍等場景中,在這些場景中,針對目標對象的語音信號,可以應用陣列信號處理的知識,將麥克風按照特定陣列放置在空域中,利用空間不同位置點的聲源對麥克風陣列響應的時延相位誤差,對聲源進行測向,實現低成本的聲源定位跟蹤功能。
  • 數字麥克風和陣列拾音技術的應用
    數字麥克風適合SMT焊接,可以解決系統各種射頻幹擾對語音通信產生的噪聲,富迪科技的數字陣列麥克風拾音技術可以抑制和消除通話時的回聲和環境噪聲,數字接口方便同數字系統的連接。   模擬麥克風和數字麥克風   麥克風結構:ECM模擬麥克風通常是由振膜,背極板,結型場效應管(JFET)和屏蔽外殼組成。振膜是塗有金屬的薄膜。
  • 微軟最新AI系統!使用雲端麥克風陣列,音頻轉錄精度提升22.4%
    導語:微軟利用人工智慧轉錄會議音頻,新系統使用雲端麥克風陣列。智東西9月16日消息,微軟語音和對話研究小組的科學家最近研發了一個系統,利用內置於智慧型手機、筆記本電腦和平板電腦中的麥克風來提高音頻質量。這個系統通過智能硬體連接網際網路,在雲端形成臨時的麥克風陣列,可以實時高精度轉錄音頻。
  • 麥克風陣列的概念簡介
    1 麥克風陣列        麥克風陣列,是一組位於空間不同位置的全向麥克風按一定的形狀規則布置形成的陣列,是對空間傳播聲音信號進行空間採樣的一種裝置,採集到的信號包含了其空間位置信息。根據聲源和麥克風陣列之間距離的遠近,可將陣列分為近場模型和遠場模型。根據麥克風陣列的拓撲結構,則可分為線性陣列、平面陣列、體陣列等。
  • 微軟新專利:包含魚眼鏡頭和麥克風陣列的AI設備
    本月微軟提交申請的一項專利被美國商標和專利局(USPTO)收錄,展示帶有單個魚眼攝像頭和多個麥克風陣列的人工智慧系統。魚眼攝像頭具備特殊的鏡頭可以監控360度全景。儘管該技術並不新鮮,但微軟計劃以不同的方式和其他周圍環境傳感設備配合使用。這種環境捕獲系統通常具有多個攝像機以擴展其視野。這需要複雜的設計,並且還需要額外的硬體來融合多個視頻數據流。
  • 京東物聯推出京魚座AI音箱C1 配置4麥克風環形陣列
    7月5日消息,據京東官方微信號發布的消息顯示,京東物聯宣布推出全新一代語音智能產品—京魚座AI音箱C1。  據悉,為了保證該功能的良好體驗,京魚座AI音箱C1配置了4麥克風環形陣列,輔以波束成形及降噪技術,可實現室內環境下5米範圍的語音交互呈現。京東方面稱,遠場語音識別的識別準確率達到97%以上。
  • STM32F469開發板-黑科技助推圖形顯示
    此次愛板網也有幸第一時間體驗到了基於STM32F469系列MCU的STM32F469 Discovery開發板,一起來見識一下吧。 STM32F469 Discovery開發板 STM32F469同樣採用的是STM32F系列經典的蝴蝶包裝,但不同的是,第一眼看到並不僅僅是一塊簡單的開發板,而是一整塊大黑屏幕,竟然有點息屏美學的意味,忍不住讚嘆一番。
  • 獵戶星空發布首款AI產品「小雅」遠場語音交互系統
    【TechWeb報導】6月20日消息,獵戶星空今日聯合喜馬拉雅等發布小雅AI音箱。據了解,獵戶星空AI生態鏈上的第一款產品,小雅AI音箱是一款技術和產品結合的智能硬體,市場價為999元,首批預售價699元,發貨時間為7月29日。
  • 語音應用多元化,MEMS麥克風走向高效能
    遠場語音識別日趨重要,帶動MEMS麥克風走向高效能  語音控制應用逐漸多元化,讓使用者能透過最直覺方式達到目的;另一方面,也讓使用者能夠空出雙手進行其他活動,若MEMS麥克風效能不佳,將導致語音難以識別,進而造成使用者體驗不佳。
  • MAIX GO AI人工智慧開發板,功能豪華 到手即用
    芯板坊淘寶商城 MAIX GO是Sipeed公司旗下MAIX產品線的一員,GO意為立即出發,該開發板的設計思路為 採用Kendryte K210 AI主控,主頻400M(可超頻至600M),乘法操作算力0.23TOPS,總算力1TOPS; 板載基於STM32的JTAG調試器&串口ISP燒錄器,命名為open-EC; 充電管理+電源路徑選擇晶片; 麥克風陣列連接器
  • 1+4麥克風陣列+智能主動式降噪?科大訊飛AI智能錄音筆SR301測評
    雖然目前,很多手機設備都有錄音這個功能,但礙於錄音條件和手機本身的音質問題,我們在錄完音後很少能得到清晰的語音錄製,一般都比較嘈雜,一些重要的話語也很可能在嘈雜聲中弄混淆,有的時候一句語音要聽幾遍才能聽清文字內容。此外,對於在這個快節奏社會下的我們來說,將錄音文件整理成文稿,往往也需要耗費大量的時間,很是影響工作、學習效率。
  • 人工智慧電視遠場語音設計
    摘要:本文介紹一種服務於人工智慧電視,實現遠場語音應用的麥克風陣列設計方案,闡述系統框架和硬體設計,同時介紹軟體設計的部分要點。通過麥克風陣列,協助語音增強算法的實現,達到遠距離拾音、回聲消除、聲源定位,滿足當前智能語音應用的需求。