音頻ADC何以在嘈雜或遠距離情況下高保真採集語音?

2020-12-13 21IC中國電子網

從Siri到Cortana,從手機到智能音箱再到智能汽車。「世界本不能與機器對話,說的人多了,也便有了應用。」然而,與日俱增的應用之下,總會有些許缺點會暴露……最為致命的缺點就在於機器的「聽力」方面,如若採樣音頻都「雜亂無章」,何以驅動整個智能系統;如若任何命令都「置若罔聞」,何以對話整個數字世界?

據市場統計數據顯示,至2020年,將有大約500億設備擁有音頻接口的需求,廣泛用於智能音箱、智能汽車甚至冰箱、空調、洗衣機等家電中。此前人們的生活習慣偏向於遙控或按鍵時,未來或將更偏重於語音控制,而類似的應用也正在如雨後春筍般大量湧現。

正因如此,採樣的質量才凸顯出其無可比擬的地位。目前來說,智能家居面臨的兩方面挑戰,一方面,由於需求越來越廣,遠距離語音控制場景越來越多,遠場音頻採集困難;另一方面,由於麥克風數量有限且信號處理能力有限,現有的智能家居系統難以在嘈雜的環境中理解語音命令。

突破在這方面的挑戰,除了外圍設備,電子工程師更看重「內在」,而音頻ADC正是這一切的核心。11月21日,TI發布新型Burr-Brown音頻ADC並介紹了TI在音頻技術上的整套解決方案,21ic中國電子網記者受邀參加此次發布會。德州儀器音頻產品市場工程師AbhiMuppiri,德州儀器華北區技術應用經理趙般多現場為記者解析這款音頻ADC背後的「黑科技」。

無懼遠距離和嘈雜環境:TLV320ADC5140

TI最新發布的新型Burr-Brown音頻ADC TLV320ADC5140正是為解決遠距離和噪聲問題而生。據Abhi介紹,這款產品可拾取10米以上距離發出的聲音,擁有比行業同類產品遠4倍的遠場語音採集,同時是是首款完全支持超過106dB動態範圍的最新高信噪比麥克風的ADC,而在開啟動態範圍增強器(DRE)後可達到120dB。

趙般多為記者介紹表示,之所以能夠遠距離採樣相關語音命令,正是得益於這款產品最為特殊的地方——內置的120dB動態範圍增強器(DRE)。在系統層面,即使在非常靠近音箱輸出的情況下,DRE方案仍可在保持低失真錄音的同時增強低音量音頻信號。DRE還可以改善所有環境中的遠場高保真錄音。

當然,這款產品並非僅此功能而已,還包括了可編程增益放大器、高通濾波器、通道混合以及線性相位或超低延遲濾波器功能,因此即使處於嘈雜環境也可準確採樣。

值得一提的是,這款產品的封裝尺寸只有4mm x 4mm,採用24引腳超薄型無引線(WQFN)封裝,可以說超小型的體積非常適用於目前追求小型化的電子產業。

圖1:TLV320ADC5140 Audio ADC

潛藏小身材下的高保真語音採集秘密

首要提及的便是上文所述的動態範圍增強器(DRE),其實這種技術對於熟悉音頻的人或許有所耳聞,另外在電源控制方面也有這項技術的應用,不過在音頻ADC領域,TI是非常領先的。

據Abhi介紹,該項功能是與客戶探討開發的獨特功能,藉由此功能可將動態範圍從106dB提升至120dB的高水平。Abhi強調,與客戶探討時發現,語音控制受環境、距離因素產生的音量忽大忽小是常見問題。他表示,DRE整體是一套閉環控制的過程,採樣的信號經過DRE分析後由可變增益放大器轉化,當信號較小時,相關信號也將反饋於前級電子增益進行調整。

圖2:德州儀器(TI)音頻產品市場工程師Abhi Muppiri先生解讀新型Burr-Brown音頻ADC產品

除了DRE,這款ADC還會對採樣數據進行相位校正、波束成形和主動消噪算法,通過嵌入硬體的功能可以保證語音採樣的高保真,而客戶也可在處理器端使用相關算法進而優化。

Ahbi為記者介紹表示,即使智能音箱播放至最高音量,也可以清晰採樣用戶命令信息,再經過app算法抵消相關聲音,即可獲取清晰的命令,這便是藉由DRE將動態範圍提升至120dB最明顯的優點。

數字/模擬麥克風的多重搭配催生新應用

麥克風目前擁有數字型和模擬型兩種,在外圍設備適配方面,Abhi強調,這款產品支持麥克風輸入的四個模擬通道或八個數字通道,亦或是隨意組合進行同步採樣,從而確保了系統靈活性,另外還提供增益和相位校準等可編程功能,以均衡麥克風陣列失配。

話題說到此處,或許會產生一些疑問,既然如此數字、模擬麥克風究竟孰強孰弱?趙般多為記者解釋表示,數字麥克風通常在功耗方面比模擬效果好,但信噪比方面模擬麥克風則更佳,因此該款產品既支持數字麥克風也支持模擬麥克風,客戶可根據實際需求進行修改。

圖3:德州儀器(TI)華北區技術應用經理趙般多先生解讀新型Burr-Brown音頻ADC產品

正因擁有數字麥克風和模擬麥克風的「雙重加持」,才能搭配出不一樣的應用。Abhi為記者舉了一個例子,一些電池供電的攝像頭可在待機狀態使用低功耗的數字麥克風實時監測環境,而當監測到有人闖入時,喚醒模擬麥克風進行高質量音源採樣,這樣便兼顧了低功耗與高質量。

覆蓋全行業需求的產品線

除了TLV320ADC5140,如此能「打」的產品還有兩個。目前,TI在音頻ADC上擁有TLV320ADC3140/ 5140 / 6140三款產品,而上文所主要介紹的5140則屬於中檔產品。價格方面,三款產品分別為$1.99 / $2.99 / $4.99,需要注意的該定價是為千件下的定價,在需求量不同時將會有所浮動。

具體來說,3140屬於入門級產品,因為沒有搭載DRE技術,所以動態範圍(DR)方面為106dB。而針對高端市場的6140本身就擁有113dB的動態範圍(DR),使用DRE技術可將動態範圍(DR)擴展到122dB,並達到123dB的信噪比(SNR)。

據Abhi介紹,如此定檔和定價的原因在於相信不同的類型的產品會用到不同的應用產品裡去。他表示,3140屬入門級產品,在一些智能音箱、電視上或許檢測聲音距離並不遠,因此3140足以滿足需求;而在需要檢測更遠距離或嘈雜環境下,5140可以滿足要求;一些專業錄音場景應用下面對的問題就是如何在有限空間內獲取最高的性能,因此6140可以滿足頂級的需求。

除了三款可供選擇的音頻ADC,TI還提供了全套產品線的產品組合。眾所周知,Burr-Brown是一家成立於1956年的模擬器件廠商,據Abhi介紹,自2000年Burr Brown被TI收購以後,一直延續本品牌在音頻上的獨特技術和發展,其中不僅擁有ADC/DAC,還包括高性能D類放大器、數據轉換器和運算放大器的全套音頻產品組合。

圖4:TI Burr-Brown音頻技術

另外,據趙般多介紹,在集成型的產品,諸如Codec,TI也在持續關注和投入,相關產品也將會被發布。當然是集成好還是分開好,具體還應取決於應用方向和客戶的選擇。

目前著重於智能家居市場

Abhi對記者介紹表示,相較於歐美和日本,智能家居中國處於領先水平,除了智能音箱以外,電視、冰箱、空調均在向語音交互方面發展。目前來說已在中國市場擁有許多領先家電廠商合作,並推行語音交互方面發展的計劃。

當然,車載環境也是TI要抓住的重點,不過因為汽車擁有不同的需求和質量評價體系,因此針對汽車應用市場將會在明年發布相關的專屬產品,針對汽車應用進行質量相關的評價和特殊定製。

圖5:高保真音頻適用於要求頂級音質的應用

Abhi強調,TI是一家模擬佔比非常大的公司,強項在於製造、工藝、設計理念的積累和IT方面的積累,因此會發揮好優勢以做出真正適合智能家居音頻這一市場的產品。

在音頻方面,諸如今年大火的TWS耳機,TI也擁有成功案例。本次所發布的TLV320ADC5140適用於對前端模擬信號採集質量要求非常高的場景,隨著智能家居音頻市場的不斷擴張,對於採樣的標準也將越來越高。

(21ic原創,作者:付斌)

相關焦點

  • 從容應對遠場音頻採集:TI推出業界領先Burr-Brown音頻ADC
    在這一進程中,上遊的音頻技術顯得尤為重要,近日德州儀器(TI)發布新型Burr-Brown?音頻ADC--TLV320ADC5140,重點解決智能家居系統面臨的遠場音頻採集的挑戰。在智能家居領域,德州儀器(TI)的產品解決方案,超越了新的行業需求,獲得豐富的聆聽體驗,使系統能夠區分嘈雜環境中的語音,並通過創新的集成和封裝來減少電路板空間。從容應對遠場音頻採集挑戰「現有的智能家居系統面臨著遠場音頻採集的挑戰。
  • 無需再向智能音箱大喊:TI發布新型Burr-Brown音頻ADC
    支持比行業同類產品遠4倍的遠場語音採集工程師現在可實現120dB的動態範圍,以便在智能家居應用中採集清晰、高保真的語音北京2019年11月21日 /美通社/ -- 德州儀器(TI)今日推出了一種新型音頻模數轉換器
  • 語音「召喚」下模數轉換器如何應對?
    德州儀器(TI)音頻產品市場工程師Abhi Muppiri表示:「在實際應用場景當中,由於距離遠或空間大而導致採集的音量過小,往往會影響語音控制的效果。此外,在嘈雜的環境中,能否準確識別聲音信號亦是挑戰。」而且,由於智能家電所處「位置」和對麥克風的不同配置要求,語音方案需要進行靈活有效的調整。
  • 不用吼不怕吵,新型Burr-Brown ADC讓AI音箱擁有「順風耳」
    於此同時,不少傳統家電也開始有計劃於在自身產品中加入智能語音識別功能,來讓用戶直接通過語音便能進行控制。 TI新型Burr-Brown音頻ADC發布 11月21日,德州儀器推出了一種新型音頻模數轉換器(ADC),其主打的特性就在於能夠比行業同類產品遠4倍的距離以外採集到清晰的語音。
  • 智能音箱市場爆發式增長,遠場音頻採集挑戰得以解決
    隨著中國智能音箱市場的迅速擴張,智能音箱在語音助理、智慧家居等方面扮演著愈發重要的角色。據國際調研機構 Canalys 預測,全球智能音箱安裝總數將從 2018年的1.14 億部增長到 2019 年的 2.079 億部。然而,音頻接收距離與噪音幹擾是目前亟待解決的挑戰。
  • 基於音頻功放集成晶片LM4766實現高保真音頻功放器的設計
    為主要元器件的高保真音頻功率放大器,其克服了A類音頻功率放大器效率低和B類音頻功率放大器信號容易產生交越失真的缺點,同時也克服了傳統音頻功率放大器推動中小型音箱時存在的音色單薄、纖弱的缺點,具有放大倍數高,工作穩定,失真度極小等優點,可廣泛應用於多種對音質要求較高的場合,如車載音響設備和KTV等場合。
  • 高保真無延遲,畢亞茲音頻延長線上手體驗
    這時候就想起耳機的好處了,不過一般的耳機線都不是特別長,連接上電視後也要湊近電視才能用,這時候就需要一款音頻延長線。今天給大家帶來畢亞茲高保真無延遲音頻延長線上手體驗。適用多設備這款畢亞茲音頻延長線適用所有3.5mm音頻口設備的延長連接,例如:家裡的電視、工作的電腦、筆記本、手機、MP3等,接孔除了連接耳機外,還可以連接音響。
  • 選擇高保真Type-C轉音頻線,暢想音樂時刻
    而當下的轉接口雖然層出不窮,但是市面上魚龍混雜,質量難以保證,選擇品質更好的數據線才能享受音樂帶來的高保真享受,畢亞茲在這一領域專注品質與質量,材質均選擇符合行業標準的高品質原材料,並且物美價廉,能夠更好的滿足初級到中級音頻發燒友的選擇。
  • 第51節:利用ADC0832採集電壓信號進行濾波處理
    為了有效去除幹擾,當發現變量有變化時,我會連續採集N次,如果連續N次都是一致的結果,我才認為不是幹擾。如果中間只要出現一次不一致,我會馬上把計數器清零,這一步是精華,很關鍵。具體內容,請看原始碼講解。(1) 硬體平臺.基於朱兆祺51單片機學習板。(2)實現功能:本程序有2個局部顯示。
  • NVIDIA發布RTX Voice:一個AI驅動的音頻降噪軟體
    RTX顯卡除了可以給你提供實時光追和DLSS等發揮在遊戲圖形上面的技術以外,還有其他特別的用處,比如說,NVIDIA最近發布了一款RTX Voice的軟體,它依靠RTX系列顯卡的相關硬體能力,運用人工智慧來對語音進行主動降噪。
  • 加速度傳感器 語音密碼識別 原來手機是這樣「竊聽」的!
    成果表明,智慧型手機App可在用戶不知情、無需系統授權的情況下,利用手機內置加速度傳感器採集手機揚聲器所發出聲音的震動信號,實現對用戶語音的竊聽。例如,用戶A通過語音消息給用戶B發送了一段銀行卡密碼。當用戶B播放這段音頻時,一個採集運動數據的App可以在後臺採集對應的加速器數據,進而通過分析加速器數據識別出語音信息中包含的密碼。「根據我們的實驗結果,在安靜環境中,我們的模型可以準確識別出語音信息中86%的數字。即使是在嘈雜的環境中(例如有人說話的實驗室或播放音樂的酒吧),模型也可以達到80%以上的準確率。」
  • 通過加速度計竊聽,借超聲波劫持語音助手
    近日,在國際信息安全界頂級會議「網絡與分布式系統安全會議(NDSS 2020)」上,一項由浙江大學網絡空間安全學院任奎團隊和加拿大麥吉爾大學、多倫多大學團隊的聯合研究發現,當前智慧型手機軟體可以在用戶不知情且無需系統授權的情況下,利用手機內置加速度傳感器(俗稱 「加速度計」)實現對用戶語音通話的竊聽,其成功率可高達 90%。
  • 高清語音視頻通話 小度在家1C濟南促銷
    圖為:小度在家 1C       小度在家 1C有84度超寬視角攝像頭可以滿足用戶無論身在何地,都可以隨時與家人視頻通話;強大的語音交互功能,可以做到與小度即時交互,語音拍照讓幸福時刻不會輕易溜走,時刻記錄生活美好瞬間
  • Python語音合成指北(一)
    論文連結Deep Voice 2: 多說話人神經文本語音轉換,它與DeepVoice 1類似,但它在音頻質量上卻有顯著的提高。該模型能夠從每個說話人不到半個小時的語音數據中學習數百種獨特的聲音。論文連結Parallel WaveNet: 快速高保真語音合成,該模型來自谷歌,它引入了一種叫做概率密度蒸餾的方法,它從一個訓練過的WaveNet中訓練一個並行前饋網絡。該方法是通過結合逆自回歸流(IAFS)和波形網(WaveNet)的最佳特徵構建的。這些特徵代表了WaveNet的有效訓練和IAF網絡的有效採樣。
  • SAR ADC與Sigma Delta ADC有什麼不一樣?
    工程師郭婷 發表於 2018-08-16 00:15:00 sigma-delta adc的原理
  • 環境太嘈雜語音助手不好用?siri文字也能看懂
    【環球網智能報導記者張陽】據國外科技網站9to5mac.com5月11日報導,近日蘋果公司申請了一項新專利,將允許用戶在iMessage中控制Siri,而不是通過語音交互。蘋果的這項新專利將允許用戶無需與這個語音助手進行對話便能直接使用它。蘋果在專利描述中這樣解釋:「可以接收用戶輸入並且進行響應,用戶輸入可以作為第一消息顯示在GUI(圖形用戶界面)中。
  • 更簡單、更高效,且具有高保真能力的放大器設計
    更簡單、更高效,且具有高保真能力的放大器設計 工程師黃明星 發表於 2018-06-27 09:12:00 綠色能源標準、更低成本和更高音頻保真度的需求正在推動D類放大器在高功率音頻中的應用
  • 語音識別技術概述
    信號處理和特徵提取可以視作音頻數據的預處理部分,一般來說,一段高保真、無噪聲的語言是非常難得的,實際研究中用到的語音片段或多或少都有噪聲存在,所以在正式進入聲學模型之前,我們需要通過消除噪聲和信道增強等預處理技術,將信號從時域轉化到頻域
  • 科勝訊AudioSmart助力韓國首個具備遠場語音識別功能的智能音箱
    科勝訊AudioSmart技術助力韓國首個具備遠場語音識別功能的智能音箱 SK Telecom攜手科勝訊公司開發出首個具有韓語自然語言處理能力的智能音箱,即使在嘈雜環境中,該設備仍然能精確聽到用戶的指令。
  • 天津億聯 高清語音IP電話SIP-T26P特價
    圖為:億聯三線主管級高清語音IP電話SIP-T26P    億聯SIP-T26P採用TI TITAN晶片組及TI音頻引擎,帶背光132x64解析度圖形液晶屏,支持中文顯示。擁有3個SIP帳號,支持3方語音電話會議,快速拔號。