聊聊實時音視頻中的技術難點:回聲消除+噪聲消除

2020-12-19 Juphoon菊風

文 | 菊風媒體引擎資深研究團隊

在各個實時音視頻互動場景中,回聲和噪聲對於影響用戶體驗而言都是很大的問題。音視頻正在發展成為網際網路線上溝通的必然趨勢,在自然的交流環境中,回聲和噪聲是非常影響溝通體驗的。不論是社交、教育、直播場景中的「疑難雜症」或是智能硬體通話中的「痛點問題」還是銀行視頻客服和企業視頻會議的「嚴格要求」,都與回聲噪音有關,因為人對音頻都很敏感,聲音一旦有任何瑕疵,人耳都會特別容易感覺到,而且難以忍受,這都會直接影響到用戶體驗及用戶留存率。而回聲消除與噪聲消除也一直是實時音視頻的技術難點。

菊風音視頻引擎(Multi-Media Engine – MME)是針對 IP實時音視頻通信所設計的涵蓋音視頻QoS處理、音視頻編解碼、網絡打包傳以及設備管理的四大模塊的專業開發包。開發包具有豐富的音視頻技術模塊,其中的語音部分就包含聲學回聲消除、噪音消除等等。

聲學回聲消除AEC

聲學回聲是在麥克風採集了近端聲音的同時也採集了揚聲器發出來的聲音,如果沒有回聲消除模塊(Acoustic Echo Cancelation – AEC),對端將聽到自己的聲音又被傳了回來,這就是惱人的回聲產生的原理。容易理解,語音通話中,通常聲學回聲是在用戶打開了免提模式,即開啟揚聲器時產生的,不打開免提模式的情況下一般不需要啟用AEC。但是,有時候由於結構設計的問題,儘管沒有打開免提模式,聽筒上的聲音也可能作為回聲被麥克風採集到,此時也需要使用AEC。

消除回聲就像把紅墨水倒進藍墨水裡,混合在一起,然後要求把紅墨水從藍墨水中分離出來,這存在著很大的技術難度。對於採集端來說,無論是近端的聲音,還是揚聲器播放出來的聲音,都是從空氣中無差別地採集到的聲音。對機器來說,遠端信號播放出來的聲音和近端的聲音是沒有任何區別的,就像對水來說紅墨水和藍墨水沒有區別一樣。回聲消除的工作就是要把沒有任何區別的遠端回聲和近端聲音分離。AEC算法的基本思路是,參考遠端信號將混有回音的近端信號「減去」回聲。然而由於Speaker和MIC的模數轉換和回聲多途效應等因素,回聲和遠端參考信號具有非線性失真,無法做到完全消除回聲的同時確保近端信號質量不下降,因此可能有回聲殘留或近端信號質量下降或被抑制。

菊風自研的音視頻引擎自適應回聲消除,可自動適配市場上各類新舊機型,大規模節約調試和部署成本。實際測試表明,AEC能顯著改善雙端通話的質量,下圖是實測的回聲消除前和回聲消除後的語音質量的MOS(Mean Opinion Score)分的對比,Sig表示信號維度的質量,Echo表示回聲消除維度的質量,Ovrl表示總體質量。

噪聲消除

除了回聲消除,噪聲消除也是實時音視頻中的必修課。噪聲消除是一個十分複雜的技術,不同的環境噪聲所需要的處理方法是不同的,純軟體的噪聲消除的能力也是有限的,有條件採用帶有消噪能力的雙麥克風的平臺可以獲得更佳的消噪質量。

MME主要是通過軟體的方式對噪聲進行消除,它可以對輸出和輸入兩個方向的語音信號進行處理,即對近端信號和遠端信號處理,前者的調用接口為Mvc_DspSetAnrEnable(),後者調用接口為Mvc_DspSetRxAnrEnable()。如果兩個通信端都採用了菊風MME,只要打開一個方向的噪聲消除功能即可,同時進行兩個處理過程跟一個過程相比不會提高信噪比(Signal-to-Noise Ratio : SNR),也不會提高語音質量。但如果另一個終端採用的是第三方媒體處理模塊,且傳過來的信號噪音比較大,則需要對遠端信號進行處理,因此默認兩個噪聲消除的接口都打開。從數位訊號處理角度來說,對遠端信號和近端信號進行噪聲消除是沒有區別的,下圖對比了語音疊加噪音信號經MME處理前後的波形。

從三個方面考查噪聲消除模塊的性能:其一是信號的保真度,要做到有效的語音信號不損失或微損失;其二是噪聲消除了多少的考量,在信號不損失或微損失的情況下,做到儘可能的消除噪聲;其三是聲音給測試人員的整體感受,最終給測試人員的感受才是最有效的考量。下圖是基於ITU-T P.835標準,對疊加了噪音信號經過MME的處理後的MOS分對比。實驗表明,在平均-30dbov白噪音情況下,SNR上升12db,MOS上升1.13。

Sig - Speech signal rating scale

Bak - Background noise rating scale

Ovrl - Overall quality rating scale

相關焦點

  • 搭載聲加科技回聲消除技術,華為Free GO便攜藍牙音箱實現全雙工...
    為更好地滿足電話會議的通話需求,Free Go採用了來自聲加科技的回聲消除技術,實現360° 全方位、超強拾音,清晰傳達每一次精彩瞬間;3 米拾音範圍,輕鬆覆蓋 25 平米室內空間;採用雙麥克風密閉腔體設計,配合 AEC 自適應回聲抑制算法,有效抑制回聲;支持全雙工對講技術,讓語音交流如面對面般清晰順暢。
  • 太空狼人殺火爆的背後 實時遊戲語音有哪些技術難點?
    ,方便開發者快速在遊戲中加入實時音視頻功能。   今天我們重點展開介紹一下實時遊戲語音背後的技術難點:   首先,我們先盤點一下在遊戲內實時語音的場景下,經常會出現的一些問題:1、高延時,在與遊戲隊友語音溝通時出現較高的延時,隊友講話後兩三秒才能聽到。2、音質太差,甚至會有鍵盤聲、風扇聲、地鐵或火車站內的各類噪音,聽不清隊友講什麼。3、有回聲,跟遊戲隊友溝通能聽到自己回聲。
  • 太空狼人殺火爆的背後 實時遊戲語音有哪些技術難點
    Cocos creator,方便開發者快速在遊戲中加入實時音視頻功能。今天我們重點展開介紹一下實時遊戲語音背後的技術難點:首先,我們先盤點一下在遊戲內實時語音的場景下,經常會出現的一些問題:1、高延時,在與遊戲隊友語音溝通時出現較高的延時,隊友講話後兩三秒才能聽到。2、音質太差,甚至會有鍵盤聲、風扇聲、地鐵或火車站內的各類噪音,聽不清隊友講什麼。3、有回聲,跟遊戲隊友溝通能聽到自己回聲。
  • 太空狼人殺火爆實時遊戲語音有哪些難點
    Cocos creator,方便開發者快速在遊戲中加入實時音視頻功能。今天我們重點展開介紹一下實時遊戲語音背後的技術難點:首先,我們先盤點一下在遊戲內實時語音的場景下,經常會出現的一些問題:1、高延時,在與遊戲隊友語音溝通時出現較高的延時,隊友講話後兩三秒才能聽到。2、音質太差,甚至會有鍵盤聲、風扇聲、地鐵或火車站內的各類噪音,聽不清隊友講什麼。3、有回聲,跟遊戲隊友溝通能聽到自己回聲。4、聲音卡頓,語音交流中出現卡頓,丟失關鍵信息。
  • 最低延遲66ms,融雲帶來更流暢的實時音視頻服務體驗
    實時音視頻性能實現全面升級  融雲實時音視頻服務以3.0為起點,從實踐出發,在應用中不斷總結優化,使此次升級版各項性能指標和技術優勢突顯  值得一提的是,升級版本提供高清音樂模式,針對樂器的高頻音段和弱音音階進行優化處理,高度還原音樂細節,帶給用戶更貼近線下場景的體驗,音域範圍廣,音強、音調還原度高,噪聲回聲控制好,在回聲消除、快速降噪、聲音增益、嘯叫抑制方面均表現出眾,力求帶來高保真音質的極致體驗。
  • 網易雲信流媒體首席架構師:新一代音視頻技術架構如何構建?
    前言5G 與 AI 時代已來,音視頻技術持續迭代升級,網易雲信推出了全新一代音視頻技術架構。新一代音視頻架構有哪些核心技術?各技術在線上場景又有哪些落地實踐方案?在 5G 和 AI 技術變革的推動下,網易雲信在原有音視頻架構的基礎上迭代升級,推出了新一代音視頻技術架構,對音視頻全流程都做了重大升級,主要包括三大架構升級,分別是:新一代音視頻融合通信服務端系統、新一代音視頻 SDK 以及新一代音視頻引擎。
  • 即構科技:專攻音視頻技術壁壘,將用戶體驗做到極致
    底層的技術支持便是實時音視頻傳輸技術。自2016年起,直播又與電商結合,暴發出強大的能量。從去年起,聲音社交、在線看電影交朋友等新型社交app相繼出現。相應地,這些軟體對於底層音視頻傳輸技術要求越來越高,以滿足它們越來越豐富的功能和日益增長的用戶帶來的低層技術的挑戰。
  • 焦作市反滲透純水設備DN80橡膠軟接頭消除噪聲
    焦作市反滲透純水設備DN80橡膠軟接頭消除噪聲(柴油軟連接)Yunfu water chiller equipped with DN200 sewage treatment plant flexible joint
  • 索尼真無線降噪藍牙耳機WF-1000XM3 消除幹擾減少噪聲的折磨
    首頁 > 傳媒 > 關鍵詞 > 索尼最新資訊 > 正文 索尼真無線降噪藍牙耳機WF-1000XM3 消除幹擾減少噪聲的折磨
  • 實時音視頻成主流互動方式,備受健身瑜伽、VR遊戲等場景青睞
    賦能金融、IoT、醫療等產業,實時音視頻融入生活各層面徐靖辰介紹,在金融、企業協作、IoT、醫療等行業,實時音視頻的用量增勢明顯,例如湖南三湘銀行的視頻銀行業務、眾安保險的馬上賠視頻車險等均使用了聲網的實時音視頻技術,業務使用人數相比去年已有明顯的增長;疫情期間,在WPS+、雲之家、柚子會議等企業協作平臺,實時音視頻的用量相比平時有了數倍的增長。
  • 廣西華為CloudLink Box600熱銷 噪聲抑制-華為 CloudLink Box600...
    華為CloudLink Box600提升視頻質量,節省50%帶寬;支持AAC-LD雙聲道寬頻語音和Opus,獨有的回聲抵消和噪聲抑制技術,提供高保真語音效果。    華為CloudLink Box600內置智能語音助手,通過語音指令,完成召集會議、加入會議、呼叫會場、音量控制等功能;結合人臉識別技術,快速顯示與會人電子銘牌信息,自動完成會議籤到。
  • 一文讀懂TWS耳機異音,底噪,回聲測試難點
    測試員在聽音時因工廠環境原因也難以分辨出來,但在實際使用過程中又很容易發現的不良,造成客戶投訴及批量退貨。這就是異(常)音,底噪和回聲問題。下面我們基於這三者的表象,原因以及測量方法做些介紹。一、耳機異(常)音異(常)音泛指耳機喇叭漏氣、雜音、振音等非正常音。
  • 優刻得URTC實時音視頻助力企業構建新一代音視頻生產工具
    10月23日UCloud 優刻得TIC大會技術分論壇直播中UCloud優刻得邊緣計算產品線經理裴志偉圍繞實時音視頻優刻得URTC的產品特點以及應用案例進行了精彩的分享,本文整理自演講內容。
  • 作業幫羅亮:基礎音視頻服務和AI視覺語音是直播課技術兩大核心
    就直播技術而言有兩大核心,一是基本的音視頻傳輸能力和互動能力,二是利用AI技術提升學生課堂中的互動效果。以下為羅亮的演講實錄:尊敬的各位嘉賓大家好!我是來自作業幫的羅亮,今天分享主題是《後疫情時代作業幫在教育科技的探索》。我是在教育行業裡面做技術的,其實可以看得出來,在線教育的最大價值就是用科技的力量把知識分發到每一個有需求的學生身邊。
  • 如何消除電子設備電路中的電磁幹擾
    在通信、消費、軍工、航空航天等領域,ESD往往是引起電路失效的罪魁禍首,而過流過壓保護器件選擇、傳導輻射電磁幹擾消除、EMC測試環境等問題成為工程師在設計時的難點,這些問題該怎麼解決呢? 一、電路保護從元器件選型開始 電路保護元器件通常包括過壓保護器件和過流保護器件兩種,工程師需要針對各種元器件的特點和不同的應用類型進行選擇。
  • 艾索陝西信訪局視頻接訪會議系統解決方案
    三、解決方案   1.音視頻核心管理系統   DMX-II音視頻會議管理一體機集成了智能混音、回聲消除、噪聲消除以及反饋抑制等功能,使用一臺DMX-II音視頻會議管理一體機就可以實現原本多臺音頻處理器才能實現的功能,同時解決會議室現場擴聲嘯叫現象、遠程視頻會議召開的回聲問題、音頻文件錄製保存時的噪聲問題以及系統連接、調試
  • 驍龍AI 與有道攜手,利用實時翻譯架起世界溝通的橋梁
    儘管我們能夠向全球各地發送消息、撥打電話或是視頻聊天,但仍不能進行跨語言的流暢交談。現在,國內領先的智能學習公司——有道,正利用AI來解決這一問題。過去一年半的時間,Qualcomm持續與有道開展合作,通過終端側的實時翻譯來幫助人們打破語言的限制、輕鬆自如地進行溝通。想像一下:你與海外客戶進行電話會議。
  • 開心超人消除
    開心超人消除是一款趣味性非常強的休閒益智類遊戲,遊戲的各種操作非常的簡單快捷,能夠讓不同年齡段的玩家在線進行消除,幫助玩家釋放更多的工作以及生活壓力,讓玩家的心情變得更加的放鬆,遊戲給玩家提供了海量的遊戲關卡,能夠讓玩家在這款遊戲中一直暢玩下去。
  • 音視頻技術開發周刊|172
    ,我們通常可以使用libx264, ffmpeg等第三方視頻編碼庫,但是如果對編碼的速度有一定的要求,要實現實時甚至超實時的高速視頻編碼,我們並沒有太多選項,只能使用Android提供的MediaCodec硬編碼模塊。