聊聊實時音視頻中的技術難點:回聲消除+噪聲消除

2020-12-11 Juphoon菊風

文 | 菊風媒體引擎資深研究團隊

在各個實時音視頻互動場景中,回聲和噪聲對於影響用戶體驗而言都是很大的問題。音視頻正在發展成為網際網路線上溝通的必然趨勢,在自然的交流環境中,回聲和噪聲是非常影響溝通體驗的。不論是社交、教育、直播場景中的「疑難雜症」或是智能硬體通話中的「痛點問題」還是銀行視頻客服和企業視頻會議的「嚴格要求」,都與回聲噪音有關,因為人對音頻都很敏感,聲音一旦有任何瑕疵,人耳都會特別容易感覺到,而且難以忍受,這都會直接影響到用戶體驗及用戶留存率。而回聲消除與噪聲消除也一直是實時音視頻的技術難點。

菊風音視頻引擎(Multi-Media Engine – MME)是針對 IP實時音視頻通信所設計的涵蓋音視頻QoS處理、音視頻編解碼、網絡打包傳以及設備管理的四大模塊的專業開發包。開發包具有豐富的音視頻技術模塊,其中的語音部分就包含聲學回聲消除、噪音消除等等。

聲學回聲消除AEC

聲學回聲是在麥克風採集了近端聲音的同時也採集了揚聲器發出來的聲音,如果沒有回聲消除模塊(Acoustic Echo Cancelation – AEC),對端將聽到自己的聲音又被傳了回來,這就是惱人的回聲產生的原理。容易理解,語音通話中,通常聲學回聲是在用戶打開了免提模式,即開啟揚聲器時產生的,不打開免提模式的情況下一般不需要啟用AEC。但是,有時候由於結構設計的問題,儘管沒有打開免提模式,聽筒上的聲音也可能作為回聲被麥克風採集到,此時也需要使用AEC。

消除回聲就像把紅墨水倒進藍墨水裡,混合在一起,然後要求把紅墨水從藍墨水中分離出來,這存在著很大的技術難度。對於採集端來說,無論是近端的聲音,還是揚聲器播放出來的聲音,都是從空氣中無差別地採集到的聲音。對機器來說,遠端信號播放出來的聲音和近端的聲音是沒有任何區別的,就像對水來說紅墨水和藍墨水沒有區別一樣。回聲消除的工作就是要把沒有任何區別的遠端回聲和近端聲音分離。AEC算法的基本思路是,參考遠端信號將混有回音的近端信號「減去」回聲。然而由於Speaker和MIC的模數轉換和回聲多途效應等因素,回聲和遠端參考信號具有非線性失真,無法做到完全消除回聲的同時確保近端信號質量不下降,因此可能有回聲殘留或近端信號質量下降或被抑制。

菊風自研的音視頻引擎自適應回聲消除,可自動適配市場上各類新舊機型,大規模節約調試和部署成本。實際測試表明,AEC能顯著改善雙端通話的質量,下圖是實測的回聲消除前和回聲消除後的語音質量的MOS(Mean Opinion Score)分的對比,Sig表示信號維度的質量,Echo表示回聲消除維度的質量,Ovrl表示總體質量。

噪聲消除

除了回聲消除,噪聲消除也是實時音視頻中的必修課。噪聲消除是一個十分複雜的技術,不同的環境噪聲所需要的處理方法是不同的,純軟體的噪聲消除的能力也是有限的,有條件採用帶有消噪能力的雙麥克風的平臺可以獲得更佳的消噪質量。

MME主要是通過軟體的方式對噪聲進行消除,它可以對輸出和輸入兩個方向的語音信號進行處理,即對近端信號和遠端信號處理,前者的調用接口為Mvc_DspSetAnrEnable(),後者調用接口為Mvc_DspSetRxAnrEnable()。如果兩個通信端都採用了菊風MME,只要打開一個方向的噪聲消除功能即可,同時進行兩個處理過程跟一個過程相比不會提高信噪比(Signal-to-Noise Ratio : SNR),也不會提高語音質量。但如果另一個終端採用的是第三方媒體處理模塊,且傳過來的信號噪音比較大,則需要對遠端信號進行處理,因此默認兩個噪聲消除的接口都打開。從數位訊號處理角度來說,對遠端信號和近端信號進行噪聲消除是沒有區別的,下圖對比了語音疊加噪音信號經MME處理前後的波形。

從三個方面考查噪聲消除模塊的性能:其一是信號的保真度,要做到有效的語音信號不損失或微損失;其二是噪聲消除了多少的考量,在信號不損失或微損失的情況下,做到儘可能的消除噪聲;其三是聲音給測試人員的整體感受,最終給測試人員的感受才是最有效的考量。下圖是基於ITU-T P.835標準,對疊加了噪音信號經過MME的處理後的MOS分對比。實驗表明,在平均-30dbov白噪音情況下,SNR上升12db,MOS上升1.13。

Sig - Speech signal rating scale

Bak - Background noise rating scale

Ovrl - Overall quality rating scale

相關焦點

  • 非線性聲學回聲消除技術
    華為雲專注音視頻行業20多年,是如何處理非線性聲學回聲消除的,效果又如何?華為雲音視頻專家範展,將從非線性聲學回聲消除產生的原因、研究現狀、技術難點出發,詳細介紹華為雲音視頻團隊推出的雙耦合的聲學回聲消除算法以及實驗檢驗結果。
  • 華為便攜藍牙音箱Free GO正式上市 技術消除回聲
    為更好地滿足電話會議的通話需求,Free Go採用了來自聲加科技的回聲消除技術,實現360° 全方位、超強拾音,清晰傳達每一次精彩瞬間;3 米拾音範圍,輕鬆覆蓋 25 平米室內空間;採用雙麥克風密閉腔體設計,配合 AEC 自適應回聲抑制算法,有效抑制回聲;支持全雙工對講技術,讓語音交流如面對面般清晰順暢。
  • ...科技回聲消除技術,華為Free GO便攜藍牙音箱實現全雙工高清免提...
    憑藉在聲學和語音領域的十餘年的技術積累,其回聲抵消、噪聲抑制、聲源定位、混響消除、波束形成、語音喚醒等核心技術在行業內一直處於領先水平。為更好地滿足電話會議的通話需求,Free Go採用了來自聲加科技的回聲消除技術,實現360° 全方位、超強拾音,清晰傳達每一次精彩瞬間;3 米拾音範圍,輕鬆覆蓋 25 平米室內空間;採用雙麥克風密閉腔體設計,配合 AEC 自適應回聲抑制算法,有效抑制回聲;支持全雙工對講技術,讓語音交流如面對面般清晰順暢。
  • 乾貨:遊戲語音SDK如何解決回聲消除難題
    回聲消除技術做得比較好的產品有Tencent QQ和Microsoft Skype,以及即構科技Zego的遊戲語音SDK,開源的項目有WebRTC和Speex。在這些開源項目之前,回聲消除技術是大廠的獨門武藝,其它團隊只能靠自己一點一滴地摸索積累。在這些開源項目之後,WebRTC和Speex提供開源的AEC模塊,成為業界不錯的教材。
  • 搭載聲加科技回聲消除技術,華為Free GO便攜藍牙音箱實現全雙工...
    為更好地滿足電話會議的通話需求,Free Go採用了來自聲加科技的回聲消除技術,實現360° 全方位、超強拾音,清晰傳達每一次精彩瞬間;3 米拾音範圍,輕鬆覆蓋 25 平米室內空間;採用雙麥克風密閉腔體設計,配合 AEC 自適應回聲抑制算法,有效抑制回聲;支持全雙工對講技術,讓語音交流如面對面般清晰順暢。
  • 搭載聲加科技回聲消除技術,小米戶外藍牙音箱賦能高清暢聊
    小米戶外藍牙音箱海報,圖片來自小米官網據本次算法技術支持方案商——聲加科技CEO邱鋒海介紹,此款音箱採用了聲加科技提供的回聲消除技術(AEC),使用了雙麥克風精準拾音,來電時用戶可單擊電源鍵,對著音箱音量鍵標識下方的麥克風講話,即可實現免提通話。
  • 電腦麥克風電流聲解決方法,錄音設備噪聲抑制回聲消除圖文教程
    大家好,我是老蓋,感謝觀看本篇文章,本文做的也有視頻,也可以看我發布的視頻。對著屏幕右下角揚聲器音量圖標點右鍵,選擇錄音設備,也可以在控制面板中選擇聲音。在聲音錄製窗口中,我們找到自己的麥克風,對著它點右鍵屬性。
  • 搭載聲加科技回聲消除技術,華為Free GO便攜藍牙音箱實現全雙工高清免提會議體驗
    為更好地滿足電話會議的通話需求,Free Go採用了來自聲加科技的回聲消除技術,實現360° 全方位、超強拾音,清晰傳達每一次精彩瞬間;3 米拾音範圍,輕鬆覆蓋 25 平米室內空間;採用雙麥克風密閉腔體設計,配合 AEC 自適應回聲抑制算法,有效抑制回聲;支持全雙工對講技術,讓語音交流如面對面般清晰順暢。
  • 太空狼人殺火爆的背後 實時遊戲語音有哪些技術難點
    Cocos creator,方便開發者快速在遊戲中加入實時音視頻功能。今天我們重點展開介紹一下實時遊戲語音背後的技術難點:首先,我們先盤點一下在遊戲內實時語音的場景下,經常會出現的一些問題:1、高延時,在與遊戲隊友語音溝通時出現較高的延時,隊友講話後兩三秒才能聽到。2、音質太差,甚至會有鍵盤聲、風扇聲、地鐵或火車站內的各類噪音,聽不清隊友講什麼。3、有回聲,跟遊戲隊友溝通能聽到自己回聲。
  • 即構科技實時音視頻sdk,四步在應用內快速實現音視頻功能
    當代音視頻技術融計算機、聲音、文本、圖像、動畫、 視頻和通信等多種功能於一體,得益於網際網路技術的普及與發展,實現了音、視頻信息的資源共享。音視頻技術早已深入到人們日常生活、學習、工作、生產、管理等各個方面,它並正潛移默化地改變著我們生活的面貌。
  • Acoustic Technologies展示其噪音及回聲消除軟體
    Acoustic Technologies 和Tensilica今日宣布,Acoustic Technologies 的SoundClear移動語音2-MIC噪音及回聲消除軟體已經被移植至業界領先的音頻/語音DSP IP核--Tensilica HiFi
  • 音視頻傳輸挑戰如何破解?華為雲硬核技術為你揭曉答案
    近日,國內年度規模最大的音視頻技術峰會LiveVideoStackCon2020在北京舉行。華為雲作為國內重要的音視頻技術廠商,受邀出席。華為雲音視頻專家帶來兩場主題演講,詳細介紹了華為雲新媒體網絡價值主張和音視頻技術能力。2020年,電商直播、在線娛樂、在線教育、視頻會議等音視頻行業迅速爆發並急速增長。
  • Active Noise Cancelling-主動噪聲消除
    我們生活中充斥著各種噪聲,而隨著科技的進步,各種音頻降噪技術也不斷湧現。
  • 聲網發布首個基於Unity的遊戲實時音視頻SDK
    聲網首席音頻專家陳若非博士受邀做大會主題演講,和全球遊戲開發者分享《遊戲實時音視頻應用與技術解析》,並現場發布了首個基於Unity的遊戲實時音視頻SDK。陳若非博士認為,隨著手遊電競化、社交化和全球化,遊戲開發者越來越多地意識到,在手遊中集成遊戲語音和視頻對於提升遊戲本身的質量和用戶體驗,增加遊戲的社交屬性進而提升用戶粘性和用戶留存,具有重大意義。
  • 實時音視頻面視必備:快速掌握11個視頻技術相關的基礎概念
    ,已經不再局限於IM中的實時視頻聊天、實時視頻會議這種功能,在遠程醫療、遠程教育、智能家居等等場景也司空見慣。以IM中的實時音視頻聊天為例,一個簡化了的視頻聊天技術,本質就是:音視頻技術+網絡技術的組合體,如下圖所示:網絡模塊之上的部分,就是音視頻技術所涉及的範疇。
  • 音視頻技術開發周刊 | 174
    每周一期,縱覽音視頻技術領域的乾貨。新聞投稿:contribute@livevideostack.com。>https://toutiao.io/k/oodw8i5深入淺出 WebRTC AEC(聲學回聲消除
  • 聲網X 牛客網 200萬場視頻面試背後的實時互動技術支撐
    但同時,一場穩定、流暢的視頻面試過程對於求職與招聘者雙方而言也非常重要,這背後也離不開底層實時音視頻技術的支持。  聲網作為全球領先的實時互動API平臺, 為國內眾多主流招聘平臺提供了高質量、高並發、超低延時的實時互動解決方案,並有效保障了視頻面試過程中穩定、流暢的互動體驗。
  • 最低延遲66ms,融雲帶來更流暢的實時音視頻服務體驗
    實時音視頻性能實現全面升級  融雲實時音視頻服務以3.0為起點,從實踐出發,在應用中不斷總結優化,使此次升級版各項性能指標和技術優勢突顯。  值得一提的是,升級版本提供高清音樂模式,針對樂器的高頻音段和弱音音階進行優化處理,高度還原音樂細節,帶給用戶更貼近線下場景的體驗,音域範圍廣,音強、音調還原度高,噪聲回聲控制好,在回聲消除、快速降噪、聲音增益、嘯叫抑制方面均表現出眾,力求帶來高保真音質的極致體驗。
  • Python音視頻開發:實現消除抖音短視頻Logo的工具
    一、引言在《Python音視頻開發:消除抖音短視頻Logo和去電視臺標的實現詳解》節介紹了怎麼通過Python+Moviepy+OpenCV實現消除視頻Logo的四種方法本節的背景知識都在《Python音視頻開發:消除抖音短視頻Logo和去電視臺標的實現詳解》介紹了,在此就不重複介紹了。
  • 騰訊羅必達:評估與測試體系是音視頻通話技術的質量關鍵
    我叫羅必達,來自騰訊音視頻實驗室。來騰訊之前先後就職於微軟MSC和STC,從事MSN和必應搜索的測試開發工作,2011年加入騰訊,從事音視頻技術的研究,到現在已經六年多的時間了。首先給大家介紹一下,騰訊音視頻實驗室於2016年成立,它專注於音視頻的前瞻性研究,依託於QQ的海量平臺,在音視頻實時通訊和直播領域有著十多年的研究和豐富的經驗。