音頻壓縮技術原理

2021-01-15 電子發燒友
打開APP
音頻壓縮技術原理

發表於 2017-10-17 15:37:14

  音頻壓縮技術定義

  音頻信號能進行壓縮的依據是音頻壓縮技術。

  音頻壓縮技術指的是對原始數字音頻信號流(PCM編碼)運用適當的數位訊號處理技術,在不損失有用信息量,或所引入損失可忽略的條件下,降低(壓縮)其碼率,也稱為壓縮編碼。它必須具有相應的逆變換,稱為解壓縮或解碼。音頻信號在通過一個編解碼系統後可能引入大量的噪聲和一定的失真。

  在音頻壓縮領域,有兩種壓縮方式,分別是有損壓縮和無損壓縮。常見到的MP3、WMA、OGG被稱為有損壓縮,有損壓縮顧名思義就是降低音頻採樣頻率與比特率,輸出的音頻文件會比原文件小。另一種音頻壓縮被稱為無損壓縮,也就是所要說的主題內容。無損壓縮能夠在100%保存原文件的所有數據的前提下,將音頻文件的體積壓縮的更小,而將壓縮後的音頻文件還原後,能夠實現與源文件相同的大小、相同的碼率。無損壓縮格式有APE、FLAC、WavPack、LPAC、WMALossless、AppleLossless、La、OptimFROG、Shorten,而常見的、主流的無損壓縮格式只有APE、FLAC。

  音頻壓縮技術原理

  1、數字音頻相關特點

  數字音頻的質量取決於:採樣頻率和量化位數這兩個參數,為了保真在時間變化方向上取樣點儘量密,取樣頻率要高;在幅度取值上儘量細,量化比特率要高,直接的結果就是存儲容量及傳輸信道容量要求的壓力

  音頻信號的傳輸率=取樣頻率*樣本的量化比特數*通道數取樣頻率=441KHz

  樣本值的量化比特數=16

  普通立體聲的信號通道數=2

  數位訊號傳輸碼流大約14Mbit/s

  一秒鐘的數據量為14Mbit/(8/Byte)

  達1764 k byte(字節),等於88200個漢字的數據量

  數字音頻的出現,是為了滿足複製、存儲、傳輸的需求,音頻信號的數據量對於進行傳輸或存儲形成巨大的壓力

  音頻信號的壓縮是在保證一定聲音質量的條件下,儘可能以最小的數據率來表達和傳送聲音信息

  信號壓縮過程是對採樣、量化後的原始數字音頻信號流運用適當的數位訊號處理技術進行信號數據的處理,將音頻信號中去除對人們感受信息影響可以忽略的成分,僅僅對有用的那部分音頻信號進行編排,從而降低了參與編碼的數據量

  數字音頻信號中包含的對人們感受信息影響可以忽略的成分稱為冗餘,包括時域冗餘、頻域冗餘和聽覺冗餘

 2、時域冗餘


時域與頻域的差異
 

  時域冗餘的表現形式

  1)幅度分布的非均勻性

  信號的量化比特分布是針對信號的整個動態範圍而設定的,對於小幅度信號而言,大量的比特數據位被閒置

  2)樣值間的相關性

  聲音信號是一個連續表達過程,通過採樣之後,相鄰的信號具有極強的相似性,信號差值與信號本身相比,數據量要小的多

  3)信號周期的相關性

  聲音信息在整個可聞域的範圍內,每個瞬間只有部分頻率成分在起作用,即特徵頻率,這些特徵頻率會以一定的周期反覆出現,周期之間具有相關關係

  4)長時自我相關性

  聲音信息序列的樣值、周期相關性,在一個相對較長的時間間隔也會是相對穩定的,這種穩定關係具有很高的相關係數

  5)靜音

  聲音信息中的停頓間歇,無論是採樣還是量化都會形成冗餘,找出停頓間歇並將其樣值數據去除,可以減少數據量

  3、頻域冗餘

  頻域冗餘的表現形式

  1)長時功率譜密度的非均勻性

  任何一種聲音信息,在相當長的時間間隔內,功率分布在低頻部分大於高頻部分,功率譜具有明顯的非平坦性,對於給定的頻段而言,存在相應的冗餘

  2)語言特有的短時功率譜密度

  語音信號在某些頻率上會出現峰值,而在另一些頻率上出現谷值,這些共振峰頻率具有較大的能量,由它們決定了不同的語音特徵,整個語言的功率譜以基音頻率為基礎,形成了向高次諧波遞減的結構

  4、聽覺冗餘

  根據分析人耳對信號頻率、時間等方面具有有限分辨能力而設計的心理聲學模型,將通過聽覺領悟信息的複雜過程,包括接受信息,識別判斷和理解信號內容等幾個層次的心理活動,形成相應的連覺和意境

  由此構成聲音信息集合中的所以數據,並非對人耳辨別聲音的強度、音調、方位都產生作用,形成聽覺冗餘

  由聽覺冗餘引出了降低數據率,實現更高效率的數字音頻傳輸的可能

打開APP閱讀更多精彩內容

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容圖片侵權或者其他問題,請聯繫本站作侵刪。 侵權投訴

相關焦點

  • 藍牙音頻編解碼器解釋:比較'無損'與'有損'壓縮
    壓縮首先,我們來談談音頻壓縮。壓縮是一種算法,其中某些音頻被刪除(壓縮)以減小文件大小。現代壓縮算法通常在這方面非常擅長並且消除了對大多數人來說聽不見的頻率。這很重要,因為藍牙音頻壓縮因編解碼器而異。有一種常見的誤解,即由於其壓縮方法,藍牙音頻永遠不會像有線一樣好,但事實並非如此。一些編解碼器允許有損,而其他編解碼器允許完全無損的音頻流。那麼讓我們談談編解碼器。
  • 音頻分析原理
    聲音經過模擬設備記錄或再生,成為模擬音頻,再經數位化成為數字音頻。這裡所說的音頻分析就是以數字音頻信號為分析對象,以數位訊號處理為分析手段,提取信號在時域、頻域內一系列特性的過程。各種特定頻率範圍的音頻分析有各自不同的應用領域。
  • 耳聽為虛眼見為實,來聊聊音頻技術參數解析
    2.立體聲雙聲道就是有兩個聲音通道,其原理是人們聽到聲音時可以根據左耳和右耳對聲音相位差來判斷聲源的具體位置。聲音在錄製過程中被分配到兩個獨立的聲道,從而達到了很好的聲音定位效果。這種技術在音樂欣賞中顯得尤為有用,聽眾可以清晰地分辨出各種樂器來自的方向,從而使音樂更富想像力,更加接近於臨場感受。
  • 音頻處理器與調頻發射機的結合運用
    音頻處理原理 1、壓縮 壓縮的動作是當節目信號電平的平均值或均方根值超過壓縮門限值時,經由降低該信號的增益而形成的,於是該節目的動態範圍被壓縮了,自動增益控制(AGC)放大器就是壓縮器,壓縮器減小了輕聲與響聲間的電平差距,更充 分地利用允許的峰值電平範圍,使輕聲部分的響聲在主觀上增加了,但是卻不會使響聲部分的響度更響
  • 音頻處理器與調頻發射機的結合運用 ​
    音頻處理原理   1、壓縮   壓縮的動作是當節目信號電平的平均值或均方根值超過壓縮門限值時,經由降低該信號的增益而形成的,於是該節目的動態範圍被壓縮了,自動增益控制(AGC)放大器就是壓縮器,壓縮器減小了輕聲與響聲間的電平差距,更充 分地利用允許的峰值電平範圍,使輕聲部分的響聲在主觀上增加了,但是卻不會使響聲部分的響度更響 。
  • 語音處理檢測技術端點檢測、降噪和壓縮詳解
    本文引用地址:http://www.eepw.com.cn/article/201710/367885.htm  為了能和您一起了解端點檢測和降噪的基本原理,帶您一起一窺音頻壓縮的奧秘,科大訊飛資深研發工程師李洪亮將為我們詳解語音處理檢測技術中的熱點——端點檢測、降噪和壓縮 。
  • 什麼是有損和無損音頻格式,常見音頻有哪些?
    音頻格式是指要在計算機內播放或是處理音頻文件,是對聲音文件進行數、模轉換的過程。目前音樂文件播放格式分為有損壓縮和無損壓縮兩種。使用不同的格式的音樂文件,在音質的表現上有差很大的差異。有損和無損壓縮的區別:有損壓縮就是降低音頻採樣頻率與比特率,輸出的音頻文件會比原文件小。而無損壓縮,能夠在100%保存原文件的所有數據的前提下,將音頻文件的體積壓縮的更小,而將壓縮後的音頻文件還原後,能夠實現與源文件相同的大小、相同的碼率。
  • 無線音頻技術講解(全)
    其工作原理是,保持載波的頻率不變,通過其震蕩的幅度來傳遞信息,這正好與調頻的原理相反。所以,我們下面所介紹的藍牙的工作原理、特點等,均是參考這幾個版本的協議來說的。而這主要還是在於其工作原理,和採用的調頻方式方面的原因。    2.4G技術使用的是自動調頻技術,理解起來很容易——它就是說:2.4G設備在工作時,如果發現該頻段經常被佔用,它就會自動跳到一個無人使用的頻段,這種跳頻的方法隨意性很強。
  • 詳細HD音頻格式大全! 讓你一看就明白
    這種音頻沒有見過,大家有了解的嗎??    3.杜比數字+技術(Dolby Digital Plus、DD+)    高清圖像的完美伴音,杜比®數字+技術是專為所有的高清節目與媒體所設計的下一代音頻技術。它的編碼效率能夠滿足將來的廣播需求,並且具有強大的功能與靈活性,能夠實現即將到來的高清娛樂體驗的全部音頻潛力。
  • 被壓縮的視覺:視頻編解碼技術
    對於數據量巨大的YUV視頻數據,需要壓縮後才能存儲與傳輸。2. 壓縮原理壓縮視頻信息與壓縮文件信息不同,在視頻中存在著大量的冗餘信息。如圖2所示,相鄰幀之間的相似性會有時間上的冗餘,同一幀的相鄰塊之間存在著空間上的冗餘,由於人眼感知對於低頻信息更敏感,所以存在著感知上的冗餘。
  • 基於小波變換與DSP的實時音頻視頻處理系統
    面對龐大的音/視頻數據量,作為語音及圖像處理的壓縮技術便在多媒體通信中顯得極為重要。隨著多媒體通信技術和超大規模集成電路(vlsi)技術的飛速發展,這一技術將會在眾多領域得到更為廣泛的應用。本文引用地址:http://www.eepw.com.cn/article/20901.htm 1 音/視頻實時處理系統 低碼率視頻通信的主要技術問題是音/視頻壓縮編碼技術,即用來實現在滿足足夠質量和硬體成本的條件下降低所需的碼率。小波變換充分利用人眼的視覺特性,克服了重構圖像會出現的塊效應、蚊子效應、模糊等現象。
  • 了解無線音頻:無線電技術及FM/AM廣播
    而作為最最受限制的音頻設備,這兩年來也試圖擺脫線材的束縛。    之前,我們已經曾經為大家集中介紹過這樣的一些產品(詳情請見《沒見過就out了!10款無線音頻設備欣賞》)。但是,無線音頻究竟是怎麼樣的概念,究竟是怎麼一回事兒,我們將從本期開始陸續為大家介紹相關的技術知識和應用。
  • 漲姿勢:常用音頻格式的區別
    筆者作為一個音頻設備的發燒友,也自認為算是一個音樂的發燒友,收藏的唱片和音樂文件也並不算少,對於不同的音頻格式來說,可以說主流的音頻格式都使用過也並不深入的研究過,雖然對於及其深度的技術方面來說也許並不甚了解,但是對於它們之間的區別還是可以做一個簡單的分享的。
  • 音頻技術解析:純理論對比PCM和DSD
    一直以來,很多HiFi發燒友在聊音樂的時候,經常會談論到關於音樂文件採樣、位深、碼率的相關技術參數。44.1kHz/16bit、96kHz/24bit、192kHz/24bit這種PCM波形規格到底意味著什麼、DSD這種全新的規格音質有何優勢?今天筆者就以純理論的角度為大家對比一波WAV和DSD兩種文件,歡迎大家進行參考。
  • 音頻信號及音頻分析
    聲音經過模擬設備記錄或再生,成為模擬音頻,再經數位化成為數字音頻。這裡所說的音頻分析就是以數字音頻信號為分析對象,以數位訊號處理為分析手段,提取信號在時域、頻域內一系列特性的過程。各種特定頻率範圍的音頻分析有各自不同的應用領域。
  • 壓縮空氣儲能技術研發現狀及應用前景
    為解決傳統壓縮空氣儲能的技術瓶頸問題,近年來,國內外學者開展了新型壓縮空氣儲能技術研發工作,包括絕熱壓縮空氣儲能、蓄熱式壓縮空氣儲能及等溫壓縮空氣儲能(不使用燃料)、液態空氣儲能(不使用大型儲氣室)、超臨界壓縮空氣儲能(不使用大型儲氣室、不使用燃料)等。
  • 智能語音機器人工作原理解析,淺談VAD技術
    同時他們工作原理也大致相同。一般智能語音助理或語音機器人工作原理大致如下:第一階段:語音到文本的過程。信號源→設備(捕獲音頻輸入)→增強音頻輸入→檢測語音→轉換為其他形式(如文本)第二階段:響應過程。處理文本(如用NLP處理文本,識別意圖)→操作響應。
  • 4G圖傳移動執法視頻壓縮技術淺述
    視頻壓縮淺述對於算法研究而言,本身就是要先知道哪個地方可以努力,哪些地方行不通。這些原理,就是指明方向的。一.視頻壓縮的可行性1.空間冗餘一幅靜態圖像,比如人臉。背景,人臉,頭髮等處的亮度,顏色,都是平緩變化的。
  • DAS-D系列AES/EBU數字音頻處理器
    【慧聰通信網】數字音頻處理器是北京國廣電科技公司(中央電視發射臺科技公司)研發生產的新一代AES3、S/PDIF信號處理器,該設備具有人聲識別功能;自動增益控制功能保證了播出節目的電平穩定,同時用戶可通過調節AGC
  • 新手小白必讀 3分鐘看懂常見數字音頻接口
    光纖接口光纖接口的英文名字為「TOSLINK」,它來源於東芝(TOSHIBA)制定的技術標準,器材上一般都會標有「Optical」的字符。光纖的物理接口分為兩種類型,一種是標準方頭,另一種則是在便攜設備上比較常見的外觀與3.5mmTRS接頭類似的圓頭設計。