發表於 2017-10-17 15:37:14
音頻信號能進行壓縮的依據是音頻壓縮技術。
音頻壓縮技術指的是對原始數字音頻信號流(PCM編碼)運用適當的數位訊號處理技術,在不損失有用信息量,或所引入損失可忽略的條件下,降低(壓縮)其碼率,也稱為壓縮編碼。它必須具有相應的逆變換,稱為解壓縮或解碼。音頻信號在通過一個編解碼系統後可能引入大量的噪聲和一定的失真。
在音頻壓縮領域,有兩種壓縮方式,分別是有損壓縮和無損壓縮。常見到的MP3、WMA、OGG被稱為有損壓縮,有損壓縮顧名思義就是降低音頻採樣頻率與比特率,輸出的音頻文件會比原文件小。另一種音頻壓縮被稱為無損壓縮,也就是所要說的主題內容。無損壓縮能夠在100%保存原文件的所有數據的前提下,將音頻文件的體積壓縮的更小,而將壓縮後的音頻文件還原後,能夠實現與源文件相同的大小、相同的碼率。無損壓縮格式有APE、FLAC、WavPack、LPAC、WMALossless、AppleLossless、La、OptimFROG、Shorten,而常見的、主流的無損壓縮格式只有APE、FLAC。
音頻壓縮技術原理1、數字音頻相關特點
數字音頻的質量取決於:採樣頻率和量化位數這兩個參數,為了保真在時間變化方向上取樣點儘量密,取樣頻率要高;在幅度取值上儘量細,量化比特率要高,直接的結果就是存儲容量及傳輸信道容量要求的壓力
音頻信號的傳輸率=取樣頻率*樣本的量化比特數*通道數取樣頻率=441KHz
樣本值的量化比特數=16
普通立體聲的信號通道數=2
數位訊號傳輸碼流大約14Mbit/s
一秒鐘的數據量為14Mbit/(8/Byte)
達1764 k byte(字節),等於88200個漢字的數據量
數字音頻的出現,是為了滿足複製、存儲、傳輸的需求,音頻信號的數據量對於進行傳輸或存儲形成巨大的壓力
音頻信號的壓縮是在保證一定聲音質量的條件下,儘可能以最小的數據率來表達和傳送聲音信息
信號壓縮過程是對採樣、量化後的原始數字音頻信號流運用適當的數位訊號處理技術進行信號數據的處理,將音頻信號中去除對人們感受信息影響可以忽略的成分,僅僅對有用的那部分音頻信號進行編排,從而降低了參與編碼的數據量
數字音頻信號中包含的對人們感受信息影響可以忽略的成分稱為冗餘,包括時域冗餘、頻域冗餘和聽覺冗餘
2、時域冗餘
時域與頻域的差異
時域冗餘的表現形式
1)幅度分布的非均勻性
信號的量化比特分布是針對信號的整個動態範圍而設定的,對於小幅度信號而言,大量的比特數據位被閒置
2)樣值間的相關性
聲音信號是一個連續表達過程,通過採樣之後,相鄰的信號具有極強的相似性,信號差值與信號本身相比,數據量要小的多
3)信號周期的相關性
聲音信息在整個可聞域的範圍內,每個瞬間只有部分頻率成分在起作用,即特徵頻率,這些特徵頻率會以一定的周期反覆出現,周期之間具有相關關係
4)長時自我相關性
聲音信息序列的樣值、周期相關性,在一個相對較長的時間間隔也會是相對穩定的,這種穩定關係具有很高的相關係數
5)靜音
聲音信息中的停頓間歇,無論是採樣還是量化都會形成冗餘,找出停頓間歇並將其樣值數據去除,可以減少數據量
3、頻域冗餘
頻域冗餘的表現形式
1)長時功率譜密度的非均勻性
任何一種聲音信息,在相當長的時間間隔內,功率分布在低頻部分大於高頻部分,功率譜具有明顯的非平坦性,對於給定的頻段而言,存在相應的冗餘
2)語言特有的短時功率譜密度
語音信號在某些頻率上會出現峰值,而在另一些頻率上出現谷值,這些共振峰頻率具有較大的能量,由它們決定了不同的語音特徵,整個語言的功率譜以基音頻率為基礎,形成了向高次諧波遞減的結構
4、聽覺冗餘
根據分析人耳對信號頻率、時間等方面具有有限分辨能力而設計的心理聲學模型,將通過聽覺領悟信息的複雜過程,包括接受信息,識別判斷和理解信號內容等幾個層次的心理活動,形成相應的連覺和意境
由此構成聲音信息集合中的所以數據,並非對人耳辨別聲音的強度、音調、方位都產生作用,形成聽覺冗餘
由聽覺冗餘引出了降低數據率,實現更高效率的數字音頻傳輸的可能
打開APP閱讀更多精彩內容
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容圖片侵權或者其他問題,請聯繫本站作侵刪。 侵權投訴