漲姿勢:常用音頻格式的區別

2020-12-05 IT之家

對於很多音頻愛好者、普通消費者甚至一部分發燒友來說,都有這樣的一個疑問:目前常見的音頻格式種類之多,能挑花眼也一點都不誇張,在這些名字各不相同的格式背後,都有什麼區別?為了體積便攜我們應該選擇那些格式,為了更好的聲音我們應該選擇那些格式,如果想兩者並存我們又應該選擇那些格式?

筆者作為一個音頻設備的發燒友,也自認為算是一個音樂的發燒友,收藏的唱片和音樂文件也並不算少,對於不同的音頻格式來說,可以說主流的音頻格式都使用過也並不深入的研究過,雖然對於及其深度的技術方面來說也許並不甚了解,但是對於它們之間的區別還是可以做一個簡單的分享的。

並且隨著近幾年HiFi圈中DSD音頻流的崛起,近幾年已經不再是PCM編碼壟斷音頻文件行業,DSD碼流也成為了非常主流的一種格式,而在這篇文章中筆者也將會簡單的介紹DSD音頻文件格式以及個人對於DSD音頻格式的一些看法,網友朋友們也不妨在留言區域留下自己對於DSD和PCM兩種格式的看法。

首先,什麼是PCM編碼格式?

PCM中文稱脈衝編碼調製(Pulse Code Modulation),是70年代末發展起來的,記錄媒體之一的CD,在80年代初由飛利浦和索尼公司共同推出。脈碼調製的音頻格式也被DVD-A所採用,它支持立體聲和5.1環繞聲,1999年由DVD討論會發布和推出的。脈衝編碼調製的比特率,從14-bit發展到16-bit、18-bit、20-bit直到24-bit;採樣頻率從44.1kHz發展到192kHz。PCM脈碼調製這項技術可以改善和提高的方面則越來越來小。只是簡單的增加PCM脈碼調製比特率和採樣率,不能根本的改善它的根本問題。其原因是PCM的主要問題在於:

(1)任何脈衝編碼調製數字音頻系統需要在其輸入端設置急劇升降的濾波器,僅讓20Hz-22.05kHz的頻率通過(高端22.05kHz是由於CD44.1kHz的一半頻率而確定)。

(2)在錄音時採用多級或者串聯抽選的數字濾波器(減低採樣頻率),在重放時採用多級的內插的數字濾波器(提高採樣頻率),為了控制小信號在編碼時的失真,兩者又都需要加入重複定量噪聲。這樣就限制了PCM技術在音頻還原時的保真度。

▲碼率越高的PCM錄音就越接近模擬信號的圓滑正弦波

對於我們最常說的「無損音頻」來說,一般都是指傳統CD格式中的16bit/44.1kHz採樣率的文件格式,而知所以稱為無損壓縮,也是因為其包含了20Hz-22.05kHz這個完全覆蓋人耳可聞範圍的頻響頻率而得名,當然現在的各種PCM格式編碼高碼率文件已經層出不窮非常常見,但是就像上文中所說的,高碼率並不能有效地提升PCM編碼採樣率的頻響範圍,而只能增加其採樣點來得到更加類似模擬錄音的平滑波形。

也正因為幾乎所有的有損壓縮格式都是從WAV格式壓縮、轉換而來,其實內部的編碼依然是PCM,所以曾經很多MP3設備並不支持FLAC、APE、AAC等等格式,是因為它們不支持這些文件的解壓縮,但是從沒有一款播放器不支持WAV格式,因為WAV格式本身,就等於PCM碼流。

WAV、APE、FLAC那個才是更好的選擇?

對於目前常見的PCM碼率文件來說,最常見的三種文件格式也就是WAV、APE、FLAC了,而這三種格式之間又有怎麼樣的差別呢?

WAV波形文件是音響設備和很多軟體可以直接讀取的波形文件,基本上不存在編解碼問題。flac和ape都對WAV進行了編碼,故能換取較小的體積,但同時造成解碼播放時,因播放器材解析力很敏感(或者說技術所限),會因出現一定的jitter抖動(解析複雜編碼所致)而導致播放效果不夠飽滿和流暢。這點你可以通過統一轉換為WAV格式來試聽解決。

對於WAV格式來說,是目前的常規無損壓縮格式中體積最大的文件格式,由於FLAC和APE都對WAV進行了更高技術的編碼,所以換取了較小的體積,這也是這兩種格式之所以出現的根本原因。而對於FLAC和APE兩種格式來說,雖然體積大小差不多,但是採用了不同的壓縮格式,所以對於設別來說在播放時候需要佔用的資源多少也並不相同,簡單地說佔用資源多少的比例為:APE最大、FLAC中、WAV佔用最小。最簡單的例子就是如果你用一款配置並不算很高的隨身播放設備,比如刷了rockbox的iPod Classic或者一些目前主流的便攜播放器,使用APE會有明顯的卡頓以及續航的減少,而FLAC和WAV則沒有什麼明顯的區別。

▲APE如果存在錯誤,播放會直接停止

▲FLAC格式只有在轉換的時候才能報錯

▲FLAC格式的錯誤採用靜音處理

並且除了壓縮比例和佔用資源的不同,APE、FLAC和WAV在糾錯方面也有不同。首先最為傳統的WAV格式其實並沒有糾錯的處理,所以即使在播放的碼率中有錯誤,WAV也會照常播放下去,在錯誤的地方可能會發生爆音等問題。而APE對於錯誤則是直接停止播放,而這點也是被很多人所詬病的,如果你的APE文件中存在錯誤,那麼整個音軌幾乎都報廢了。而FLAC使用的則是靜音的策略,如果播放中出現錯誤,則將錯誤的地方靜音處理。

送葬CD的MP3、AAC格式的優劣

對於這兩個目前全世界用戶最多的音頻格式來說,它們有兩個共同點:1.它們都不是無損壓縮格式音頻。2.它們聯手終結了CD在音樂行業的老大地位。

也許對於中國的用戶來說,對於MP3格式更加熟悉,用戶也基本都是從MP3格式開始使用直到現在為止,但是AAC確實是一個不能不提的音頻格式,它因蘋果發揚光大,並且在iPod的壟斷之路上立下了汗馬功勞,甚至可以說,AAC不僅僅目送CD走下歷史舞臺,傳統消費級MP3產品也是被它趕下神壇的。至今在iTunes Store的專輯音樂銷售中,音樂的格式依然是AAC而不是MP3。

▲MP3格式在20KHz以上都直接被砍掉

首先,MP3是一種國內用戶最為耳熟能詳的有損壓縮格式,而隸屬世界上的有損壓縮格式其實數不勝數,而MP3成功的原因究竟是什麼?首先是它的壓縮比,傳統的音頻壓縮文件只能達到8:1左右的壓縮比。而MP3格式則是將這個壓縮比提升到了10:1甚至12:1的高比例壓縮,也因為MP3音頻編碼具有10:1~12:1的高壓縮率,同時基本保持低音頻部分不失真,但是犧牲了聲音文件中12KHz到16KHz高音頻這部分的質量來換取文件的尺寸,並且完全砍掉20KHz以上的部分,相同長度的音樂文件,用.mp3格式來儲存,一般只有.wav文件的1/10,因而音質要次於CD格式或WAV格式的聲音文件。但由於其文件尺寸小,音質好;所以在它問世之初還沒有什麼別的音頻格式可以與之匹敵,因而為.mp3格式的發展提供了良好的條件。直到現在,這種格式還是很流行,作為主流音頻格式的地位難以被撼動。但是樹大招風,MP3音樂的版權問題也一直找不到辦法解決,因為MP3沒有版權保護技術,說白了也就是誰都可以用。

AAC實際上是高級音頻編碼的縮寫。AAC是由Fraunhofer IIS-A、杜比和AT&T共同開發的一種音頻格式,它是MPEG-2規範的一部分。AAC所採用的運算法則與MP3的運算法則有所不同,AAC通過結合其他的功能 來提高編碼效率。AAC的音頻算法在壓縮能力上遠遠超過了以前的一些壓縮算法(比如MP3等)。它還同時支持多達48個音軌、15個低頻音軌、更多種採樣率和比特率、多種語言的兼容能力、更高的解碼效率。總之,AAC可以在比MP3文件縮小30%的前提下提供更好的音質。AAC也是目前最好的有損格式之一。有多種編碼,faac,nero為常見,比特率最高為448kbps,並且在448kbps的比特率下已經幾乎很難分辨和無損壓縮的區別。

人氣正旺的DSD格式有多強大?

最近的HiFi圈裡可以說颳起了一陣DSD的颱風,所有設備一夜之間都開始支持DSD格式,甚至這個傳統的行業裡的頂級大牌們也都開始爭先恐後的更新自己的解碼設備來支持DSD格式的碼流文件,而對於這個體積巨大,曾經SACD獨用的編碼格式究竟有著何等的魅力?

▲DSD究竟有多強大?

DSD(Direct Stream Digital)直接比特流數字,它是Sony與Philips在1996年宣布共同發展的高解析數字音響規格,DSD新技術與DVD的音響技術指針競爭,用1bit比特流的方式取樣,採樣率2.4MHz(CD 44.1kHz取樣的64倍)的高取樣方式,直接把模擬音樂訊號波形以脈衝方式轉變為數字訊號,以將近四倍於CD的空間,儲存音樂,因此可以提供更為優秀的聲音效果,由於取樣次數高,所以取樣過的波形很圓順,比較接近原來的模擬波形。再者由於不採用多位,省卻位轉換程序,降低了因為數字濾波而可能產生的失真與噪聲。還有,由於不像多位系統般容易(位越高就越容易)受到電源或外部幹擾的影響,因此理論上質量會比較穩定。當前的SACD player,兼容性,無論是DSD支持者或是傳統CD的擁護者,都將是雙贏的局面。SACD(Super Audio CD)是新一代數碼音響規格,以超高速取樣(2.8224MHz,為CD的64倍)聲音以0和1連續的量子化,可聽頻域的動態範圍約為120dB,可能收錄頻域約1000kHz,結和了傳統模擬的溫暖及超高的解析度,SACD多聲道的音質包含了6個獨立的音軌,每一個音軌都可以讀到沒有經過任何壓縮而完整的DSD規格(Full DSD Bit Rate)。

但是其實DSD的問題很嚴重並且顯而易見,與之前的格式問題相比,DSD的問題並不在它的聲音素質上,可以說DSD的聲音素質是毋庸置疑的優秀的。但是其實這種技術誕生已經將近20年的時間,而在近兩年才火起來,那麼前面的十多年它去哪了?一些錄音業內人士曾經告訴我,其實在推廣DSD錄音的時候索尼和飛利浦將DSD錄音設備的價格定價非常昂貴,幾乎沒有錄音棚願意購買,於是DSD格式也就逐漸的胎死腹中,而時隔這麼多年再次出現,現在的揚聲器和解碼、放大的技術發展都能更好的展現出DSD的高水平,但是問題一樣明顯:沒得聽。

真正喜歡音樂的朋友會發現DSD的音頻基本分為兩種:PCM碼流轉錄和DSD直接錄製。而後者很少有值得聆聽的專輯,除了部分流行音樂之外,古典音樂幾乎沒有很好的演繹。而對於PCM轉錄來說,在錄音的源頭就並不能達到DSD的水平,也就變得毫無意義。

總結:

對於這幾類的音頻格式來說,相信廣大讀者也有一個比較深刻的認識了,對於自己的使用需求來說,選擇合適的音樂文件是節省空間和減少自己麻煩必不可少的。

相關焦點

  • 漲姿勢!6種常見DNA序列格式
    點擊關注基迪奧,立即漲姿勢~搞生物研究經常會碰到各種格式的序列,比如fasta,GCG等不同格式,一些不同字母符號代表不同的意義
  • 什麼是有損和無損音頻格式,常見音頻有哪些?
    那麼什麼是有損和無損音頻格式?它們有哪些差異?除了上面聽說的這些還有哪些常見的音頻格式呢?接下來和大家分享一下音頻格式的相關知識,解答大家心中的疑惑。先和大家簡單普及一下音頻格式:音頻格式即音樂格式。音頻格式是指要在計算機內播放或是處理音頻文件,是對聲音文件進行數、模轉換的過程。目前音樂文件播放格式分為有損壓縮和無損壓縮兩種。使用不同的格式的音樂文件,在音質的表現上有差很大的差異。
  • 常用的png與jpg圖片格式有什麼區別?
    png和jpg都是常用的圖片格式,其中png屬於無損壓縮,jpg是有損壓縮,使用中兩者最明顯的一個區別是png支持透明通道,jpg的圖片更適合在網絡中傳播和使用。於是算法學家發明了各種先進算法,來制定新的圖片格式,比如我們常用的有jpg、png、gif動圖等等。
  • 一頭霧水的你進來漲漲漲姿勢
    一頭霧水的你進來漲漲漲姿勢時間:2020-04-18 16:43   來源:小雞詞典   責任編輯:沫朵 川北在線核心提示:原標題:A4的6階子群什麼意思什麼梗? 一頭霧水的你進來漲漲漲姿勢 釋義:當表情包中出現A4的六階子群時,潛臺詞意為: 傲嬌地說: 不存在的!
  • 一個常用的格式轉換方法
    不管是視頻還是音頻都有多種格式,就音頻格式而言常見的就有m4a、mp3和flac等。但是有小夥伴問我怎麼把m4a轉mp3,因為播放設備不支持播放m4a格式的音頻,所以需要轉換成常用的mp3格式。那出現這類兼容性問題時該怎麼辦呢?下面分享一個快速把m4a轉mp3的方法。
  • 教你如何快速在PR中剪輯出無損格式音頻
    最近有很多朋友諮詢如何在PR中剪輯音頻,在此,明軍動態分享一下個人經驗,讓你輕鬆快速的就可學會音頻剪輯、變聲音、以及如何導出高質量的無損格式音頻,接下來我們來看看怎麼個剪輯法。1.打開PR軟體-新建項目-名稱(自己命名)-位置(瀏覽找個容易找到的位置儲存)-確定;如圖所示2.新建序列-點文件-新建序列-序列預設-AVCHD-1080P-AVCHD 1080P25(1920*1080)或者選擇720P-AVCHD 720P25(12808*720)都可以的-序列名稱(自己命名)-確定;3.將要剪輯的音頻導入進來-點文件-導入(瀏覽找到準備好的音頻選中
  • 一頭霧水的你進來漲漲漲漲漲姿勢
    一頭霧水的你進來漲漲漲漲漲姿勢時間:2020-06-28 17:16   來源:禮儀之家   責任編輯:沫朵 川北在線核心提示:原標題:媚宅是什麼意思什麼梗? 一頭霧水的你進來漲漲漲漲漲姿勢 媚宅,從字面上看就是向宅這一群體諂媚的意思,可以說是一個狀態詞,也像是一個動詞,說白了也就是很多動畫就是刻意去討好觀眾,觀眾怎麼喜歡怎麼來。
  • 一臉懵逼的你進來漲漲漲漲漲漲漲漲漲姿勢
    一臉懵逼的你進來漲漲漲漲漲漲漲漲漲姿勢時間:2020-04-06 17:14   來源:小雞詞典   責任編輯:沫朵 川北在線核心提示:原標題:番茄鍾什麼意思什麼梗?一臉懵逼的你進來漲漲漲漲漲漲漲漲漲姿勢 番茄鍾,是把任務或工作分成半小時左右來做,集中精力25分鐘來工作,休息5分鐘,完成一項任務,即種一個番茄,這樣的流程能使下一個30分鐘更有動力。根據番茄工作法理論進行開發的一款方便、實   原標題:番茄鍾什麼意思什麼梗?
  • 詳細HD音頻格式大全! 讓你一看就明白
    Dolby Digital目前被美國數位電視廣播系統使用(hdtv啦),也是DVD影片(DVD-Video)所使用的標準聲音格式。所以說AC3就是DD5.1 的前身啦。這種音頻我們是常見的,我看得最多的是CHD的文件裡經常有這種音頻格式.原來又是一個虛擬的6.1聲道,一樣把5.1的源音頻放成6.1 聲道,是不是和Dolby公司如出一轍呢,呵呵.後面更像了.
  • 一頭霧水的你進來漲漲漲漲漲漲姿勢
    一頭霧水的你進來漲漲漲漲漲漲姿勢時間:2020-07-10 18:45   來源:小雞詞典   責任編輯:沫朵 川北在線核心提示:原標題:神蛆什麼意思什麼梗? 一頭霧水的你進來漲漲漲漲漲漲姿勢 指所有跟你罵起來的人,你都可以給他扣個神蛆帽子,你就贏了梗來源;軍武吧,那年那兔那些事。
  • 一頭霧水的你進來漲漲漲漲漲姿勢
    一頭霧水的你進來漲漲漲漲漲姿勢時間:2020-07-06 16:55   來源:禮儀之家   責任編輯:沫朵 川北在線核心提示:原標題:體虧屁思是什麼意思什麼梗? 一頭霧水的你進來漲漲漲漲漲姿勢 體虧屁思,是這一定是體制問題,最終吃虧的總是屁民,我不禁陷入了沉思的縮寫形式。詞語來源於網絡,廣泛使用於百度貼吧、論壇。
  • 一頭霧水的你進來漲漲漲漲漲姿勢
    一頭霧水的你進來漲漲漲漲漲姿勢時間:2020-06-24 19:41   來源:咖綠茵   責任編輯:沫朵 川北在線核心提示:原標題:魔動閃霸什麼意思什麼梗? 一頭霧水的你進來漲漲漲漲漲姿勢 最近小夥伴們在抖音上面應該經常能刷到魔動閃霸,這句話到底是什麼意思呢?
  • 一頭霧水的你進來漲漲漲漲漲姿勢
    一頭霧水的你進來漲漲漲漲漲姿勢時間:2020-10-03 15:59   來源:名資匯網   責任編輯:沫朵 川北在線核心提示:原標題:ky是什麼意思什麼梗? 一頭霧水的你進來漲漲漲漲漲姿勢 我想應該有許多人都是混飯圈的,那麼有的時候我們會在網絡上看到有人說你不要再ky了,這到底是什麼意思呢?
  • 一臉蒙蔽的你進來漲漲漲漲漲漲姿勢
    一臉蒙蔽的你進來漲漲漲漲漲漲姿勢時間:2020-08-22 17:11   來源:咖綠茵   責任編輯:沫朵 川北在線核心提示:原標題:抖音yyyut什麼意思什麼梗?一臉蒙蔽的你進來漲漲漲漲漲漲姿勢 抖音作為我們大多數人現在休閒娛樂的方式之一,小夥伴們都喜歡在上面刷視頻,也會經常給我們帶來很多生活的樂趣,或者一些令人詫異的梗,最近抖音裡面大家都在討論的yyy是什麼梗呢?接下來咖綠茵   原標題:抖音yyyut什麼意思什麼梗?
  • 一臉懵逼的你進來漲漲漲漲漲漲姿勢
    一臉懵逼的你進來漲漲漲漲漲漲姿勢時間:2020-06-29 17:38   來源:禮儀之家   責任編輯:沫朵 川北在線核心提示:原標題:崩潰哄崩潰是什麼意思什麼梗?一臉懵逼的你進來漲漲漲漲漲漲姿勢 崩潰哄崩潰: 明明自己已經很不開心了站在崩潰的邊緣,結果身邊有人崩潰了還得穩住情緒先哄著ta,小心翼翼不把負面情緒表露出來。
  • 一臉懵逼的你進來漲漲漲漲漲漲姿勢
    一臉懵逼的你進來漲漲漲漲漲漲姿勢時間:2020-04-13 15:59   來源:小雞詞典   責任編輯:沫朵 川北在線核心提示:原標題:切片男主什麼意思什麼梗?一臉懵逼的你進來漲漲漲漲漲漲姿勢 指和女主或受有感情線終赴和諧的所有男的其實都是同一個人,都是男主,可能是男主的靈魂碎片,或者共用一個靈魂,或者人格分裂啦之類的作品設定 實際上是因為晉江不給寫NP 。 舉個例子,一個作品裡   原標題:切片男主什麼意思什麼梗?
  • 常見的各種圖片格式都有什麼區別?
    每天翻開手機就能看到各種圖片,同時,各種各樣的圖片格式也引起了人們的注意,諸如jpg,png。那麼這些常見的圖片格式都有怎樣的應用,以及互相之間都有什麼區別?本文將從淺顯直白的角度給大家分析一下這個問題。
  • 微信語音怎麼導出WAV格式音頻文件到電腦保存
    蘋果手機及安卓手機的微信語音消息均以silk格式保存在手機內存中,雖然蘋果手機微信語音源文件後綴為aud,安卓手機微信語音源文件後綴為amr,但其內部存儲格式其實是一樣的,這種格式無法在電腦上直接播放,下面我將詳細介紹一下如何將這些微信語音批量導出為電腦通用音頻文件,並保存到電腦上的操作過程。
  • 正確匹配:數字音頻接口需要「數字」音頻線纜嗎?
    音頻接口可以將信號從一個組件傳送到下一個組件。一個音頻接口,一般會由源(輸出)電路,電纜和負載(輸入)電路幾個部分組成。音頻接口一般會分為有消費者版本(2線,非平衡)和專業版本(3線,平衡),主要區別在於其各種形式的抗電磁幹擾的穩健性(圖1)。 那麼,數字音頻接口是否需要數字級音頻線纜呢?
  • 網校網站源碼進行教育直播app開發常用的編碼及格式
    教育直播APP開發所用到的基礎知識如下:原視頻在不經過壓縮編碼之前是非常大的,會佔用很大的帶寬資源,產生不必要的流量費用,並且由於手機機型、廠家、系統版本不同,手機編解碼格式不同,解碼可能會比較費勁,對直播視頻進行視頻數據編解碼壓縮,有兩點好處,一是節約帶寬,二是方便解碼,在此過程中,會涉及到的知識有:1、常用編碼方式:CBR、VBR2、常用視頻格式:H.265