音頻技術解析:純理論對比PCM和DSD

2021-01-10 中關村在線

一直以來,很多HiFi發燒友在聊音樂的時候,經常會談論到關於音樂文件採樣、位深、碼率的相關技術參數。44.1kHz/16bit、96kHz/24bit、192kHz/24bit這種PCM波形規格到底意味著什麼、DSD這種全新的規格音質有何優勢?今天筆者就以純理論的角度為大家對比一波WAV和DSD兩種文件,歡迎大家進行參考。考慮到不少入門的燒友基礎較弱,筆者在第一章先科普一些基礎知識,大佬可自行跳過。

一、關於採樣/位深的基礎知識

1.1什麼是採樣

先從44.1kHz說起吧,相信不少的朋友都知道44.1kHz是採樣率參數,但卻不知道到底什麼是採樣率。所謂採樣率,即是錄音設備每秒採集聲音樣本信息的頻率。44.1kHz採樣率,即是在錄音時,設備每秒記錄44100次。

為什麼無損音樂的採樣率會被定位44.1kHz?這其實並非偶然。根據奈奎斯特採樣定理(為了不失真地恢復模擬信號,採樣頻率應該不小於模擬信號頻譜中最高頻率的2倍),採樣率44.1KHz的數字音頻格式可以無損地記錄22.05KHz以下頻率的音頻信號(參考自香農採樣定理),其剛好超過了人耳的聽力範圍20kHz。對於PCM波形來說更高的採樣率意味著曲線更加接近真實。

DSD64的採樣率為2.8244MHz,相等換算的話就是上面CD的44.1KHZ的64倍採樣率,也就是2824400次/秒。與PCM脈衝編碼調製不同的是,DSD在錄製時使用PWM脈衝寬度調製,因此在圖像呈現上來看也與PCM有所不同,具體筆者會在下面討論。

1.2 什麼是位深

剛剛我們提到過,採樣率是每秒記錄聲音的次數。對於用數字波形記錄聲音的方式來說,如果橫軸是時間,想要出現完整的波形,那麼就需要一個縱軸參數來為波形的「高度」進行設定。對於音頻來說,這個高度信息,就是bit(位深)。

所謂16bit,其真實含義是用16位的二進位數來表示採樣點的電平(縱軸高度)。在PCM波形中,縱軸高度越高、聽感的響度就越高。位深對音樂文件的動態表現一般直接掛鈎,16比特整數可以儲存2的16次方(65536)個不同的數值,每增加1比特代表縱軸的精密度翻一倍。

1.3 PCM波形的文件都有什麼?

相比於DSD來說,PCM技術於很早之前就應用於音頻領域,因此其文件有很多的變種。正常的無損無壓縮PCM波形的文件是WAV,我們日常下載到的flac、ape這種無損格式都是將WAV文件無損傷壓縮的音樂格式,再次解壓縮後數據不會受到影響。mp3、wma等格式為有損壓縮格式,再次解壓為WAV後會造成數據損失。

二、PCM和DSD本質的不同

2.1 PCM、DSD的錄製方式對比

PCM和DSD在錄音時使用的就是兩種完全不同的系統;PCM脈衝編碼調製:其首先將連續的模擬信號(音樂原聲)離散並抽樣量化,根據瞬時點參數構建PCM波形。簡單、直觀、文件佔用空間低是它的優勢,其劣勢在於量化誤差較大(導致信噪比較低的原因)。

DSD在錄製時使用了另外一種調製——PWM脈衝寬度調製:它是將模擬信號轉換為脈波的一種全新的記錄方式。在記錄時,DSD的模數轉換A/D部分並非如WAV一樣,而是通過採樣點實現增/不變/減的判斷。打個比方吧,讓PCM和PWM(DSD調製技術)一起記數字,PCM在記錄一串數字時是1,2,3,4,3,而PWM則是0,1,1,1,-1(只取差值)。

2.2 PCM、DSD讀取方式對比

PCM波形的橫軸為採樣點、縱軸為位深,在做放音的數模轉換D/A時,數字波形中的每個點會轉換成其獨有的二進位編碼被指定的DSP或者CPU進行處理實現轉換。對於PCM波形來說,由於每次採樣都有嚴格的時間限制,因此PCM系統在聲音回放時對晶振的需求的極高,如果解碼時兩方出現任何誤差都會導致失真。同時,由於採樣率遠低於DSD,其在取樣時的受量化誤差影響,其理論上的信噪比也遠低於DSD。

DSD文件的PWM波形在橫縱軸設置上與PCM相同。不同的是,PWM波形的採樣點深度僅為1bit,播放方式為錄製的逆過程(具體參考2.1)。相對於PCM來說,DSD的優勢是有效的防止了晶振問題,且動態響應也更加精準。不過由於其過於精準的特性,音樂的響度一般來說也是偏低的,這也是為什麼不少HiFi產品會專門為DSD播放專門做一個增益功能。還有就是DSD的文件佔用空間巨大、解析耗電量大,非常吃硬碟資源。

小結:PCM和DSD純理論對比,誰的音質更好?

顯然,從錄製與播放的對比就可以看得出,DSD在記錄聲音的能力方面是遠超普通規格PCM的。但反過來說,人耳的解析度也是有限的。如果單從理論的角度來說,即使CD級別的44.1kHz/16bit音樂,其在採樣率、位深上都高於人耳對聲音的識別能力。所以即使DSD的參數多麼強大,對於絕大多數人來說,其聽感上是不應該會出現明顯區別的,就好比人看不見紅外線和紫外線一樣。

寫在最後:

相比於WAV,DSD雖然是理論上的信息量升級,但也為解碼設備的性能帶來了更大的挑戰。不開玩笑的說,有一套能夠發揮真正DSD實力音響設備的人,筆者身邊的專業用戶都很少,更別提便攜聽音了。HiFi設備並非玄學,它也是一分錢一分貨的。就像很多人玩手遊都能充個萬八千一樣:如果捨不得錢一步玩到位,那就一點一點升級HiFi設備。把自己限制在牆內的人,永遠無法發現外面世界的美好。

(7499501)

相關焦點

  • 科普文章,文多圖少.PCM與DSD究竟是什麼?
    PCM(Pulse-Code Modulation,脈衝編碼調製)是現在最為常見的一種音頻編碼格式,什麼wav,ape,flac,mp3等等幾乎所有常見音頻都是pcm編碼格式。    然後,我們就要用這組規定電平值來度量和記錄取樣電平了,但是取樣電平肯定不會都剛好等於規定電平的,於是這時候我們就要找相近的電平值來大概地表示這個取樣了,用四捨五入的辦法來記錄接近的電平值,於是,圖中紫色的點表示最終記錄的值。綠線表示記錄的值還原後的信號曲線,可以看出和原信號相比有明顯失真。
  • 音頻鑑黃是如何做到的?深度解析音頻檢測背後的技術
    馬驥:極限元智能科技聯合創始人,曾先後就職於中科院軟體研究所、華為技術有限公司,獲得多項關於語音及音頻領域的專利,資深軟體開發工程師和網絡安全解決方案專家,擅長從用戶角度分析需求,提供有效的技術解決方案,具有豐富的商業交流和項目管理經驗
  • 深度解析音頻檢測背後的技術 | 雷鋒網公開課
    ,擅長從用戶角度分析需求,提供有效的技術解決方案,具有豐富的商業交流和項目管理經驗。二、音頻檢測採用的技術手段音頻可以分為有內容和無內容兩種:說話內容相關的包括說了什麼?(涉政、涉黃、涉賭還是廣告信息),另外還可以從說話內容來判斷語種以及說話人的辨識;此外還有與說話內容無關的信息,例如特定錄音片段、歌曲旋律、環境音等等。針對不同的數據類型有不同的檢測技術。
  • 深度解析音頻檢測背後的技術|硬創公開課
    本期雷鋒網硬創公開課,我們邀請了極限元智能科技聯合創始人馬驥為大家解讀關於音頻審核背後的技術。嘉賓介紹馬驥:極限元智能科技聯合創始人,曾先後就職於中科院軟體研究所、華為技術有限公司,獲得多項關於語音及音頻領域的專利,資深軟體開發工程師和網絡安全解決方案專家,擅長從用戶角度分析需求,提供有效的技術解決方案,具有豐富的商業交流和項目管理經驗。
  • 音頻引擎與回音消除簡介
    音頻引擎,是實時通話程序(IM)裡的一個模塊。例如webrtc、各種社交軟體,都含有這個模塊。它大概有三個功能,錄音、放音、回音消除。上篇文章裡Linux的alsa接口播放pcm音頻數據說過Linux ALSA框架的數據傳輸方向有播放和採集兩種,音頻引擎是把這兩個功能聯合起來,外加一個回音消除模塊。在實時通話中,對端傳過來的聲音A,與你說話的聲音B,都會被麥克風錄音,實際錄下來的是A+B。
  • 耳聽為虛眼見為實,來聊聊音頻技術參數解析
    這和電影的每秒24幀圖片的道理差不多。如果是雙聲道(stereo),採樣就是雙份的,文件也差不多要大一倍。根據奈奎斯特採樣理論,為了保證聲音不失真,採樣頻率應該在40kHz左右。這個定理怎麼得來,我們不需要知道,只需知道這個定理告訴我們,如果我們要精確的記錄一個信號,我們的採樣頻率必須大於等於音頻信號的最大頻率的兩倍,記住,是最大頻率。
  • 基於小波變換與DSP的實時音頻視頻處理系統
    面對龐大的音/視頻數據量,作為語音及圖像處理的壓縮技術便在多媒體通信中顯得極為重要。隨著多媒體通信技術和超大規模集成電路(vlsi)技術的飛速發展,這一技術將會在眾多領域得到更為廣泛的應用。本文引用地址:http://www.eepw.com.cn/article/20901.htm 1 音/視頻實時處理系統 低碼率視頻通信的主要技術問題是音/視頻壓縮編碼技術,即用來實現在滿足足夠質量和硬體成本的條件下降低所需的碼率。小波變換充分利用人眼的視覺特性,克服了重構圖像會出現的塊效應、蚊子效應、模糊等現象。
  • 心理學考點之認知學習理論主要人物觀點對比
    心理學考點之認知學習理論主要人物觀點對比認知學習理論流派認為:學習不是在外部環境的支配下被動的形成S—R聯結,而是主動地在頭腦內部構建認知結構;學習不是通過練習與強化形成反應習慣,而是通過頓悟與理解獲得期待;當有機體當前的學習依賴於他原有的認知結構和當前的刺激情境時,學習受主體的預期所引導,而不是受習慣所支配。
  • 注射用水設備中過熱水和純蒸汽的滅菌對比
    純蒸汽和過熱水滅菌對循環系統的滅菌在技術上是成熟的,也滿足GMP對其的滅菌要求。下面就來談談對兩種方式的比較。二、系統的造價對比從兩個注射用水設備的對比可以看出,因為循環系統純蒸汽滅菌的蒸汽量消耗很大,需要一臺專門的純蒸汽發生器對其提供熱源;同時為了保證滅菌效果和最冷點的控制,需在每個使用點安裝在線的溫度監測和疏水器,使用點越多,則安裝的PT100和疏水器就越多,每套疏水器和PT100價值6000多元。
  • 上汽榮威ER6純電三電系統的技術細節
    打開APP 上汽榮威ER6純電三電系統的技術細節 模擬世界 發表於 2021-01-07 15:22:18
  • 無線音頻技術講解(全)
    而今天,我們將這些匯集到一起,方便大家進行查閱和對比。    註:我們資料均來自於網絡,內容比較簡單,但整理起來比較複雜、真實性還有待查證。所以,如果其中有錯誤和不足,請大家發送郵件至sound#pcpop.com(發送郵件時請用@代替#),或者是直接在文末留言,以便我們能夠將這些技術最準確的表達。
  • 氫能源和純電動汽車,誰更香?
    圖2 新聞聯播相關報導那問題來了,從技術角度來說,氫能源和純電動誰會更香呢?不急,我們先看看氫能源和純電動車的技術原理。2 技術原理對比2.1 氫能源技術原理戰鬥機說車在這裡不會介紹深奧的原理知識,簡單說氫能源就是H2和O2通過化學反應,產生電能,這個電能可以驅動電機,電機再帶動汽車行駛,如果產生的電能超過電機功率需求,則電能會通過一套動力電池存儲下來,動力電池在某些工況也會同步給電機供電。
  • 音頻壓縮技術原理
    打開APP 音頻壓縮技術原理 發表於 2017-10-17 15:37:14   音頻壓縮技術定義   音頻信號能進行壓縮的依據是音頻壓縮技術
  • LTCC技術簡介、對比優勢、應用優勢與技術特點的解析
    打開APP LTCC技術簡介、對比優勢、應用優勢與技術特點的解析 發表於 2018-01-25 15:54:07 總之,利用這種技術可以成功地製造出各種高技術LTCC產品。多個不同類型、不同性能的無源元件集成在一個封裝內有多種方法,主要有低溫共燒陶瓷(LTCC)技術、薄膜技術、矽片半導體技術、多層電路板技術等。LTC C技術是無源集成的主流技術。
  • ...蘋果Airplay技術入門篇(全文)_蘋果 The new iPad_音頻新聞...
    在今天的蘋果官網上,我們雖然找不到任何對於Airplay的官方解釋,但從圖示和介紹上可以得知,Airplay可以將iPhone、iPad或iPod touch等設備上的視頻、音頻以及圖片傳輸到第三方認證設備上,傳輸的載體為WiFi,與藍牙無線有本質的不同。
  • 解析ADSP-BF531的數字音頻選擇系統的應用
    隨著數字媒體技術的發展,存儲技術在數字媒體領域也得到了廣泛應用。特別是數位技術的迅猛變革,使存儲數字媒體的技術手段也發生很大變化。在媒體爆炸性增長的同時,廣電界十分關心數位技術的未來發展,同時也更加關心數字媒體資產的管理、使用和存儲。
  • 音頻信號及音頻分析
    例如,對於300-4kHz之間的語音信號的分析主要應用於語音識別,其用途是確定語音內容或判斷說話者的身份;而對於20-20kHz之間的全範圍的語音信號分析則可以用來衡量各類音頻設備的性能。所謂音頻設備就是將實際的聲音拾取到將聲音播放出來的全部過程中需要用到的各類電子設備,例如話筒、功率放大器、揚聲器等,衡量音頻設備的主要技術指標有頻率響應特性、諧波失真、信噪比、動態範圍等。
  • ——矩陣理論(母體理論)》第132期(附音頻)
    (附音頻版)D.Y'S NEWS 第120期《史上最貴「船票"!——足夠讓您和您的家人每人擁有一艘遊輪》您可能直到看見到一些奇怪的事情發生前並不相信矩陣理論。我個人對矩陣理論的看法是,它應該有五成的概率是存在可能性的。儘管如此,我個人仍舊不太相信矩陣理論。
  • 純電平臺是亮點,愛馳U5三電技術解析
    在技術上,U5最大的亮點是採用了純電動平臺,這也奠定了U5相較市面其它油改電車型,從整車質感,到駕控品質,再到座艙空間等,各方面表現都不俗。  1、純電平臺  愛馳U5基於MAS純電平臺打造而來,早在2018年,愛馳便對外公布了這一先進平臺技術,其特點是「輕量化、靈活、可調整、模塊化」,可以說與目前市面純電平臺相仿。  比如在輕量化方面,MAS平臺車身採用「上鋼下鋁」形式,由此減重50公斤,比傳統全鋼材質汽車減輕20%。