Audio ABC | CD為何是44.1KHz採樣率?

2021-02-15 icsoc

舊文排版重發,略作修改。

小朋友英語學習的培訓教材中附送了一張音頻CD,作者在鼓搗這張CD的時候,忽然一個問題冒了出來:為什麼CD採用了44.1KHz的採樣率?為什麼不是48KHz?畢竟48這個數字看起來整齊的多。為此作者做了一番搜索和研究,分享給感興趣的朋友。

聲音的基本概念

首先介紹一些常見的音頻概念。大家知道人耳能聽到聲音,是因為聲音在音源處產生後,對空氣產生了一系列忽強忽弱的壓力,這種壓力的變化(振動)可以被人耳內部的耳膜感受到,然後經由各種神經細胞,匯總到大腦中形成聲音的感覺。

有時候這種壓力比想像的要大的多,它不僅可以驅動薄薄的耳膜,當強度足夠大時,甚至可以吹動人的頭髮和衣服。參加過室外音樂節的朋友,如果碰巧在現場比較靠近喇叭的地方,應該有切身的體會。人耳能聽到的這種壓力振動的範圍大概在20Hz到20KHz,Hz即赫茲,即每秒鐘振動發生的次數。

除了耳道,身體的其它一些部分也可以感受到聲音的振動,例如骨傳導耳機就是繞過了耳膜,利用頭部骨骼來傳遞聲音的振動。

(骨傳導原理。圖片來自網絡)

音頻信號的採樣

因為聲音本質上是一個連續的模擬信號,當聲音被記錄下來,尤其是數位化記錄時,就涉及到採樣率和採樣精度這兩個概念。工科的朋友們可能對奈奎斯特採樣定理比較熟悉,就是對聲音信號做採樣時,採樣頻率一定要大於聲音信號最高頻率的兩倍。一個通用的聲音記錄系統,當然需要應對聲音的大範圍頻率,即20KHz聲音需要的採樣頻率至少是40KHz,考慮到後續的各種傳輸、處理過程帶來的損失,採樣頻率一般會高於40KHz。

(數位化的440Hz正弦波,採樣頻率8KHz,採樣精度8bit)

採樣頻率

常用的採樣頻率大概分三個系列,分別以8KHz、12KHz、11.025KHz為基準。由此衍生出來的採樣頻率就有三個系列。

•8K、16K、32K、64K、128K•12K、24K、48K、96K、192K•11.025K、22.05K、44.1K、88.2K

採樣精度

如果說採樣頻率對應的是時間維度上對於聲音的採樣,那麼採樣精度就是對應的幅度維度。它把採樣系統所支持的幅度範圍分成若干間隔,然後用一個數字來代表每一個間隔對應的幅度值。當某一個時刻的聲音幅度落在某個間隔時,就用這一間隔的數字來代表這個聲音在這個時刻的幅度。

採樣精度,通常有8bit、16bit、24bit、32bit這幾種。

音頻通道

還有一個概念就是聲音通道數量,常見的就是兩個聲道,一左一右。家庭影院聲道數量更豐富一些,一般不大於十個。在電影院中,通常會更多,有幾十個聲道。所以在電影院中聲音復現的更為真實,配合電影畫面使得觀眾有身臨其境的感覺。每個聲道一般都對應錄製時的一個麥克風,當然有些聲道也可以後期合成。

音頻編碼

採樣完成後,通常還有個編碼的過程。最直觀的編碼就是PCM格式了,它是一種有正有負的數字表示方式,以衡量特定時刻的聲音幅度。正、負其實是相對的概念,都是相對於數字零所對應的幅度而言。

音頻存儲

上面是聲音數位化記錄的一些參數,那麼這些數位化的記錄如何存放?數字記錄生成的文件有好多種,在Windows平臺,最直觀就是wav文件了。相比大家熟悉的MP3格式文件,wav直接保存的就是PCM編碼的聲音幅度信息,而採樣頻率、採樣精度以及聲音通道數目,就在wav文件頭中標明。這樣當一個播放器播放wav文件的時候,它首先讀取文件頭,了解這個聲音的採樣率、採樣精度、聲道數目,就可以恢復出正確的聲音了。

為什麼是44.1KHz

日常生活中大家都接觸過CD,記得在2000年前後,當時MP3還未普及,大家聽音樂、歌曲還是主要靠購買CD。CD一般來說是Compact Disc Digital Audio的簡稱,翻譯成中文大概是緊湊型數字音頻盤的意思。最初由飛利浦和索尼在上個世紀80年代初以紅書(Red Book)的形式聯合發布,在1987年被標準化組織IEC接納為正式標準,編號為IEC 60908。這個標準最近一次修訂是在1999年。飛利浦和索尼出版了一系列以顏色命名的標準,全部都是關於Compact Disc的,紅書(Red Book)就是其中描述數字音頻CD的一本。

(CD Logo、CD盤面、早期的CD唱機、放大的CD表面紋路)

IEC 60908整個標準還是挺繁雜的,我們只關注其中的編碼部分。簡單來說,存放於CD中的音頻編碼標準就是聲音通道數為2、採樣精度16bit、編碼格式為線性PCM、採樣率固定是44.1KHz。

(適用於CD的音頻標準IEC60908)

原因一:PCM Adaptor和視頻制式

在紅書(Red Book)發布之前的1970年代,還存在著一種錄音設備叫做PCM適配器。顧名思義,它把模擬的音頻信號轉換成數字的PCM編碼,並提供錄製到視頻存儲設備上的接口。

為什麼音頻和視頻攪和在一起?因為當時已有的音頻存儲設備帶寬不夠大,不足以提供16位的PCM數字音頻的存取帶寬,這個帶寬大概在1M~1.5M bit/s,這在當時是一個相當「高」的帶寬,只有視頻存儲設備才有如此高的存取能力。PCM適配器把音頻數據按特定的視頻格式打包,從而可以藉助於已有的「高帶寬」視頻存儲設備實現音頻數據的存取。

(Sony PCM-F1:PCM Adaptor)

好吧,回憶一下文章開頭的問題:為什麼CD的採樣率是44.1KHz?

到這裡,已經非常接近問題的答案了。那就是——

任何新事物都要尊重傳統的力量。

具體到這個問題,就是音頻CD的採樣率沿用了PCM適配器的採樣率,而PCM適配器的採樣率還要能夠兼容視頻存儲設備的特定要求,以便利用當時已有的視頻存取設備來存取其中的音頻數據。

當時大量存在的視頻存儲設備主要支持兩種視頻制式,一種是25幀制式(稱為CCIR 625/50,也叫PAL),一種是30幀制式(稱為EIAN 525/60,也叫NTSC)。當時世界上有電視普及的國家按這兩種制式分為兩個陣營。

首先看30幀(即60場)制式,這種制式的一幀中,可利用來錄製音頻的視頻行最多能有490行,分到每一場(Field)就有245行。在每一視頻行可以平均存儲3個音頻採樣點,那麼音頻出現的頻率就是60*245*3 = 44100。這就是44.1KHz採樣率的由來的原因之一。

同樣在25幀(即50場)制式中,最大可利用的行數是588行,分到每一場有294行,同樣每一行存放3個音頻採樣點,那麼音頻採樣率就是50*294*3 = 44100。

這樣44.1KHz的音頻採樣率可以保證對兩種視頻制式的最大限度兼容。

原因二:Prime Numbers

還有一種解釋說明採用44100Hz的原因是,44100可以分解成2、3、5、7四個最小連續質數的平方的乘積。聽起來有些神秘主義的傾向,作者推測這些質數因子有助於系統實現時的頻率合成。

(神秘數字44100可分解為質數平方積)

原因三:Symphony No. 9 (Beethoven)

還有一種更為傳奇的說法,就是最初的CD設計團隊發現,如果用48KHz的採樣率的話,一張CD放不下74分鐘版的貝多芬第九交響曲。而採用稍小的44.1KHz,則剛好可以放下。作者感覺這種說法有點兒太傳奇太浪漫了,信不信由您。

(貝多芬第九交響曲手稿)

好了,看到這裡,想必您對CD為何採用44.1KHz的音頻採樣率已經有了一些了解。可以看出,任何一項新技術的發明和發展,都離不開對已有技術的依賴、消化和繼承。任何創新都不是憑空從頭腦中誕生的,而是一步一步腳踏實地的走出來的。這是作者在這個問題的探索中獲得的一點點感悟,與諸君分享。

相關焦點

  • 採樣率為192kHz的24位AD轉換器CS5361原理及應用
    dB動態範圍;●總諧波失真+噪聲優於-105 dB;●系統採樣率高達192kHz;●功耗小於150mW?3.1 操作模式及採樣率範圍選擇CS5361轉換器的M1、M0引腳狀態可用於決定晶片的操作模式,通過設置適當的操作模式,可使CS5361的輸出採樣率(FS)在2kHz到192kHz之間進行選擇。每種操作模式對應的採樣率範圍如表1所列。
  • Audiotrak Prodigy192:支持24bit/192kHz的音效卡
    AudioTrak是ESI的一家分公司,該公司以Maya品牌的半專業音效卡而聞名(比如Maya44、Maya 7.1),Prodiy 192是其發布的用於家庭/影院應用的系列產品,支持DTHT(Digital Technology Home
  • Exact Audio Copy 1.1 發布,音軌抓軌軟體
    Exact Audio Copy 1.1 發布,此版本修復了一些問題,添加了一個新的 AcoustID 插件(但是不會默認安裝)
  • Rumer - Nashville Tears (2020) [24bit 44.1khz FLAC]
    Exact Audio Copy V1.3 from 2. September 20019EAC 抓取日誌文件從28. DVR-219L   Adapter: 2  ID: 0讀取模式      : 可靠Secure使用精確流     : 是清空音頻緩存    : 是使用 C2 指示器 : 否組合讀寫偏移校正:            : 6讀取 Lead-In 和 Lead-Out : 否用靜音填充抓取中丟失偏移的採樣
  • 採樣1:採樣定理
    現實的信號在經過ADC以一定的頻率採樣後,成為時間離散的序列,DSP對信號進行處理,然後再通過DAC把序列變成現實世界中的連續時間信號。導致這一現象的原因是,信號的變化速度和採樣頻率不匹配。如果採樣頻率加快,樣本值就能將這些信號區分開來。採樣頻率應該多快呢?
  • 精品採樣+live工程+採樣
    今日推薦Future Bass 風格採樣+音色+Live工程今天的包是全套Future Bass風格資源所有資源加起來有1G這麼實惠的包你一定不能錯過Skifonix Sounds製作的「 Millenium:Future Bass
  • 中頻採樣和IQ採樣的比較和轉換
    中頻採樣比射頻採樣對ADC的帶寬和採樣率要求更低,同時寬帶接收機的中頻頻率一般為固定頻率,故中頻採樣應用非常廣泛。中頻採樣的主要原理框圖如下:圖1、中頻採樣框圖IQ採樣能提供數位訊號解調和分析算法中常見的IQ兩路數據,也有非常廣泛的應用。IQ採樣的主要原理框圖如下:
  • HD Audio與AC97究竟有何區別
    為何會有AC'97:這包含兩個概念,前者是採樣精度,位數越多,可供聲音描述的數據量就越豐富;後者則代表採樣的頻率,頻率越高、間隔時間就越短,所獲得的聲音就越細膩流暢。在實際輸出時,HD Audio也能夠達到24bit/192kHz,這樣的水平,在規格上已能與採用DSD技術的SACD播放機相匹敵。相比之下,現在CD-Audio技術的規格為16bit/44.1kHz,DVD-Audio的標準也只是24bit/96kHz。
  • 經驗分享 | 模數採樣知多少
    ADC帶寬 (Band width): ADC的帶寬主要由其採樣率來表徵。如果ADC的採樣率大於信號帶寬的兩倍,那麼根據Nyquist–Shannon採樣定理,就可以實現完美的重構。量化誤差的存在甚至限制了理想ADC的SNR。但是,如果ADC的SNR超過輸入信號的SNR,則其影響可能會被忽略,從而導致模擬輸入信號的本質上是完美的數字表示。
  • 常見發燒CD品種解析
    隨著發燒群體對音質的不懈追求,普通CD唱片已經經過了很多改進:24K金CD、HDCD、XRCD、SACD、DSD CD、LPCD、JSRM CD、DVD-audio等許多更加靚聲的音樂載體已經出現,筆者給入門級的用戶簡單介紹一下這些音效卓越的發燒CD品種,有機會的朋友不妨親自去嘗試一番。
  • 【採樣】電音製作必備,Trap+Psy Trance風格鼓採樣
    今天給大家推薦Trap+Psy Trance風格"鼓"採樣在這個採樣包中您會發現各種類型的底鼓和軍鼓的單個採樣可以將其拖放到你的工程中將你的製作提升到一個新的水平採樣試聽:>資源包相關信息:文件大小(壓縮):18.5MB質量:44.1kHZ 24bit格式:WAV與所有DAW兼容與PC和Mac兼容資源包包含內容:•總共83個 Kicks(底鼓)單個採樣包括:• 035 x (Big
  • 數學教育:採樣定理
    該定理說明採樣頻率與信號頻譜之間的關係,是連續信號離散化的基本依據。它為採樣率建立了一個足夠的條件,該採樣率允許離散採樣序列從有限帶寬的連續時間信號中捕獲所有信息。採樣過程所應遵循的規律,又稱取樣定理、抽樣定理。採樣定理說明採樣頻率與信號頻譜之間的關係,是連續信號離散化的基本依據。
  • 商務英語:滴滴出行:錄音功能起震懾作用 車內衝突率較此前下降48% audio recording function
    1.
  • 音響短評 | 人耳 20kHz 封頂,為什麼我們還要聽24bit/192kHz的高格式音樂呢?
    本文:2000字閱讀時間:5分鐘,我卻花了幾個小時,請各位多多點讚哇人耳 20kHz 封頂,理論上CD格式16bit/44.1kHz已經足夠記錄頻響20Hz-20kHz的音頻信號了,為什麼我們還要聽24bit/192kHz的高格式音樂呢?
  • 2700億的在線教育大蛋糕 為何是tutorabc吃到最大的一塊?
    但根據中國網際網路信息中心(CNNIC)發布的第39次《中國網際網路發展狀況統計報告》顯示,截止2016年底我國在線教育用戶規模較2015年底增長25.0%,達到1.38億,其中手機在線教育用戶規模增長率高達84.8%。一邊是資本寒冬,一邊是高速增長的用戶規模。