響度、動態,與處理手法
我們這裡談到的「響度」,和測量城市噪聲的響度、以及聲壓計測得的數值不是同一件事情。聲壓計其實只是測量聲壓,而聲壓其實是略大於大氣壓力的一種空氣壓力計量手段而已。它根本和「響度」是兩種截然不同的度量方式。響度,雖然從基於電功率的角度來說是可以被測量的,但它完全不能真實反應我們對響度的感覺。實際工作當中,響度無論如何都是一個比較主觀的量,其實是一個心理聲學相關的問題。然而,除了情緒和心理因素,影響你對一個聲音「響」還是「輕」的判斷多少是有一些明確的規律可循的。主要包括:
ADSR
持續時間、混響
頻率與頻響關係
節奏與運動
ADSR = Attack, Decay, Sustain, Release
ADSR的另一個名稱叫做包絡(Envelope)。它描述了一個自然聲音從出生到消亡的進行過程。這四個階段的數值都是時間單位,通常用ms(毫秒)。Attack時間越短,那麼響度會越大。比如打擊樂器很短有15ms以內的,同樣的電平,如果是弦樂(attack一般大於50ms),兩者在一起,打擊樂器就是會顯得響一些,有時候會感覺響很多。再比如說槍聲,attack小於10ms,同樣的峰值電平,它就會比打擊樂器感覺還響。所以有時候,動一下樣本attack就可以解決它的響度問題。Attack在整個包絡過程中對響度的影響是最大的。
持續時間和混響
一個聲音的持續時間,往往是Decay、Sustain和Release這三個時間值來決定的。Decay時間越長,那麼這樣本較大聲的部分持續時間就越長,所以它會聽起來比較響一些。同樣,Sustain延長也會讓聲音顯得比較響一些,但是這個時間不是確定的!主要原因在於人的「聽覺適應性」,這是人的本能反應。想一下,當你剛進辦公室的時候如果注意到空調的聲音,你或許會覺得很大,等你的注意力轉移了、或者過了幾分鐘之後生理上適應了,你甚至壓根就不會覺得有啥空調噪聲....直到下一次你心情不好或者無所事事了…。這種聽覺的自適應性,是「聽覺主觀選擇性」的一部分,如果這部分功能喪失,你會變得異常可怕。簡單說,聽覺需要不斷的新鮮感和變化來刺激你的注意力才行!但是作為聲音設計師,有時候你不得不和這種本能的生理現象搏鬥。所以有時候我們做出點啥過份的事情也是有一些原因的。
Release在這不是「延遲」,而是聲音停止震動後、在空氣中繼續傳播並且逐漸消散的那段時間,很多時候它會和混響有很大關係。Release是比較有趣的,通常一個音效裡,我們是比較容易忽略它對響度的影響,甚至我們可能找不到所謂的Release段在哪裡。比方說一個爆炸聲,其實它的主體就是它的Release,因為爆炸本身可能在10毫秒裡就結束了。其實,我們經常會說「我要這個聲音利落一點、有打擊感」。Release就是非常關鍵的一個問題!比方說,很多時候我們會希望一個聲音要猛一些,但是又不希望它太大聲,壓住了別的聲音,這時候你首先要考慮的就是要動一下Release的持續時間,不要讓它「聽起來很自然地消失」,尤其在做soundtrack的時候,快速打鬥中你讓一個衣服抖落的聲音那麼自然地款款而去,多數情況下其實並不是那麼專業的做法,除非你需要某種特殊效果。Release會讓聲音顯得拖泥帶水的。再想想爆炸聲,連續的爆炸或者大的碰撞,單層樣本的Release部分音量看起來很小,幾層一疊...3dB、3dB的就迅速上去了,結果就是糊成一片,這和射擊聲是一樣的原理。但有些聲音比如技能,確實會需要保留足夠長的尾巴,那麼這時候你可以考慮讓Decay衰減快一些,讓sustain時間的電平也加快衰減,那麼即使Release長也一些也是容易被別的聲音覆蓋的。因為多個聲音疊加的前提是它們之間的電平差要均等,保持一個適當低電平的Release就可以避免這種踩踏現象。
另外,混響也是會造成尾音變長,混響的前期反射也會和幹聲疊加導致整個聲音變大聲。這不見得是個壞事情!在所有這些現象中,每一種情況都是可以被恰當利用來控制響度的。比如說,UI的聲音,在日系遊戲裡、尤其典型的事PS3、PS4的系統聲音,那些聲音非常小聲,但是你可以清晰聽到。為啥?其中有兩個原因:首先它的混響一般都比較長,在1-1.5s之間,這種混響延長了本來非常短促那種小聲音(聽起來小就是因為聲音太短了),所以你感覺到的響度變大了;其次,合理的混響(相對於BGM的混響)類型,可以讓聲音處於一個比較新鮮的、或者是不那麼「自然」的聲場裡,而這種非自然狀態或者新鮮感會吸引你的聽覺,轉而感覺它變大聲了。
如果這個聲音持續時間很長,比如超過60秒的一段音樂,用ADSR這樣的方式去描述顯然也不太合理,所以引入了另一個術語:Shape。Shape是一段聲波連續峰值的外輪廓,改變這個輪廓就可以改變這個聲音響度變化,這種手法稱為「塑形Shaper」,也廣泛用在合成器技術和效果器技術中(以後有機會咱們可以聊聊)。Shape也是我個人使用很頻繁的一種控制聲音節奏和響度的手法,尤其在後期潤色優化的時候。Shape的本質並不是改變RMS,而是改變峰值的變化狀態。讓這個持續的聲音在某些不那麼重要的時間下去,而在某些我需要的地方上來一點,這樣可以影響你的注意力,從而達到響度變化的結果。
關於響度的更多具體資料,可以去看看我年輕時候和安棟老師合作的一本書:數字音頻基礎
這本書裡提到了一系列關於響度的數值影響規律,可供參考。
頻率
我們都已經知道等響度曲線那個事情了。等響度曲線的作用和意義之重就不需要多囉嗦了。這套曲線告訴我們的最基本的現象是:頻率和Attack一樣,本質上影響了我們對響度的感受。儘管如此,從我的觀察經驗和自身的製作經驗來看,通過頻率對響度進行控制,往往還是容易被忽略的。比方說手遊,手機揚聲器在350Hz以下大多都快速消失了,多數玩家不會戴耳機玩遊戲。這種情況下拼命推一個爆炸的低頻,只會導致一個結果:聲音爆了,並且把別的聲音也給壓掉了,並且聲音顯得悶悶的。其實我們都有一種體會:越是大的爆炸,越是比較沉悶的。難道沒有高頻麼?不是,低頻把高頻給掩蓋了而已!所以,這種情況下你要聲音保持一定的亮度,必須要提升高頻,同時衰減不必要的低頻。這在音樂裡混Bass是最典型了:要讓一把Bass顯得有力渾厚,單推低頻是沒用的,出來的只是軟軟的繩子,而不是蟒蛇一樣的有力的,更好的方法是去動一下高頻(4kHz以上)。但這樣一來也會導致整個音量上升,怎麼辦呢?衰減中頻和中低頻唄!中頻1-2kHz)往往會讓一個聲音顯得很近,也會顯得很響,它也會很大程度上掩蓋掉高頻和低頻。對於有些風格的音樂來說,中低頻也可以換成是低頻,看需要了。所以,最有效的解決音量和響度的辦法不是去拉電平,而是砍掉一些中頻(1-2Khz)或者中低頻(500Hz左右)。如此一來,你Bass的高頻和低頻也不需要提升那麼多就可以顯現出來強度了。此時,你甚至可以考慮衰減這Bass的52Hz以下部分,把這部分低頻讓給別的樂器。好吧…這分明和混音有關。是的!但這幾乎是每個聲音設計師都要學習和掌握並且不斷進步的一個重要點!混音主要要做的事情不是拉推子,而是通過EQ來解決每種樂器的響度、景深和空間問題。而且EQ的種類永遠不嫌多。
再舉個例子,1kHz和500Hz的故事。大部分聲音的強度都會集中在500-1000這個範圍裡,比較強壯的聲音則集中在250Hz周圍。如果希望一個聲音聽起來很大聲、但又不會衝著你腦門,那麼可以先試試切掉1000Hz,動作一定要狠,先切到底,看這個方法對是否對這聲音有效,有效的話就慢慢往回拉。比較忌諱的動作就是衰減的時候一點點往下拉...結果這細膩的變化把自己的心都化了...沒方向了呀!假如說,我希望一個聲音很猛(低頻),又很結實(中頻1000左右),但有不會蓋掉那些小聲音,這時候可以直接向500開刀,通常就會在250-500之間。
你需要清楚意識到,每個聲音,都一定存在它的一個主能量頻段!只要你動了這個頻段,那麼它的整個聲音響度就會被改變!也可以說,這個頻段對於這個聲音來說是最主要的,其他部分都是可以酌情清理掉的!等你具備了足夠經驗之後,你會發現,任何一個聲音的任何一個頻段都是可以隨你的喜好來的!比方說500Hz對於一把電箱琴的音色來說是致命的,但是如果這把琴只是用來補償節奏的呢?500Hz一刀切掉完全不影響它的音樂功能,那為啥不切掉呢?事實上很多音樂裡,節奏功能的電箱琴500Hz以下被幹掉太正常了。這個事情告訴我們一個重要的道理:每個樣本都是為整體服務的,它的唯一特徵是它存在的根本依據(不然要他幹嘛?),我們可以選擇保留這個特徵,也可以選擇修改他的特徵,但無論如何,我們優先保留它對整體有用的功能部分,而其他都可以作為次要頻段存在,是隨時可以被衰減甚至切掉的。如果你想保留,首先想一想:有必要麼?其次再想想:次要頻段是否可以起到足夠襯託作用?
另有一個有趣的例子,很多成年人的聽覺頻率上限其實達不到20kHz,我自己的聽覺上限最近幾年一直穩定在18.5kHz左右,而18kHz的正弦檢波足以讓我的耳朵感覺兇猛的針刺感。還有指甲撓黑板的聲音,大部分人都會覺得那個聲音很大並且非常刺激,然後用聲壓計測試到的電平其實並不高,瞬間電平可能比較大,但RMS都很小。
對頻響的經驗和認知,很大程度上取決於你的混音水平和經驗。而混音首先關注的是一個作品整體的表現,所有細部的調整都是為了整體服務的。無論遊戲、影視還是音樂的混音,每個元素在其中承擔的功能和效果決定了它應該被設定到哪個位置和強度。
節奏與運動
我們大多數時候面臨的聲音都是比較複雜的、持續運動的聲音。這時候聲音的節奏和運動狀態也會直接影響到我們對響度的感覺和判斷。比方說在很多電影裡,在一個大的爆炸前(通常是全景鏡頭),會有一個非常20-80ms的短時空缺(Gap),甚至連音樂也會對白啥的也會被急停,隨後的爆炸就會讓你感覺很大聲。但如果你把這個樣本提取出來,或者直接去測試一下它的電平甚至RMS,你會發現這個爆炸聲音其實遠不如你感受的那麼大。
產生這種聽覺效果的原理很簡單:動態。動態在聲學上的定義就是:音量差。你可以簡單地認為它就是「峰值電平的差」,而現在響度計量比較成熟後,我們引入的是LRA作為響度差來描述動態。這種手法使用非常普遍,尤其是一個大的爆炸或者Stinger前面鋪墊的是一個Reverse的或者漸強的聲音。或者為了平衡前後兩段聲音的比例關係,或者為了後面的撞擊爆炸不至於過大。有時候,後段聲音的峰值不需要很大就足以讓人產生很大聲的錯覺。這裡的技巧在於,如何把握前後兩段的峰值差,以及這個空隙的時間長度。在很多好萊塢電影裡,這個空襲甚至大到1甚至2秒也有可能。這種留白式的戲劇性效果可以產生很大的聽覺衝擊。甚至,後段的峰值不一定要比前段的峰值大,也可以獲得很特別的效果。
除此以外,兩段相連聲音的主頻段的差異也可以形成非常明顯的衝擊感。想想鼓的節奏,基本的配比是一隻底鼓和一隻軍鼓,兩者的主頻段相差非常大,即使同樣的峰值或者RMS,兩者合理序列依然可以產生足夠大的響度感覺,例如Drum & Bass、Hiphop就是很典型的例子。這裡有兩段樣本,後段的Stinger是一樣的,但是段Reverse的主頻有明顯不同,我們可以輕易感受到最終結果上的差異:
[下圖中,深色劃出的部分是間隙,約100ms]
來感受一下響度的區別,單純的Stinger:
http://html.midifan.com/download/game/Stinger_with_no_gap.wav
有引子和gap的stinger:
http://html.midifan.com/download/game/Stinger_with_gap.wav
再來看看這段Beat的情況:[樣例,第一行是原聲]
http://html.midifan.com/download/game/acoustic_kit_raw.wav
A. 第二行,混響比較長的,音色間有明顯的粘連
http://html.midifan.com/download/game/acoustic_kit_reverbed.wav
B. 第三行,沒有混響,沒有明顯的粘連,甚至斷開的(用了GATE)
http://html.midifan.com/download/game/acoustic_kit_gated.wav
混響對於響度的影響我們大多是知道的,但是我們需要明確知道的是,它不單影響了ADSR的比例關係,也會讓某些頻段加強,同時也會對你的聽覺經驗產生影響,這是一種綜合的作用,對於聲音設計師來說,這些因素也是可以拿來利用和分析的。尤其是斷開的聲音,它打斷了主觀聽覺經驗的連續性,從而讓你失去對響度的準確判斷或者經驗判斷。
雖然這是一段音樂性的Beat,但打擊樂器的本質和音效基本沒有啥區別,在物理聲學裡都屬於「噪音」範疇。所以在演奏、音色創作和混音的時候採用的手法和音效創作處理是很類似的。而打擊樂器在節奏、運動和頻率差方面產生的動態感受比通常意義的「音效」更明顯。我們也有另一個經驗:如果鼓手演奏速度不那麼穩定,甚至力度也不那麼穩定,即使錯音的音量不那麼大,也會讓你感覺很突兀,甚至會感覺錯音那麼大聲。這個現象也充分說明了響度的主觀性、經驗性,以及主觀選擇性。
因為文字表達能力有限,還有非常多的情況和手法不能一一列舉。其實,處理手法取決於你對聲音的理解、想像,還要有足夠的膽量去嘗試。沒有所謂對或者不對,只有好和更好之分。個人建議,可以多訓練混音,無論是音樂的多軌混音還是soundtrack的混音,都應該長期訓練。可以讓你學到非常多的技巧和經驗。
以上內容供探討和參考。若有錯漏,請斧正,不勝感激!
♬ ♯ ♩ ♪ ♫ ♬ ♭♬ ♯ ♩ ♪ ♫ ♬ ♭♬ ♯ ♩ ♪
廣告:小旭音樂北京 廣州 上海 成都四地現招聘
廣告:野雅綾樂器