科學音頻處理(三):如何使用 Octave 的高級數學技術處理音頻文件

2021-01-10 TechWeb

推廣 | 令人窒息的獎品等你―2016最權威的全球開發者調研

我們的數字音頻處理技術第三部分涵蓋了信號調製內容，將解釋如何進行調幅(Amplitude Modulation)、顫音效果(Tremolo Effect)和頻率變化(Frequency Variation)。

調製

調幅

正如它的名字暗示的那樣，影響正弦信號的振幅變化依據傳遞的信息而不斷改變。正弦波因為承載著大量的信息被稱作載波(carrier)。這種調製技術被用於許多的商業廣播和市民信息傳輸波段(AM)。

為何要使用調幅技術?

調製發射

假設信道是免費資源，有天線就可以發射和接收信號。這要求有效的電磁信號發射天線，它的大小和要被發射的信號的波長應該是同一數量級。很多信號，包括音頻成分，通常在 100 赫茲或更低。對於這些信號，如果直接發射，我們就需要建立長達 300 公裡的天線。如果通過信號調製將信息加載到 100MHz 的高頻載波中，那麼天線僅僅需要 1 米(橫向長度)。

集中調製與多通道

假設多個信號佔用一個通道，調製可以將不同的信號不同頻域位置，以便接收者選擇該特定信號。使用集中調製(「復用」)的應用有遙感探測數據、立體聲調頻收音機和長途電話等。

克服設備限制的調製

信號處理設備，比如過濾器、放大器，以及可以用它們簡單組成的設備，它們的性能依賴於信號在頻域中的境況以及高頻率和低頻信號的關係。調製可以用於傳遞信號到頻域中的更容易滿足設計需求的位置。調製也可以將「寬帶信號「(高頻和低頻的比例很大的信號)轉換成」窄帶「信號。

音頻特效

許多音頻特效由於引人注目和處理信號的便捷性使用了調幅技術。我們可以說出很多，比如顫音、合唱、鑲邊等等。這種實用性就是我們關注它的原因。

顫音效果

顫音效果是調幅最簡單的應用，為實現這樣的效果，我們會用周期信號改變(乘)音頻信號，使用正弦或其他。

>> tremolo='tremolo.ogg'; >> fs=44100; >> t=0:1/fs:10; >> wo=2*pi*440*t; >> wa=2*pi*1.2*t; >> audiowrite(tremolo, cos(wa).*cos(wo),fs);

Tremolo

這將創造一個正弦形狀的信號，它的效果就像『顫音』。

Tremolo Shape

在真實音頻文件中的顫音

現在我們將展示真實世界中的顫音效果。首先，我們使用之前記錄過男性發聲『A』的音頻文件。這個信號圖就像下面這樣：

>> [y,fs]=audioread('A.ogg'); >> plot(y);

Vocal

現在我們將創建一個完整的正弦信號，使用如下的參數：

增幅 = 1 頻率= 1.5Hz 相位 = 0 >> t=0:1/fs:4.99999999; >> t=t(:); >> w=2*pi*1.5*t; >> q=cos(w); >> plot(q);

注意：當我們創建一組時間值時，默認情況下，它是以列的格式呈現，如, 1x220500 的值。為了乘以這樣的值，必須將其變成行的形式(220500x1)。這就是 t=t(:) 命令的作用。

Sinusodial

我們將創建第二份 ogg 音頻格式的文件，它包含了如下的調製信號：

>> tremolo='tremolo.ogg'; >> audiowrite(tremolo, q.*y,fs);

Tremolo Signal

頻率變化

我們可以改變頻率實現一些有趣的音效，比如原音變形，電影音效，多人比賽。

正弦頻率調製的影響

這是正弦調製頻率變化的演示代碼，根據方程：

Y=Ac*Cos(wo*Cos(wo/k))

這裡：

Ac = 增幅 wo = 基頻 k = 標量除數 >> fm='fm.ogg'; >> fs=44100; >> t=0:1/fs:10; >> w=2*pi*442*t; >> audiowrite(fm, cos(cos(w/1500).*w), fs); >> [y,fs]=audioread('fm.ogg'); >> figure (); plot (y);

信號圖：

你可以使用幾乎任何類型的周期函數頻率調製。本例中，我們僅僅用了一個正弦函數。請大膽的改變函數頻率，用複合函數，甚至改變函數的類型。

點讚 0

相關焦點

科學音頻處理(二):如何使用 Octave 對音頻文件進行基本數學信號處理

在前一篇的指導教程中，我們看到了讀、寫以及重放音頻文件的簡單步驟，我們甚至看到如何從一個周期函數比如餘弦函數合成一個音頻文件。聖母歌曲 + 讚美詩曲結果，從音頻的角度來看，兩個聲音信號混合在了一起。兩個信號的乘積對於求兩個信號的乘積，我們可以使用類似求和的方法。

音頻數據增強及python實現

我們在進行數據增強時，最好只做一些小改動，使得增強數據和源數據存在較小差異即可，切記不能改變原有數據的結構，不然將產生「髒數據」，通過對音頻數據進行數據增強，能有助於我們的模型避免過度擬合併變得更加通用。

使用FastAI 和即時頻率變換進行音頻分類

今年夏天我參加了Kaggle舉辦的Freesound General-Purpose Audio Tagging 競賽，後來我決定調整其中一些代碼，利用fastai的便利做音頻分類。本文將簡要介紹如何用Python處理音頻文件，然後給出創建頻譜圖像(spectrogram images)的一些背景知識，示範一下如何在事先不生成圖像的情況下使用預訓練圖像模型。

Waves Complete 12 for mac(音頻信號處理工具)

來源: Mac一點就透舉報　　Waves Complete 12 for mac是音頻編輯人員必備的音頻信號處理工具套裝

音頻是什麼

1、音頻指人耳可以聽到的聲音頻率在20HZ~20kHz之間的聲波，稱為音頻。2、指存儲聲音內容的文件。3、在某些方面能指作為濾波的振動音頻是個專業術語，音頻一詞已用作一般性描述音頻範圍內和聲音有關的設備及其作用。人類能夠聽到的所有聲音都稱之為音頻，它可能包括噪音等。

謹慎增加音頻處理系統的 THD:如何操作,為什麼?

本文引用地址：http://www.eepw.com.cn/article/164704.htm一些客戶在一些列產品中都使用相同的功率放大器 IC。這讓他們可以更大批量地採購一種器件，從而降低成本，簡化庫存。他們可能會使用一種小功率電源來節省成本。客戶會使用一個小功率電源的閉環、固定增益放大器。它限制了輸出電壓擺動(通過限制輸出)，這樣可以保護小功率電源免受過電流狀態的損壞。

音頻格式是指要在計算機內播放或是處理音頻文件，是對聲音文件進行數、模轉換的過程。目前音樂文件播放格式分為有損壓縮和無損壓縮兩種。使用不同的格式的音樂文件，在音質的表現上有差很大的差異。有損和無損壓縮的區別：有損壓縮就是降低音頻採樣頻率與比特率，輸出的音頻文件會比原文件小。而無損壓縮，能夠在100%保存原文件的所有數據的前提下，將音頻文件的體積壓縮的更小，而將壓縮後的音頻文件還原後，能夠實現與源文件相同的大小、相同的碼率。

音頻鑑黃是如何做到的?深度解析音頻檢測背後的技術

雖然不少企業都把目光聚焦在視頻鑑黃上，但音頻審核也是人工智慧鑑黃技術的一部分，二者缺一不可。那在大家熟悉的視頻鑑黃之外，音頻檢測究竟能解決哪些問題？這一技術是如何進行鑑黃的呢？嘉賓介紹視頻檢測所使用到的圖像技術就很難在這些應用場景發揮作用，所以音頻檢測需要有針對性的技術手段。

基於小波變換與DSP的實時音頻視頻處理系統

1.1.1 音頻處理模塊該模塊的核心晶片ct8021是採用美國dsp group公司生產的全雙工的語音壓縮解壓縮晶片。他可為基於h.320協議的多媒體系統。該晶片處理速度快，可實現語音的實時處理，其內部結構如圖4所示。 1.1.2 視頻處理模塊在該設計中，用小波變換進行圖像壓縮是採用硬體實現的，使用了ad公司生產的adv611單片、多功能、全數字的cmos超大規模集成電路。小波壓縮核採用雙正交（7，9）小波變換。其內部結構如圖5所示。

一招教你怎樣消除音頻文件裡的人聲

我們都知道，在利用Pr軟體處理視頻時，經常會遇到需要消除人聲或者背景音的事情，利用它是可以輕輕鬆鬆去除的。但如果是需要消除音頻中的人聲部分應該如何操作呢？其實很簡單，接下來我們一起來看看實現的方法步驟，簡單幾步就能掌握！

一種基於實用AGC算法的音頻信號處理方法與FPGA實現的分析研究

一種基於實用AGC算法的音頻信號處理方法與FPGA實現的分析研究工程師青青發表於 2018-09-30 16:29:14 隨著現代通信技術的廣泛使用，通信企業問的競爭不斷加劇

為何要謹慎地增加音頻處理系統的THD?

一些客戶在一些列產品中都使用相同的功率放大器IC.這讓他們可以更大批量地採購一種器件，從而降低成本，簡化庫存。他們可能會使用一種小功率電源來節省成本。客戶會使用一個小功率電源的閉環、固定增益放大器。它限制了輸出電壓擺動（通過限制輸出），這樣可以保護小功率電源免受過電流狀態的損壞。但是，一個簡單的衰減器便可讓系統更加安靜。讓輸出稍微失真，可極大增加感知RMS功率。

展望遊戲音頻設計的發展方向

總的來說，就從內存和處理器這兩個指標來理解，硬體性能的提升對遊戲音頻設計意味著：更大的內存意味著可以使用更多高質量的聲音資源，更快的處理器意味著可以處理更多高精度的實時控制。因此在這樣的硬體性能水平之下，遊戲音頻設計也形成了目前一套相對成熟的開發流程，借用《遊戲音頻設計的工作流》一文中的圖示來說明：在數字音頻工作站（Digital Audio Workstation）中製作出高質量的聲音資源（Sound Asset，通常以 wav 格式文件為主），導入音頻中間件（Audio Middleware）中進行統一管理和進一步處理，並與遊戲引擎（Game Engine

科學音頻處理(三):如何使用 Octave 的高級數學技術處理音頻文件

相關焦點

科學音頻處理(二):如何使用 Octave 對音頻文件進行基本數學信號處理

音頻數據增強及python實現

使用FastAI 和即時頻率變換進行音頻分類

Waves Complete 12 for mac(音頻信號處理工具)

音頻是什麼

謹慎增加音頻處理系統的 THD:如何操作,為什麼?

什麼是有損和無損音頻格式,常見音頻有哪些?

音頻鑑黃是如何做到的?深度解析音頻檢測背後的技術

基於小波變換與DSP的實時音頻視頻處理系統

一招教你怎樣消除音頻文件裡的人聲

一種基於實用AGC算法的音頻信號處理方法與FPGA實現的分析研究

為何要謹慎地增加音頻處理系統的THD?

展望遊戲音頻設計的發展方向

漲姿勢:常用音頻格式的區別

音頻壓縮技術原理

使用PyTorch實現鳥類音頻檢測卷積網絡模型

微信語音怎麼導出WAV格式音頻文件到電腦保存

用迅捷音頻轉換器合併音頻,小白也能輕鬆上手!

音頻信號及音頻分析

au音頻錄音編輯軟體如何錄製話筒和電腦系統聲音