科學音頻處理(三):如何使用 Octave 的高級數學技術處理音頻文件

2021-01-10 TechWeb

推廣 | 令人窒息的獎品等你―2016最權威的全球開發者調研

我們的數字音頻處理技術第三部分涵蓋了信號調製內容,將解釋如何進行調幅(Amplitude Modulation)、顫音效果(Tremolo Effect)和頻率變化(Frequency Variation)。

調製

調幅

正如它的名字暗示的那樣, 影響正弦信號的振幅變化依據傳遞的信息而不斷改變。正弦波因為承載著大量的信息被稱作載波(carrier)。這種調製技術被用於許多的商業廣播和市民信息傳輸波段(AM)。

為何要使用調幅技術?

調製發射

假設信道是免費資源,有天線就可以發射和接收信號。這要求有效的電磁信號發射天線,它的大小和要被發射的信號的波長應該是同一數量級。很多信號,包括音頻成分,通常在 100 赫茲或更低。對於這些信號,如果直接發射,我們就需要建立長達 300 公裡的天線。如果通過信號調製將信息加載到 100MHz 的高頻載波中,那麼天線僅僅需要 1 米(橫向長度)。

集中調製與多通道

假設多個信號佔用一個通道,調製可以將不同的信號不同頻域位置,以便接收者選擇該特定信號。使用集中調製(「復用」)的應用有遙感探測數據、立體聲調頻收音機和長途電話等。

克服設備限制的調製

信號處理設備,比如過濾器、放大器,以及可以用它們簡單組成的設備,它們的性能依賴於信號在頻域中的境況以及高頻率和低頻信號的關係。調製可以用於傳遞信號到頻域中的更容易滿足設計需求的位置。調製也可以將「寬帶信號「(高頻和低頻的比例很大的信號)轉換成」窄帶「信號。

音頻特效

許多音頻特效由於引人注目和處理信號的便捷性使用了調幅技術。我們可以說出很多,比如顫音、合唱、鑲邊等等。這種實用性就是我們關注它的原因。

顫音效果

顫音效果是調幅最簡單的應用,為實現這樣的效果,我們會用周期信號改變(乘)音頻信號,使用正弦或其他。

>> tremolo='tremolo.ogg'; >> fs=44100; >> t=0:1/fs:10; >> wo=2*pi*440*t; >> wa=2*pi*1.2*t; >> audiowrite(tremolo, cos(wa).*cos(wo),fs); 

 Tremolo

這將創造一個正弦形狀的信號,它的效果就像『顫音』。

 Tremolo Shape

在真實音頻文件中的顫音

現在我們將展示真實世界中的顫音效果。首先,我們使用之前記錄過男性發聲 『A』 的音頻文件。這個信號圖就像下面這樣:

>> [y,fs]=audioread('A.ogg'); >> plot(y); 

 Vocal

現在我們將創建一個完整的正弦信號,使用如下的參數:

增幅 = 1 頻率= 1.5Hz 相位 = 0  >> t=0:1/fs:4.99999999; >> t=t(:); >> w=2*pi*1.5*t; >> q=cos(w); >> plot(q); 

注意: 當我們創建一組時間值時,默認情況下,它是以列的格式呈現,如, 1x220500 的值。為了乘以這樣的值,必須將其變成行的形式(220500x1)。這就是 t=t(:) 命令的作用。

 Sinusodial

我們將創建第二份 ogg 音頻格式的文件,它包含了如下的調製信號:

>> tremolo='tremolo.ogg'; >> audiowrite(tremolo, q.*y,fs); 

 

 Tremolo Signal

頻率變化

我們可以改變頻率實現一些有趣的音效,比如原音變形,電影音效,多人比賽。

正弦頻率調製的影響

這是正弦調製頻率變化的演示代碼,根據方程:

Y=Ac*Cos(wo*Cos(wo/k)) 

這裡:

Ac = 增幅 wo = 基頻 k = 標量除數 >> fm='fm.ogg'; >> fs=44100; >> t=0:1/fs:10; >> w=2*pi*442*t; >> audiowrite(fm, cos(cos(w/1500).*w), fs); >> [y,fs]=audioread('fm.ogg'); >> figure (); plot (y); 

信號圖:

你可以使用幾乎任何類型的周期函數頻率調製。本例中,我們僅僅用了一個正弦函數。請大膽的改變函數頻率,用複合函數,甚至改變函數的類型。

點讚 0

相關焦點

  • 科學音頻處理(二):如何使用 Octave 對音頻文件進行基本數學信號處理
    在前一篇的指導教程中,我們看到了讀、寫以及重放音頻文件的簡單步驟,我們甚至看到如何從一個周期函數比如餘弦函數合成一個音頻文件。  聖母歌曲 + 讚美詩曲 結果,從音頻的角度來看,兩個聲音信號混合在了一起。 兩個信號的乘積 對於求兩個信號的乘積,我們可以使用類似求和的方法。
  • 音頻數據增強及python實現
    我們在進行數據增強時,最好只做一些小改動,使得增強數據和源數據存在較小差異即可,切記不能改變原有數據的結構,不然將產生「髒數據」,通過對音頻數據進行數據增強,能有助於我們的模型避免過度擬合併變得更加通用。
  • 使用FastAI 和即時頻率變換進行音頻分類
    今年夏天我參加了Kaggle舉辦的Freesound General-Purpose Audio Tagging 競賽,後來我決定調整其中一些代碼,利用fastai的便利做音頻分類。本文將簡要介紹如何用Python處理音頻文件,然後給出創建頻譜圖像(spectrogram images)的一些背景知識,示範一下如何在事先不生成圖像的情況下使用預訓練圖像模型。
  • Waves Complete 12 for mac(音頻信號處理工具)
    來源: Mac一點就透 舉報   Waves Complete 12 for mac是音頻編輯人員必備的音頻信號處理工具套裝
  • 音頻是什麼
    1、音頻指人耳可以聽到的聲音頻率在20HZ~20kHz之間的聲波,稱為音頻。2、指存儲聲音內容的文件。3、在某些方面能指作為濾波的振動音頻是個專業術語,音頻一詞已用作一般性描述音頻範圍內和聲音有關的設備及其作用。人類能夠聽到的所有聲音都稱之為音頻,它可能包括噪音等。
  • 謹慎增加音頻處理系統的 THD:如何操作,為什麼?
    本文引用地址:http://www.eepw.com.cn/article/164704.htm一些客戶在一些列產品中都使用相同的功率放大器 IC。這讓他們可以更大批量地採購一種器件,從而降低成本,簡化庫存。他們可能會使用一種小功率電源來節省成本。客戶會使用一個小功率電源的閉環、固定增益放大器。它限制了輸出電壓擺動(通過限制輸出),這樣可以保護小功率電源免受過電流狀態的損壞。
  • 什麼是有損和無損音頻格式,常見音頻有哪些?
    音頻格式是指要在計算機內播放或是處理音頻文件,是對聲音文件進行數、模轉換的過程。目前音樂文件播放格式分為有損壓縮和無損壓縮兩種。使用不同的格式的音樂文件,在音質的表現上有差很大的差異。有損和無損壓縮的區別:有損壓縮就是降低音頻採樣頻率與比特率,輸出的音頻文件會比原文件小。而無損壓縮,能夠在100%保存原文件的所有數據的前提下,將音頻文件的體積壓縮的更小,而將壓縮後的音頻文件還原後,能夠實現與源文件相同的大小、相同的碼率。
  • 音頻鑑黃是如何做到的?深度解析音頻檢測背後的技術
    雖然不少企業都把目光聚焦在視頻鑑黃上,但音頻審核也是人工智慧鑑黃技術的一部分,二者缺一不可。那在大家熟悉的視頻鑑黃之外,音頻檢測究竟能解決哪些問題?這一技術是如何進行鑑黃的呢? 嘉賓介紹 視頻檢測所使用到的圖像技術就很難在這些應用場景發揮作用,所以音頻檢測需要有針對性的技術手段。
  • 基於小波變換與DSP的實時音頻視頻處理系統
    1.1.1 音頻處理模塊 該模塊的核心晶片ct8021是採用美國dsp group公司生產的全雙工的語音壓縮解壓縮晶片。他可為基於h.320協議的多媒體系統。該晶片處理速度快,可實現語音的實時處理,其內部結構如圖4所示。 1.1.2 視頻處理模塊 在該設計中,用小波變換進行圖像壓縮是採用硬體實現的,使用了ad公司生產的adv611單片、多功能、全數字的cmos超大規模集成電路。小波壓縮核採用雙正交(7,9)小波變換。其內部結構如圖5所示。
  • 一招教你怎樣消除音頻文件裡的人聲
    我們都知道,在利用Pr軟體處理視頻時,經常會遇到需要消除人聲或者背景音的事情,利用它是可以輕輕鬆鬆去除的。但如果是需要消除音頻中的人聲部分應該如何操作呢?其實很簡單,接下來我們一起來看看實現的方法步驟,簡單幾步就能掌握!
  • 一種基於實用AGC算法的音頻信號處理方法與FPGA實現的分析研究
    一種基於實用AGC算法的音頻信號處理方法與FPGA實現的分析研究 工程師青青 發表於 2018-09-30 16:29:14 隨著現代通信技術的廣泛使用,通信企業問的競爭不斷加劇
  • 為何要謹慎地增加音頻處理系統的THD?
    一些客戶在一些列產品中都使用相同的功率放大器IC.這讓他們可以更大批量地採購一種器件,從而降低成本,簡化庫存。他們可能會使用一種小功率電源來節省成本。客戶會使用一個小功率電源的閉環、固定增益放大器。它限制了輸出電壓擺動(通過限制輸出),這樣可以保護小功率電源免受過電流狀態的損壞。但是,一個簡單的衰減器便可讓系統更加安靜。讓輸出稍微失真,可極大增加感知RMS功率。
  • 展望遊戲音頻設計的發展方向
    總的來說,就從內存和處理器這兩個指標來理解,硬體性能的提升對遊戲音頻設計意味著:更大的內存意味著可以使用更多高質量的聲音資源,更快的處理器意味著可以處理更多高精度的實時控制。因此在這樣的硬體性能水平之下,遊戲音頻設計也形成了目前一套相對成熟的開發流程,借用《遊戲音頻設計的工作流》一文中的圖示來說明:在數字音頻工作站(Digital Audio Workstation)中製作出高質量的聲音資源(Sound Asset,通常以 wav 格式文件為主),導入音頻中間件(Audio Middleware)中進行統一管理和進一步處理,並與遊戲引擎(Game Engine
  • 漲姿勢:常用音頻格式的區別
    筆者作為一個音頻設備的發燒友,也自認為算是一個音樂的發燒友,收藏的唱片和音樂文件也並不算少,對於不同的音頻格式來說,可以說主流的音頻格式都使用過也並不深入的研究過,雖然對於及其深度的技術方面來說也許並不甚了解,但是對於它們之間的區別還是可以做一個簡單的分享的。
  • 音頻壓縮技術原理
    打開APP 音頻壓縮技術原理 發表於 2017-10-17 15:37:14   音頻壓縮技術定義   音頻信號能進行壓縮的依據是音頻壓縮技術
  • 使用PyTorch實現鳥類音頻檢測卷積網絡模型
    大約在一年前,在我高二的時候,我第一次聽到這種音頻深度學習的用例。事實上,鳥音頻檢測是我做深度學習和計算機科學的第一個項目。我參與了一個研究項目,在北阿拉斯加的郊區用純粹的聲音來探測鳥類的存在。跳入其中,鳥的音頻檢測出現了這樣一個利基(有利可圖的形式),在本文中,我將向您展示如何在BirdVox-70k數據集上使用一個簡單的卷積神經網絡(CNN)來實現這一點。
  • 微信語音怎麼導出WAV格式音頻文件到電腦保存
    蘋果手機及安卓手機的微信語音消息均以silk格式保存在手機內存中,雖然蘋果手機微信語音源文件後綴為aud,安卓手機微信語音源文件後綴為amr,但其內部存儲格式其實是一樣的,這種格式無法在電腦上直接播放,下面我將詳細介紹一下如何將這些微信語音批量導出為電腦通用音頻文件,並保存到電腦上的操作過程。
  • 用迅捷音頻轉換器合併音頻,小白也能輕鬆上手!
    這時候需要一款實用的音頻合併軟體了。市場上提供此功能的軟體特別多,那什麼軟體好用?小千今天會向大家推薦一下迅捷音頻轉換器。軟體介紹:迅捷音頻轉換器是一款多功能的音頻編輯處理器,提供了音頻剪切、音頻合併、音頻提取、音頻轉換等功能。它功能齊全、操作比較簡單,下載打開後都會有操作流程提示,算是比較貼心的一款軟體。
  • 音頻信號及音頻分析
    聲音經過模擬設備記錄或再生,成為模擬音頻,再經數位化成為數字音頻。這裡所說的音頻分析就是以數字音頻信號為分析對象,以數位訊號處理為分析手段,提取信號在時域、頻域內一系列特性的過程。各種特定頻率範圍的音頻分析有各自不同的應用領域。
  • au音頻錄音編輯軟體如何錄製話筒和電腦系統聲音
    在au音頻編輯軟體中很多朋友可能在初學時,對於au音頻錄音軟體如何進行錄製話筒的聲音以及當聽到一手很好的歌曲但是在下載資源中無法找到能提供下載的音頻文件,此時就需要我們使用音頻錄音軟體進行錄製,很多朋友可能是感覺找一款傻瓜式的錄音軟體就可以完成了,其實建議在平時接觸音頻錄音和編輯比較多的朋友們可以在閒暇之餘多多學習下比較專業的音頻錄音編輯軟體