音樂產品設想:用波形檢測樂曲音調的強弱有效果圖gif、原型demo

2021-01-10 人人都是產品經理

大家在日常聽音樂時,偶爾會有對一些音調低弱的、或相反音調高昂的樂曲有需求。例如:傷感輕柔的流行歌曲,或輕音樂、或高昂的振動人心的樂曲。普遍滿足這類需求的方式是通過人工編輯的歌單、分類。今天給大家分享的是我個人尋索的一種通過程序計算樂曲波形自動匹配、區分樂曲音調強弱的方法。

傳統解決方案缺點

面對上文中所描述的需求,傳統的解決方案是從分類或者歌單當中選取歌曲。這種選取歌曲的方式是通過人工編輯的方式實現的,缺點非常明顯:

1、會存在主觀層面的局限性,聽覺、感覺、理解上,人人各異,選出來的同類強弱音調的歌曲自然會不同,即:無一個標準。

2、缺乏可維護性。一個分類、歌單如果人工篩選挑出一遍,那麼再人工去維護優化一遍,這幾乎是無意義的,也無標準可參考去優化。在沒有明顯的錯誤情況下,人工優化空間很小。隨著不斷新的歌曲的出現,人工去翻舊帳優化歷史歌單、分類的意義又不大。

3、人工成本的耗費。不僅僅薪酬的消耗,人工精力也是消耗。不可能像機器一樣,一致保持一種「性能」。精力、狀態不同,導致的工作結果也會不同,最終選出的分類、歌單自然也質量參差不齊。

4、曲庫一般量非常大,多則千萬首樂曲,人工挑選不太可能百分百的將歌曲都予以篩選一遍,如果再加上返工優化,那麼工作量是非常大的。曲庫不能全部輸出,它的存在意義就會折扣。

波形測算方法

聲音的波形表示著它自身的物理屬性。波形中隨著時間軸幅值的變化表示音的強弱變化。

振幅的物理意義,振幅描述了物體振動幅度的大小和振動的強弱。發音體振動的位移幅度,振幅大小同發音受到的外力大小有關,振幅的大小決定聲音的強弱。——互動百科

在聲振動中,振幅是聲壓與靜止壓強之差的最大值。聲波的振幅以分貝為單位。聲波振幅的大小能夠決定音強。——百度百科

即按照此原理,進行以下工作:

1、將樂曲的波形幅值一一取值。

2、對音調進行強弱等級劃分,我個人的具體劃分等級為「強中弱」三個等級音調。具體的劃分幅值區間是非線性的。之所選擇非線性是因為人們對音強弱感知是非線性的。這種非線性的劃分其實也具有人工主管性,不過這個僅僅是一個程序參數,完全可以不斷進行大量歌曲的實驗,進行優化。所以初始的誤差並不影響整體。

3、將一首樂曲的所有波形幅值進行按等級區間進行比較,分別落在每個等級區間的佔比如何。在哪個等級區間佔比越大,說明樂曲越傾向於哪個區間的音調強弱程度。

在這裡,我著重說一下,其實樂曲在數字流媒體中播放時,是數位訊號,離散的。類似視頻是一幀一幀的連續,樂曲也是由有限個「音點」組成的。例如我們看到的上面一張波形圖,被放大後其實是:

相信大家看到這裡便一目了然了。明白我說的取值、然後匹配所在每個區間的比例等等的意思了。

4、得到每首樂曲的在每個強弱等級的佔比,然後再進行樂曲之間的相似對比,即可將同類的歌曲分為一類。如此一來,強音、弱音即可分辨而來。其實可以幾秒即可跑完一首歌曲的,面對百萬、千萬的樂曲庫,在伺服器端同時跑一定數據樂曲,估計很快即可跑完。

5、以上都是程序中的原理,至於產品層面的設計,其實非常類似於現在的歌單、分類,並無多難、深層次的東西在裡面。

好了,說了這麼多,不Demo一下,是不是只管賣弄,不夠意思?就把自己用Java編寫的效果圖拿出來獻醜啦~(在圖片最下面不斷變化的就是這首樂曲音的強中弱音在已播放音中的佔比值,是滾動動態的,因為程序不知道後面的音的強弱多少,程序跑多少才能知道多少佔比值。)

我也整理了一些歌曲的測算結果,大家也可以用播放器軟體試聽一下強弱度是不是我個人測出來的順序:

整個過程就是這樣了。但可能有些人會提到,波形是複雜的各個頻率波形的「集合」,而人們對不同頻率的強弱聽覺是不同的,正如韓寶強先生的著作《音的歷程-現代音樂聲學導論》所講:「相同音量的聲音出現在不同音區時,我們聽起來響度會有差異。」(並且該書中給出了「等響度曲線」。)

然而按我個人以上的算法其實是把不同頻率下的音強弱感知視為同一了。下面我來解釋一下:其實歌曲音頻的確是複雜。按照「等響度曲線」所描述的,只有高頻或低頻中的感覺會差異比較大,而一首樂曲並非只有高頻和低頻階段,往往是各個頻段都包含在內。儘管我可以這麼解釋,但的確是存在誤差的,尤其是對高頻或低頻佔比比較大的樂曲,誤差較大,仍然有待優化。

就到這兒了。周末無所事事,寫了這篇稿子,把2016年的想法和大家分享一下。這也是我計劃寫一個《產品與技術》系列的第一篇文章。雖然有些偏向技術,但回看一下你會發現,這其實是產品的體驗思維貫穿始終。以解決用戶聽音樂的需求為出發點,以用戶對樂曲強弱的感知為體驗點,技術依然只是實現手段。我們產品經理的口號是:「技術改變產品,產品改變世界」,耶~~~

新的一周,祝大家工作順利。

對了,別忘了來我的其他文章看看哦~~評論,點讚、打個賞~~

本文由 @中人PM 原創發布於人人都是產品經理。未經許可,禁止轉載。

相關焦點

  • 音樂常識——不同體裁樂曲的分類
    【新同學】點擊標題下面藍色字「音樂基礎知識課堂」關注。 【老同學】點擊右上角,轉發或分享本頁面內容。  不同體裁的器樂曲的形成,都是同它們各自的應用和表演的目的、演出的場合、樂曲內容的傾向性、音調和節奏的特色、音樂風格的特徵等等有關。  【前奏曲】  (Pre1ude)原文是「序」、「引子」之意。它是一種單主題的中、小型器樂曲。
  • 各種拍子的強弱規律,有圖有真相!
    在二拍子的樂曲中,強弱規律是一強一弱交替地出現,這種規律更容易表現出音樂的律動感,強弱的對比較強,能產生較強的動感,所以常用在進行曲或歡快的樂曲之中,特別是在快速的樂曲中,更能得到充分的展現。我們在演奏、演唱二拍子的音樂時,要準確地把握住它的基本強弱規律,要突出它的第一拍強拍,並要注意第二拍的弱拍,讓這兩拍有明顯的對比,才能使人在聽覺上感受到二拍子的律動。如果將這二者的強弱關係弄反了,就可能使整個樂曲面目全非、貽笑大方。
  • 打拍子的各種強弱規律
    在二拍子的樂曲中,強弱規律是一強一弱交替地出現,這種規律更容易表現出音樂的律動感,強弱的對比較強,能產生較強的動感,所以常用在進行曲或歡快的樂曲之中,特別是在快速的樂曲中,更能得到充分的展現。  二拍子的特點就是單一、對稱和方整。
  • 各種拍子的強弱規律
    【二拍子】  在二拍子的樂曲中,強弱規律是一強一弱交替地出現,這種規律更容易表現出音樂的律動感,強弱的對比較強,能產生較強的動感,所以常用在進行曲或歡快的樂曲之中,特別是在快速的樂曲中,更能得到充分的展現。
  • 輕鬆識簡譜11:三拍子樂曲的強弱規律是什麼?視唱時怎樣擊拍?
    1.四三拍子(3/4)和八三拍子(3/8)的強弱規律四三拍子(拍號3/4)的含義是:以四分音符為一拍,每小節有三拍的節拍;八三拍子(拍號3/8)的含義是:以八分音符為一拍,每小節有三拍。見下圖:上面兩首歌曲中,《青年友誼圓舞曲》是以四分音符為一拍,每小節有三拍;《唱支最美的歌》是以八分音符為一拍,每小節有三拍。
  • 好用的音頻處理軟體都有哪些?
    或者,選用入門級產品 Pro Tools | First(免費版 Pro Tools)。這是一個獨一無二的專業音頻工作站,能夠以您需要的方式呈現、滿足您的特定需求。  5、體驗強大力量  您也許有層出不窮的奇思妙想。您所需要的,正是一個工作站,以便保持您的創造性。
  • AI用3天就寫了首黑金屬?聽完我就跪了
    如果你正在考慮換手機鈴聲,不妨試試這四種2017年度最有科幻感的聲音。 2017年是不平靜的一年,各種意義上說都是如此。 去年,有這麼一些愛音樂又愛折騰的傢伙,搗鼓出了一些我們從沒聽過的聲音。從來自太陽系邊緣的宇宙射線強弱變化,人工智慧創作的第一張黑金屬專輯,到聽後即食的巧克力「黑膠唱片」,可以稱得上是2017年度最科幻的聲音了。
  • 如何優雅的用Axure裝逼|高保真原型心得分享
    (附簡單說明原型)- Axure可以畫出什麼水準的高保真?(給示例,開啟裝逼模式)- 高保真原型圖技巧:- 啥時候上高保真?適用場景 and 不適用場景啥是原型,從事網際網路的同學,肯定非常熟悉,特別是產品崗同學。如果不是,那如下簡單講原型和高保真原型的:原型:即產品草圖。
  • 音樂中的音高修正簡史
    然後Emerick通過加快稍慢那一部分的速度,再把兩部分的速度和音調匹配好,從而得到最終的歌曲,這在當時絕對屬於相當具有創意的技術流。數字人聲調音時代的到來Eventide是美國一家著名的效果器製造商,使其揚名立萬的產品就是世界第一款數字效果器Harmonizer H910的問世。 H910發布於1975年,它是一種早期的音調校正裝置。
  • 如何用示波器檢測ECU的EMI幹擾
    如何用示波器檢測ECU的EMI幹擾 硬體電路基礎 發表於 2020-12-18 10:52:53 在做電磁兼容(EMC)測試時,通常想到的是用頻譜分析儀做的輻射測試
  • 40個常見樂理名詞,現在多看看,以後遲早會用到!
    樂器和 自然界裡所有的音都有泛音。 3、音高(Pitch) 音高是用一秒鐘的振動的次數來表示的。頻率多則音高,頻率少則音低。目前國際通用的標準音"a",是每秒振動440次的聲音。 4、音名(Pitch name) 音名指西洋樂制中代表固定音高的名稱。
  • 4款app給你的音樂來點特效!
    但小編有時候覺得,只有音樂豈不是太單調了?所以小編今天給大家推薦的幾款app,從播放器到各種特效應用,能在聽音樂時為你的手機添加更多炫酷的元素!·首先,在本地音樂播放器方面,我選擇的是Vinyl,這個app是Phonograph的改進版。
  • 谷歌Chrome瀏覽器更新,能檢測密碼強弱和洩露,給上網戴個「套」
    針對這一情況,谷歌 Chrome 瀏覽器在最近的更新中加入了一個小功能——能夠檢測用戶密碼是否洩露,還能夠提示用戶密碼的強弱程度,以此來保護用戶網上衝浪時的安全。之前,可以手動訪問 chrome://settings/passwords,並利用"check passwords"選項來查看自己的密碼是否洩露。
  • 分享一篇電子琴練習樂曲心得體會
    1 選好適合自己又特別喜歡的樂曲後,可以在識譜、唱譜階段,先去聽一下這首歌曲的原版和翻唱的至少兩個版本,是器樂演奏的樂曲,就去網上儘量找一下跨界不同的兩種樂器演奏的兩個版本 ,這樣你對曲子節奏和音色就有了一個初步的整體感覺。
  • 它被譽為20世紀華人音樂經典,它讓西洋樂曲唱出了中國人的戀歌
    有了專家介紹,對這首小提琴協奏曲的背景和樂曲內容有了一定了解。果然,這部作品的創作是在陳剛和何佔豪等青年學子在1958年冬,在老師的帶領下,走下基層,走到田邊地角為農民演出,可是,他們演出的貝多芬和巴赫的作品,農民們都聽不懂,他們要求音樂學院的學生為他們拉越劇,拉滬劇,這讓他們沉思,也讓他們認識到中國的音樂必須民族化,本土化,更要表現生活。於是,他們要創作屬於中國的作品。
  • 如果用Photoshop時間軸做出心動的gif圖
    保存為Web所用格式快捷鍵是Alt+Shift+Ctrl+S記得要保存gif的格式哦gif圖保存到桌面時選擇HTML和圖像格式保存到桌面找到文件夾images打開就可以找到gif圖像>展示一下效果圖喜歡可以關注我哦每天為你分享乾貨!
  • 超好用的GIF製作工具,輕鬆錄製你的GIF動畫
    如果你有興趣的話,可以自己製作一個喜歡的Gif動畫,其實也是非常簡單的,只要有Gif軟體的輔助,分分鐘搞定!  那麼今天就為大家推薦幾款超級簡單好用的Gif動畫錄製工具!都是簡體中文版,並且不用安裝,直接運行使用,  每一款都非常小巧好用,並且使用過程中可以靈活的選擇和設置,並能夠進行相關的編輯,非常不錯!
  • 輕鬆識簡譜10:四二拍子的強弱規律-視唱時怎樣擊拍才有節奏感?
    四二拍子的強弱規律四二拍子(2/4)的含義是:以四分音符為一拍,每小節有兩拍的節拍。不要把這句話理解為「每一小節的音符都是四分音符,每小節只有兩個四分音符」。正確的理解是:不論每一小節有多少個音符(包括休止符),若以四分音符為一拍作為標準的話,則每小節的總時值加起來一共是兩拍。如下圖:四二拍子(2/4)的強弱規律:不同節拍的音樂中,強拍與弱拍的循環規律是不同的。
  • 巴洛克時期鋼琴音樂的演奏風格與特點分析
    導讀:巴洛克時期的鋼琴音樂,通常以古典宮廷題材的音樂創作為主,在音色、音調表現方面與管風琴等鍵盤樂器類似。本文主要探討巴洛克時期鋼琴音樂的演奏風格與特點,分析了巴赫、亨德爾等作曲家的鋼琴曲及音樂創作技法。
  • 片子拍得一般,音樂值得流連——《孔雀公主》音樂賞析
    這些音樂都具有吟誦性的特點。音調近於朗誦。傣族傳統音樂中最豐富,最精採的部分是民間音樂,包括了多種多樣的民間歌曲和歌舞音樂。民歌有山歌、敘事歌、悲歌、兒歌等,歌舞音樂有孔雀歌、打鼓歌、十二馬調、依拉灰、喊扎,以及主要由象腳鼓和鋩鑼等打擊樂器伴奏的一些民間舞蹈,如孔雀舞、象腳鼓舞、馬鹿舞、魚舞、白象舞、鋩鑼舞等等。