靈感點:
直接口令歌名,不作其他贅述,AI 音箱就能懂你心「聲」?亞馬遜工程師提供了三個解決方案:
分析歌曲播放的時間數據
篩選歌手風格及歌曲類型
對歌曲的用戶吸引力評分
-Hi 小X,我想聽《天空之城》~
-好的,正在為您播放久石讓的《天空之城》
-額,我想聽的是李志那首…
同曲名的音樂那麼多,翻唱版本一波又一波,AI 音箱如何選出你心中的那首歌?
亞馬遜語音助手 Alexa 的工程師近期開發了一套「隱式推薦系統」,能夠通過人工智慧學習並記憶用戶的音樂品味。今日,該項目的研究者、「機器學習」方向專家 Bo Xiao 在印度海德拉巴舉行的 Interspeech 2018 年會上,首次揭秘了這一智能系統的技術原理。
一、時間算法:分析歌曲播放的時間數據
「隱式推薦系統」提供了一個可訓練的時間數據推薦引擎。舉個例子,假如在 30 秒內,用戶即切斷當前歌曲,說明這完全不是他想聽的歌,下次將不再推薦同種曲目;在 30 秒切斷歌曲,可能用戶並不喜歡這首歌或這個版本,下一次,系統將切換另一位歌手的同名歌曲或另一類風格,以此類推。
那如果是與音樂偏好無關的播放中斷呢?「隱式推薦系統」增加了加權功能。例如, 如果歌曲播放時間為 25 秒而不是一秒鐘,或者播放三分鐘而不是兩分鐘,則歌曲的推薦比重將加權增大。
二、類別算法:篩選歌手風格及歌曲類型
同樣是美國著名流行歌曲《Hello》,如果你第一次選擇了萊昂內爾·裡奇的版本,那麼算法可能會記憶「男性」,「美國」,「經典」,「格萊美金曲」等一系列標籤,如果你選擇了阿黛爾的版本,相應地,算法標籤將會是另一種風格和類型。
隨著系統海量資料庫的積累和每一位用戶個體畫像的完善,該系統也在自動地快速迭代算法,細化音樂「標籤」。
三、吸引力算法:對歌曲的用戶吸引力進行評分
儘管用戶的音樂品味各異,但好聽的版本總能獲得更多用戶的喜歡。該系統的「用戶吸引力評估模型」,能夠對目標曲目進行智能打分和評級,再匹配出最佳歌曲推薦給用戶。
此外,「隱式推薦系統」還進一步優化了語義理解,能夠提高對含混不清口令的辨識度和智能猜測準確率。
Bo Xiao 表示,目前「隱式推薦系統」的測試效果良好,未來,研究團隊還計劃將這一技術應用於有聲讀物、視頻等更多領域。
近年來, AI 智能音箱競爭激烈, 各品牌通過不斷研發和優化技術算法,提升用戶的個性化音樂體驗。例如通過語音和心率來判斷情緒,並根據情緒來匹配音樂的 EmoKit ,以及能夠讓用戶參與音樂創作的Jukedeck、Melodrive 和 Humtap 。
而相對而言,國內AI 音箱在語義理解和個性化音樂推薦方面,功能還較為基礎。究其本質,或許還在於搶佔市場風口、布局流量入口以及忙著打價格戰。未來,品牌如果想要打造精品,建立競爭壁壘,或許還需要用心鑽研用戶的真實需求。
推薦閱讀:巨頭扎堆進場,智能音箱為何難見爆款?