「大家好,我是小妮,誕生於京東數字科技集團AI實驗室。用你們人類的話說,我是AI主播。沒錯,來自虛擬世界的我喊你上課啦!」字正腔圓、細膩逼真的AI主播近日亮相於京東數科產業AI公開課,這是京東數科自主研發的AI虛擬數字人產品首次出現在公眾面前。
據介紹,京東數科融合了2D和3D技術,將傳統方法與深度學習結合,僅需使用一段幾分鐘的人物視頻數據,經過幾小時訓練就可以合成出寫實風格的AI虛擬數字人。
為了順利實現文字到語音的轉化,京東數科自主研發了輕量級對抗語音合成技術,通過結合深度神經網絡在多人數據上進行個性化建模,達到音色豐富、特色鮮明的語音合成效果,甚至可以模擬人的呼吸和停頓,聽感酷似真人。為了使AI主播形象更加逼真,京東數科利用對抗生成網絡來還原更真實的表情,通過3D模型運動追蹤技術來確保AI主播在說話時口型準確、表情細膩、頭部運動自然。
除了AI主播,AI虛擬數字人還可以在多場景中落地生根。比如,在重複性很高的智能客服場景中,人工客服具有人工成本高、質量參差不齊等缺點,用AI虛擬數字人代替人工客服,可大幅提升整體客服效率和服務體驗。
京東數科AI實驗室首席科學家薄列峰表示,除了在客服、招聘等領域的應用外,AI虛擬數字人技術還將服務內容創造者,通過把靜態圖文內容轉化為由「真人」講解的短視頻,滿足用戶對多樣化呈現形式的需求。
(鄭志輝)