近日,人工智慧公司出門問問推出AI語音系列產品「出門問問魔音」,並重磅上線專業AI音頻內容生產一站式解決方案——「魔音工坊」。應用出門問問魔音平臺,用戶能夠高效便捷地以AI語音技術模擬具有清晰性格特徵的真人語音,進行AI音頻內容創作,讓文字隨聲音躍出紙面。
音頻消費高速增長 真人錄音痛點繁多
隨著5G時代的全面來臨,藍牙耳機、智能音箱等音頻設備的普及,音頻內容消費在近年持續增長,包括無線電臺、網絡播客、有聲讀物、知識節目等。隨時隨地以"聽"的方式獲取聲音陪伴成為了更多用戶的選擇,在駕駛、通勤、睡前等場景中能夠輕鬆獲得沉浸式的新聞、學習、娛樂、音樂等有聲體驗。
目前用戶能夠聽到的絕大部分音頻內容都來自真人錄音,比如節目《得到》,由吳曉波、羅振宇等知名講師在專業錄音棚全程錄製音頻。真人錄音的方式雖然能夠得到生動真切的內容,但同時也存在一些問題,包括講師人力成本高、時間不便協調、專業設備要求高、人為不可控因素等。高速增長的音頻消費需求與高成本的製作供給之間存在著量級矛盾。
魔音工坊重磅上線 以AI創作精品音頻
針對真人錄音的大量痛點,「出門問問魔音」能夠實現模擬真人語速及發音習慣的語音合成,同時也為廣大純文字內容創作者賦予了低成本製作音頻節目的能力。
針對中文朗讀中大量的韻律斷句變化和多音字問題,出門問問上線了高度自由化的「魔音工坊」操作後臺,供用戶根據實際內容將配音調整為最具感染力的音頻節目。
「魔音工坊」獨創性地設計了交互友好的產品形態,用戶可以快速導入要合成聲音的文章,通過類似微軟WORD文檔的編輯操作,即可快速解決拼音、韻律等中文配音問題,讓用戶一站式快捷生產出專業精品的音頻。
「魔音工坊」中包含多項關鍵功能,具體如下:
知名發音人
針對廣大喜歡且經常閱讀科技圈、財經圈自媒體的用戶,我們首先為行業頭部的知名自媒體創始人建立AI聲音模型,包括"新智元"創始人楊靜,"甲子光年"創始人張一甲,"見實科技"創始人徐志斌,專注智能硬體的"深圳灣"創始人炫姐姐,面向和服務全球創業創始人的"艾問人物"創始人艾誠等。他們將和其他精品發音人一起,成為魔音工坊用戶製作語音音頻內容首批可以使用的聲音,讓創作的聲音內容更具專業的深度和獨特的人格。
校正多音字
為了解決配音的專業性問題,出門問問近期對多音字模型進行了重大升級,大部分多音字的準確率都達到了95%以上,整體準確率在業界處於領先水平。針對新聞、官方文件、法律條文等,對準確率有著更高要求的文章類型,魔音工坊設計了創新的交互形態,用戶點擊多音字上方的拼音,即可彈出所有發音候選,點擊正確的發音即可更改。
背景音和音效
為了讓音頻更生動,「魔音工坊」支持常見的人聲大笑、鼓掌等音效添加。如果給武俠小說配音,那麼加入竹林風聲、流水聲、口哨聲、雨聲等會讓聽覺體驗更惟妙惟肖,讓聽眾讀者"聲臨其境"。
多發音人配音
一篇文章或故事裡,經常有各種不同的角色,如果所有的角色都使用同一個聲音去配的話,會產生理解混亂等問題,而以不同的發音人配音會讓作品"聲入人心"。「魔音工坊」在音頻編輯的時候,可以選中某段文本,給這段文本指定發音人信息。比如經典的《喜劇之王》對白,配上多發音人後,截圖如下。當滑鼠經過配音角色的時候,相關的文本會以相同的背景色高亮顯示。
除了上面的部分,魔音工坊還提供了數字糾錯、變速、韻律糾錯等各種便捷有效的工具。
創建個性「隨身聽」小程序 革新公眾號閱讀體驗
公眾號是微信生態非常重要的產品。「出門問問魔音」為進一步方便內容創作者,推出了應用於公眾號的小程序。用戶只要在「魔音工坊」DIY一個自己的小程序,就可以將「魔音工坊」上合成好的音頻,一鍵發布到小程序,這樣公眾號讀者就可以使用新的方式來閱讀(收聽)文章。
魔音工坊產品提倡"為有思想的文章,賦予有溫度的聲音"。魔音工坊希望通過AI賦能,讓更多的文章插上聲音的翅膀,吸引更多讀者,觸達多樣場景。目前出門問問魔音為新智元、甲子光年、深圳灣等頭部科技媒體同步提供了隨身聽小程序,將文字內容升級為更有深度和感染力的聲音形態。從新榜等各項指標數據看,音頻內容的加入能讓自媒體擴大場景和提升用戶體驗,讓粉絲用戶留存、時長和長期忠誠度、活躍度得到更大提升。歡迎到這幾個媒體的隨身聽小程序去聽他們獨特聲音為您播報各自平臺的好文章。
出門問問秉持為深度思想和創意內容賦能、用高科技為人工降本增效、豐富閱讀方式、延伸閱讀場景的期待,誠邀各行業、領域的優質內容媒體、創作者、傳播者與出門問問攜手合作,一起打造精品音頻內容,實現AI時代多元化內容生態布局。「魔音工坊」將持續打磨升級,進一步釋放文字的價值,放飛聲音的魔力。
(alpha版本)魔音工坊網址:
https://voice-maker.mobvoi.com/