聲音是一個大市場,看幾個數據就能知道——
2019年,Strategy Analytics報告稱,智能音箱全球出貨量達到1.469億臺;同年10月,喜馬拉雅官方透露,其激活用戶突破6億、付費會員突破400萬;而早在2013年,蘋果就曾公布Podcast全球訂閱用戶已超10億。
除了直接錄製音頻以外,很多內容提供商都在採用TTS(Text To Speech)等技術把文本轉化為語音。但傳統的TTS技術有明顯的機器音,用戶長時間收聽,容易疲倦。同時,傳統配音社生產速度太慢,跟不上文字作品的更新速度,導致有大量文字作品積壓,有待轉為有聲讀物。
市場需求和痛點的存在,讓一些創業公司嗅到了機會。
36氪近日採訪的杭州倒映有聲科技有限公司(以下簡稱「倒映有聲」)是一個成立於2019年3月的音頻內容創作平臺,打算從「有聲讀物製作」這一細分領域,切入音頻市場。
該公司創始人兼CEO肖朔碩士畢業於北京航空航天大學雲計算專業,曾在獵戶星空、百度任職。在百度的語音技術部、產品創新實驗室任職期間,他曾帶領100人的TTS、圖像和數據團隊;聯合創始人兼CTO李驍是帝國理工大學人工智慧專業碩士,曾任職於百度、滴滴、獵戶星空等公司,在百度期間曾與團隊實現國內首個waveRNN落地。
目前,倒映有聲主要通過自研語音技術,搭建內容創作服務平臺,為版權方和創作者解決音頻內容製作產能低、成本高、收益少的問題。該公司稱,其音頻製作服務可使綜合效率提升數十倍,效果最高可超過95%的真人錄製水平。
具體來說,倒映有聲主要提供兩大服務:1.音頻製作自助服務:為版權方和文學創作者,提供有聲音頻的全/半自動的多種製作服務,涵蓋「畫本-錄製-剪輯」全流程雲端製作,包括中英文、單人播、多人播等,按音頻內容量收費;2. 承包製作和運營服務:從版權方獲取文學版權,承包製作,並進行推廣運營,塑造爆款IP。目前,倒映有聲已經與大約5家版權方合作,上線了10多部作品,收入來源於用戶付費訂閱、與版權方的收入分成。
目前,倒映科技已經上線了有聲讀物製作平臺「書映」。用戶可在平臺上自助製作純自動化的有聲書、人機結合的多人有聲書。
近年來,亞馬遜、蘋果、谷歌、百度、小米等網際網路巨頭紛紛布局智能音箱。肖朔表示,這些公司主要是用TTS等技術做簡單的語音播報,用於智能音箱等人機互動設備,目標是讓用戶聽懂。但倒映有聲做的是有聲讀物,對語音所傳達的情感多樣性要求較高,需要採用情緒遷移、音色遷移等技術,按照文字語義,模擬人的情緒和音色,實時合成與真人相似的聲音。
談及市場規模,肖朔算了這樣一筆帳:2019年,中國網絡文學市場約200億人民幣,有聲書市場規模不低於文字作品市場的50%,算作100億人民幣。同樣在2019年,中國知識付費市場規模達到278億元,預計2020年將突破392億元。如果有聲讀物的市場滲透率為20%,那市場規模可達78億人民幣。這樣算下來,國內每年市場規模可達178億人民幣。
再看國外市場,海外音頻讀物訂閱用戶大概有10億-20億人,按人均年消費50美金計算,海外有聲讀物市場規模在500億-1000億美金。
未來3年,倒映有聲的目標是成為一家面向全球市場的有聲讀物製作和發行商,並構建娛樂性的聲音創作社區。
肖朔告訴36氪,海外音頻產品付費習慣好,終端銷售價格幾乎是中國的7-10倍,而歐美地區配音的人力成本是中國的10倍,TTS技術相比國內並未有絕對優勢。如果倒映有聲能出海,將有很大的成本優勢。此外,倒映有聲也希望為C端研發更有趣的創作工具,並提升聲音內容的互動性,比如利用小樣本克隆技術,讓用戶參與書籍錄製;抽離作品中的IP音色,建立虛擬IP人物,以遊戲形式和用戶互動。
談及挑戰和風險,肖朔告訴36氪,第一,現有的TTS等技術的成熟度還有待提升,和真人仍有差距,難以做到誇張多變的演繹,無法全面代替真人錄製,導致短期內無法進入更專精的場景,需要不斷持續研發,並用場景積累的資源和數據來迭代技術;
「從技術的終局來看,肯定還會有大概5%~10%的內容需要真人來進行演繹,因為藝術創作的部分,技術是代替不了的。」肖朔提到。
第二,模式重運營,運營可以帶來更多的持續性收入提升,但超出目前團隊能力,需要考慮如何提升運營效率;第三,國內上下遊過於集中,版權和渠道話語權過重,壓縮了收入空間,需要拓展更多的場景和客戶群體;第四,國內外AI巨頭公司眾多,單純比拼技術、忽略場景深度,難以為繼。因此,倒映有聲計劃首先在有聲讀物這個細分領域做深做專。
倒映有聲曾獲得數百萬人民幣的天使輪融資,目前正在進行800萬人民幣的Pre-A輪融資。
——————
我是36氪記者王藝瑾,業務交流可添加微信catherineyijin,請備註公司+姓名+職務+來意。