封面新聞記者 歐陽宏宇
4月23日,阿里巴巴正式發布四川方言版本的天貓精靈,人工智慧助手開始進入「人性化」時代。
據介紹,目前這一方言版本正在逐步上線,已面向部分內測用戶開放,只需在音箱端或APP上進入「角色超市」,選擇四川話版本,就可以使用四川方言的語音交互功能,到5月底將向全國用戶開放。

瀏覽器版本過低,暫不支持視頻播放
每天配音8小時月薪10萬
塑造溫柔俏皮的「四川貓」
「真是我的聲音!參加這個比賽太有意義了!」四川方言大賽冠軍周玥偲是一名專業配音員,也是地道的四川人。在四川方言大賽結束後,她在錄音棚內花了一個月時間每天教天貓精靈說四川話,錄製了10000句方言素材,最終才有了四川話版天貓精靈,這份工作也為她帶來10多萬元的報酬。
為天貓精靈配音並不是一件輕鬆的工作。周玥偲每天早上十點開始配音,要在這樣的高強度下每天配音8個小時。周玥偲告訴記者,為智能音箱配音和為平時配音不同,需要時刻保持配音的風格和情緒恆定,一般情況下到下午四五點的時候就會非常疲憊。「多虧有其他同事的幫助,我才能堅持下來,我對整個配音的效果非常滿意。」
「四川話版天貓精靈讓每一個四川人無論身在何處,都能聽到我們的鄉音,得到一絲慰藉。」周玥偲說,自己為四川話版天貓精靈塑造了溫柔俏皮的鄰家大姐姐形象,也通過這段經歷收穫了很多,尤其是感受到人工智慧技術對配音行業的賦能。
方言交流零障礙
還能用四川話唱《驚雷》
事實上,除了天貓精靈之外,百度的小度在家、小米的小愛同學等智能音箱設備也在著手挖掘方言在AI產品上的應用,但要完全教會這隻「四川貓」掌握各種方言表達並不簡單,而天貓精靈成為首臺可完全用方言交互的智能音箱。
和人類學習語言的過程類似,要讓天貓精靈學會四川話也需要經歷「聽得清、聽得懂、學會說」三個步驟,即語音的喚醒和識別,方言的理解,方言的合成。據介紹,對於方言語音的喚醒、識別和理解,需要通過方言數據訓練完成,而方言交互交流則需要通過採集聲音模特錄製的語料素材進行合成。經過這樣幾個步驟,天貓精靈就可以聽懂並且會說任何四川話了。
不過,由於四川話博大精深,聲音模特可提供的素材僅僅是其中一部分,用小樣本幫助智能音箱達到比較好的機器學習水平是開發四川話版天貓精靈的最難點。方言版產品負責人張平告訴記者,對此,團隊在研發中主要應用了四川方言ASR語音識別技術和TTS語音合成技術這兩種技術,前者用於理解方言語言,後者則用於模仿真人口音語調。由於四川方言跨區域大,不同片區之間有口音差異,給模型訓練帶來高難度,為解決這一問題,研發團隊採用了阿里自研的語音建模技術,進行方言口音適配。
那麼,四川話版天貓精靈到底能帶來哪些新體驗?記者了解到,用戶和天貓精靈不僅可以用四川話來交流,而且,如果用四川方言來「調教」天貓精靈,這隻「四川貓」還會用四川話唱《驚雷》、用「我吃火鍋你吃火鍋底料」等段子回懟,十分有趣。未來,天貓精靈還將與四川本地服務打通,並通過四川話進行播報。
「天貓精靈將繼續加碼方言保護,並希望與各地政府的展開合作,上線各種方言版天貓精靈。」張平表示,在四川話版天貓精靈上線後,其他方言版本的天貓精靈也在籌備中,一旦時機合適將與用戶見面。
阿里巴巴天貓精靈事業部總經理庫偉表示,讓人工智慧進入家庭,需要更深入的理解用戶的家庭生活需求。天貓精靈上線方言,不僅可以滿足用戶的實際需求,也能夠讓人工智慧助手更具備『人性』,成為家庭一員。同時將繼續挖掘方言的價值,保護和傳承不會到此為止。