▲點擊上方 雷鋒網 關注
當你以為地圖軟體裡只有志玲姐姐的聲音時,其實它還能收錄你自己的聲音。
一名睿智的藝人,曾說過一句話:我坐過不少車,其中包括一些很糟糕的車。筆者深有體會,司機走錯路、車裡放 disco 音樂、車內吸食香菸等等等等,更有甚者,不僅配備以上槽點,手機導航語音還用著十分難聽的聲音,每當到了這個時候,筆者都想幫他換上一個動聽的聲音,例如我自己的。
相信不少司機的導航語音包,不是志玲姐,就是郭德綱,雖然好聽且有意思,但久而久之,還是難免會產生厭倦感,而百度地圖新上線的語音定製功能,不僅解決了這個問題,而且還提升了筆者對這款 app 粘度。
傳統的語音合成過程(如高德的魔獸語音包),通常需要錄製高達 1,000 句以上的話,且合成也需要十分長的時間(高德魔獸語音包的製作周期長達 3 個月),而百度地圖的語音定製,20 句話即可完成,合成時間亦非常的短。
當你將百度地圖升級至最新版時,便可以看到左上角出現一個「語音定製」的圖標,點擊之後,除了可以選擇華晨宇、秦嵐、蒙丹等明星的語音之外,在頁面的下方,你可以找到一個「錄製我的語音」的按鈕。在錄製頁面裡,根據不同用戶的屬性,你可以選擇女聲、男聲、女童聲或男童聲,以及 4 種錄製文本。
不過在開始錄製之後,你需要找到一個安靜的環境,一共有 20 句錄製文本,走完流程大概需要 5 分鐘左右,整個識別過程很順暢。
而在錄製完畢之後,語音會進入合成階段,一共需要 15-20 分鐘,而且完全在雲端進行,所以即便退出 app 也不會有任何影響,完成後,直接點擊下載即可,筆者的語音包容量為 10MB,幾乎不會佔用任何存儲空間。
但是受錄製環境、聲音特點、錄製人數等因素的影響,部分用戶的語音包製作用時,可能會有一定的延時。
下載完畢之後,你便可以聽到自己的 AI 人工智慧語音,而此時,你所需要做的事情,也就是開始導航了。當剛開始聽到導航語音,筆者確實震驚了一下,雖然它合成的並不逼真,但相似程度已經蠻 OK 的了,而且有一種撲面而來的熟悉感,形成了一種錯覺,仿佛身旁還有另外一個自己。
而且不僅是導航的時候可以使用自己的聲音,即便是在跟小度助手互動時,如詢問天氣狀況、附近有什麼美食、導航去巴黎鐵塔等等,也同樣是使用合成的語音來進行反饋而不是默認的聲音,如此一來,多了幾分親切感,也更讓筆者願意多使用這項功能,甚至是整個地圖 app。
但自己跟他人聽,是兩種完全不一樣的體驗,所以筆者也將百度地圖合成的語音給身邊的人聽,所有人的第一感覺都一樣:這確實是我的聲音。而在相似程度方面,大家表示在 50%-70% 左右。
不過筆者認為,其實這項功能,並不是給「自己」用的,因為長時間聽自己的聲音,也蠻膩的。個人認為,它更多的是讓你錄製身邊重要的人的聲音,如果你是一名丈夫,那麼可以在長年上班交通堵塞的路上,聽聽妻子的聲音;如果你是為人父母,那麼可以聽著自己小孩的聲音,除此之外,還有更多有趣的使用場景供用戶來挖掘。
再者,如果你的聲音足夠好聽,甚至可以將合成的語音發布至百度地圖平臺,供他人下載和使用,可以更好地與其它用戶進行互動,筆者瀏覽了一圈,不少人會模仿明星,或者是蠟筆小新,確實有點意思。在製作好語音包後,你還能夠將它分享給身邊同樣也在使用百度地圖的好友,無需使用他人的手機來進行,悄悄地為親朋好友換上,如此一來,也可以做當一個小驚喜。
換作在以前,在導航時聽著自己的語音播報,仿佛是一件較為遙不可及的事情,作為全球第一款支持語音定製功能的地圖 app,百度地圖便可以實現了。筆者在使用了兩天之後,百度地圖的這項功能,還是很深得我心的,整個過程耗時不到 30 分鐘,而傳統的語音合成技術通常需要錄製高達 1,000 個句子,合成時間也是非常久,之所以百度的語音定製這麼快,是因為百度採用了獨創的風格遷移技術 Meitron 模型,在音色、情感以及韻律等多個方面都有不錯的表現,屬於目前行業領先的語音合成技術。
而這也進一步地將百度地圖定位在了人工智慧地圖中,而且更重要的是,這項功能不需要你在專業的錄音棚裡進行錄製,安靜的環境即可。無論是什麼產品,易用性很重要,而整個過程下來,沒有讓筆者感受到有任何的門檻,從錄製,到使用,一氣呵成,甚是簡單。
上新!「AI投研邦」現已上線CCF GAIR 2019峰會完整視頻與各大主題專場白皮書, 包括機器人前沿專場、智能交通專場、智慧城市專場、AI晶片專場、AI金融專場、AI醫療專場、智慧教育專場等。「AI投研邦」會員們可免費觀看全年峰會視頻與研報內容,掃碼進入會員頁面了解更多,或私信助教小慕(微信:moocmm)諮詢。