我們還是繼續說一下百度語音合成,整體的功能上沒有問題,但是在細節上需要注意符號問題,這也是在開發過程中實際遇到的,目前主要涉及到了三個符號「、」、——。

在我們拿到文字內容時先將空格進行去除,方式如下:
//替換空行 $content = strtr($content, [" " => '']);
然後將HTML代碼進行去除,方式如下:
//去除標籤 $content = strip_tags($content);
按照現有的方式,我們可以看到純文字了,基本上滿足了大多數文章了,但是在特殊文章上遇到了問題,一篇文章中含有「、」、——時,就會出現ldquo、rdquo、mdash讀音。這是一個非常嚴重的問題,我們需要將其進行替換。方式如下:
//去除部分標點符號 $content = str_replace(['“', '”', "—"], [], $content);
這裡說一下PHP的str_replace函數。支持數組形式進行替換,但是要求查詢格式和替換格式均為數組形式。可對多個條件進行執行,目前我們知道了上面三個符號在讀音上出現問題。
後續會繼續更新百度AI語音合成文字及注意事項。