四川在線消息(魯文林 四川日報記者 祖明遠)整理錄音是很多文字工作者的噩夢:將錄音整理為文字,往往需要1-2倍錄音時長的時間。近日,國內首款PC端長語音識別平臺在綿陽問世——1小時的語音,只用10分鐘就能轉化為文字,而且識別率達到97%以上。而開發者的初衷居然是:為了方便整理領導講話錄音!
轉換速度快 1小時錄音只用10分鐘
1月25日,記者在綿陽市高新區創業服務中心採訪到了該產品的開發團隊。只需將手機或錄音筆上的錄音傳到電腦上,點開軟體,短短幾分鐘,錄音便能迅速轉變為文字,準確率達97%以上。據介紹,一段1小時的錄音只用了10多分鐘,便完成了翻譯,而且每句都分行顯示,方便對其進行修改校正。
為什麼速度這麼快?據開發者介紹,其秘密在於通過獨有的聲學分析模型,該軟體可以像「切片」一樣,把長段語音壓縮、分包,然後通過雲端翻譯,從而保證了語音翻譯的準確、及時、高效。
受夠了整理錄音的苦 無奈自主開發軟體
據開發團隊介紹,目前國內已有一些語音識別軟體,但都針對的是短語音。「都是類似於聊天那種,但是能將長文字快速轉換為文字的,目前還僅有我們這一款。」開發者黃博說。
黃博曾在機關事業單位工作過,去年科博會期間,整理領導、嘉賓的發言,讓他飽嘗整理錄音之苦。無奈之下,他將解決辦法投向語音識別軟體,但當時市面上的各種軟體都只能針對短語音,而且識別率偏低。
在組建了開發團隊後,用時1年才拿出產品。最初團隊也曾考慮開發手機端,但受限於硬體條件,錄音效果和文字編輯都受到很大限制,最後產品轉向PC端。「我們的目標客戶也是專業的文字工作者,例如律師、機關事業單位工作人員、記者編輯、作家等。」黃博說。
可以識別多種方言 「可玩性」很高
據介紹,目前該軟體對普通話的識別率達到97%,同時還能識別山東話、河南話、粵語等方言,市場潛力較大。
黃博計劃在春節前成立專門的公司,以進一步完善和推廣該產品,未來將不僅限於文字辦公領域,進軍語言學習、遊戲娛樂等領域。