綿陽創客開發長語音識別平臺 1小時語音10分鐘轉化為文字

2021-01-12 四川在線

四川在線消息(魯文林 四川日報記者 祖明遠)整理錄音是很多文字工作者的噩夢:將錄音整理為文字,往往需要1-2倍錄音時長的時間。近日,國內首款PC端長語音識別平臺在綿陽問世——1小時的語音,只用10分鐘就能轉化為文字,而且識別率達到97%以上。而開發者的初衷居然是:為了方便整理領導講話錄音!

轉換速度快 1小時錄音只用10分鐘

1月25日,記者在綿陽市高新區創業服務中心採訪到了該產品的開發團隊。只需將手機或錄音筆上的錄音傳到電腦上,點開軟體,短短幾分鐘,錄音便能迅速轉變為文字,準確率達97%以上。據介紹,一段1小時的錄音只用了10多分鐘,便完成了翻譯,而且每句都分行顯示,方便對其進行修改校正。

為什麼速度這麼快?據開發者介紹,其秘密在於通過獨有的聲學分析模型,該軟體可以像「切片」一樣,把長段語音壓縮、分包,然後通過雲端翻譯,從而保證了語音翻譯的準確、及時、高效。

受夠了整理錄音的苦 無奈自主開發軟體

據開發團隊介紹,目前國內已有一些語音識別軟體,但都針對的是短語音。「都是類似於聊天那種,但是能將長文字快速轉換為文字的,目前還僅有我們這一款。」開發者黃博說。

黃博曾在機關事業單位工作過,去年科博會期間,整理領導、嘉賓的發言,讓他飽嘗整理錄音之苦。無奈之下,他將解決辦法投向語音識別軟體,但當時市面上的各種軟體都只能針對短語音,而且識別率偏低。

在組建了開發團隊後,用時1年才拿出產品。最初團隊也曾考慮開發手機端,但受限於硬體條件,錄音效果和文字編輯都受到很大限制,最後產品轉向PC端。「我們的目標客戶也是專業的文字工作者,例如律師、機關事業單位工作人員、記者編輯、作家等。」黃博說。

可以識別多種方言 「可玩性」很高

據介紹,目前該軟體對普通話的識別率達到97%,同時還能識別山東話、河南話、粵語等方言,市場潛力較大。

黃博計劃在春節前成立專門的公司,以進一步完善和推廣該產品,未來將不僅限於文字辦公領域,進軍語言學習、遊戲娛樂等領域。

相關焦點

  • 來往4.3 推出語音轉文字功能識別率及使用場景勝微信
    來往官方透露,4.3版來往將接入目前國內最先進的語音轉文字的功能,不但在聊天時可以將語音轉為文字發出,還可以把朋友發來的語音信息轉化為文字信息。同時該版本還支持在發布個人動態信息時,將語音轉化為文字輸入的功能。目前,來往4.3安卓版已經登陸各大應用市場,iOS版也已經提交蘋果APP STORE審核,即將上線更新。
  • 馳聲AI語音開放平臺上線,首次公開中英文智能語音評測開發文檔
    日前,馳聲AI語音開放平臺正式上線,產品經理和開發者只需點擊馳聲官網頂部右側「馳聲AI開放平臺」的白色按鈕,即可查看《馳聲智能語音評測開發文檔》,該文檔中包含SDK/API和內核接口使用說明。▲馳聲官網新增「馳聲AI開放平臺」入口可查看語音評測開發文檔在馳聲AI語音開放平臺上,您將能獲取到以下知識和信息——1.
  • 谷歌開源Live Transcribe語音識別轉文字工具
    中關村在線消息:谷歌在其開源博客中宣布開源 Android語音識別轉錄工具——Live Transcribe的語音引擎,它可以將語音或對話實時轉錄為文字,還能夠為聽障人士提供幫助。谷歌開源Live Transcribe語音識別轉文字工具Live Transcribe 是谷歌於今年2月推出的一款Android應用程式,它的語音識別由谷歌最先進的Cloud Speech API提供。但是,依賴於雲引入了一些複雜性,不斷變化的網絡連接、數據成本和延遲等等都帶來一些考驗。因此,谷歌把它開源出來,希望開發人員在已有的基礎上進一步構建和開發。
  • 語音轉文字的方法有哪些?用提詞器能將文字提取出來嗎?
    想要將語音轉化成文字,最傳統的做法一句一句的聽,然後一句一句的手寫記錄下來,不僅浪費時間,效率還非常低!隨著各大手機功能的不斷提升,逐漸有了自動識別的功能,還有後來的微信,語音轉文字軟體等等,具體如何實現,一起來看看吧!
  • 將語音轉化成文字,這簡直是會議聽課必備神器啊
    支持高清錄音實時同步,並免費轉成文本文稿(這完全不同於傳統錄音轉文字需要收費的情況),同時可以針對文稿進行二次編輯,並微信分享出去~且轉寫快、翻譯準,準確率高達95%(標準普通話錄音轉寫效果最佳,每分鐘最快可以識別400字,就算略帶口音也能輕鬆識別)。。。
  • 拒絕瘋狂長語音轟炸!訊飛輸入法語音轉文字秒變工作達人
    拒絕瘋狂長語音轟炸!  那麼,首先看看愛發語音的人是怎麼想的?「方便呀,按下語音按鈕,噼裡啪啦開說,手一松就發出去,多方便。」「看我多好,把事情來龍去脈都跟你說個清楚。」「看,我1分鐘說了多少事。要是打字,需要打很久。」
  • ASRT:一個中文語音識別系統
    本項目聲學模型通過採用卷積神經網絡(CNN)和連接性時序分類(CTC)方法,使用大量中文語音數據集進行訓練,將聲音轉錄為中文拼音,並通過語言模型,將拼音序列轉換為中文文本。算法模型在測試集上已經獲得了80%的正確率。基於該模型,在Windows平臺上實現了一個基於ASRT的語音識別應用軟體,取得了較好應用效果。
  • 語音轉文字怎麼實現?如何在線語音轉文字
    語音轉文字怎麼實現?如何在線語音轉文字 2019年06月03日 17:35作者:黃頁編輯:黃頁 語音轉文字怎麼實現?如何在線語音轉文字?
  • 語音錄音轉文字
    語音錄音轉文字 生活工具 大小: 21.28M 版本: 1.0.5
  • 文字轉語音助手怎麼實現轉換?教你用手機語音識別軟體處理
    文字轉語音助手也就是能夠把文本信息轉換成語音內容的工具,當我們開直播由於各種原因不便於說話時就可以藉助文字轉語音助手把想要講的內容以文字的信息將其轉換成語音。這種轉換方式其實可以歸納到語音識別處理一類中,而我們常用的錄音轉文字助手就是這樣的一種工具。
  • Google AIY Voice Kit 套件 人工智慧語音識別
    其目標是讓每個Maker(創客)都能DIY自己的 AI 人工智慧產品,讓更多人能學習、探索並體驗人工智慧。目前該項目已經成功發布了兩款產品:voice kit 人工智慧語音識別開發套件,vision kit 人工智慧圖像識別開發套件,我們今天就先介紹
  • 文字語音技能:如何將英文語音轉換成TXT文檔
    平時我們想要在電腦上將語音轉換成文字的時候,大家都是怎麼操作的呢?平日裡我們難免會有犯懶的時候,手指不想動不願意打字只想動動嘴發語音,但如果與對方關係並沒有鐵到可以不顧禮貌動不動發語音的情況啊,這時候我們可能就會想到轉換。
  • 當鍵盤能聽懂人話,咪鼠語音鍵盤KB1評測:語音打字+實時翻譯
    這兩者相信不需要再做過多介紹,咪鼠智能語音鍵盤KB1內置了300mAh電池,按照每天使用8小時的時間計算,單次充滿可滿足一周使用;2.4G接收器算是目前比較好的解決方案,無需驅動便能在Windows、macOS等系統上使用。咪鼠智能語音鍵盤KB1是以106鍵全尺寸鍵盤為原型進行的設計,所以整體風格非常簡潔傳統的106鍵鍵盤,採用了極簡設計風。
  • 專門給英國人開發!載著英式口音和笑話的 BBC 語音助手來了
    如果你希望聽到BBC特定廣播電臺,播客或節目,你可以說「OK Beeb,播放Radio 1」。如其他語音助手一樣,操作簡單方便。除了基本功過關外,這款語音識別工具區別於同類型產品的最大亮點是[口音識別率]大幅度提升。BBC發言人表示:「我們知道當語音助手不了解您時會令人沮喪。 對我們來說,Beeb將為英國的每個人服務,我們會努力確保它可以識地區性口音並準確地理解您所說的內容,無論您來自英國的哪個國家。」
  • 專門給英國人開發!載著英式口音和笑話的BBC語音助手來了
    如果你希望聽到BBC特定廣播電臺,播客或節目,你可以說「OK Beeb,播放Radio 1」。如其他語音助手一樣,操作簡單方便。除了基本功過關外,這款語音識別工具區別於同類型產品的最大亮點是[口音識別率]大幅度提升。BBC發言人表示:「我們知道當語音助手不了解您時會令人沮喪。 對我們來說,Beeb將為英國的每個人服務,我們會努力確保它可以識地區性口音並準確地理解您所說的內容,無論您來自英國的哪個國家。」
  • 不僅可視,也讓語音識別更快更有效——全志R系列智能語音專用處理器
    智能語音識別趨勢 — 近期,亞馬遜發布了幾款全新的Echo,新Echo可以更快地處理Alexa請求,同時還有一款配備了10.1英寸的顯示屏。
  • 這款文字轉語音工具,不僅轉換中文,還可以識別英文
    在雲計算、大數據、深度神經網絡等技術的加持下,語音識別行業取得了長足的進步發展,文字轉語音具有廣闊前景的市場。標貝悅讀就是一款備受用戶喜愛的文字轉語音工具,無需下載,在線就能編輯,成為語音識別領域的一匹黑馬。
  • 小米的語音助手小愛同學為什麼能夠脫穎而出
    小米的語音助手小愛同學為什麼能夠脫穎而出?目前,在國內主流安卓手機廠商中,小米的語音助手小愛同學做的是比較好的,我認為原因有以下兩個主要方面。第一,重視的程度,小米早在14年就開始了IOT布局,現在已經成為全球最大的消費級IOT平臺,相比其他國內手機廠商,起步比較早,在這裡不得不佩服雷軍的眼光。
  • 【文字轉語音】朗讀女
    今天小編為大家帶來一款軟體——朗讀女朗讀女是一款由在線語音合成和離線語音合成組成的語音朗讀軟體。使用朗讀女你可以放鬆眼睛,只用耳朵進行閱讀,朗讀女可朗讀任意文獻,只要你將文字存儲成文檔保存下來,就可以順利朗讀。需要的朋友快來下載吧。為什麼推薦?  朗讀女是一款簡單、免費的語音朗讀軟體。朗讀女軟體可用來聽網絡小說、學外語、讀新聞、校對文章、製作小說音頻等。
  • 眸事發布MOBOT智能語音應用,打造新一代教育營銷型AI SaaS平臺
    這一耗時9個月才最終完成開發和測試的AI語音產品,除了具備快速穩定的技術優勢之外,最大的亮點莫過於成熟多樣的智能營銷模型以及自動化的數據處理能力:只需通過簡單操作,即可輕鬆創建品牌自有的營銷互動方案,使其獲得更專業的數據轉化能力。