一
馬上就要元宵節了,若要問這個春節過得怎麼樣,每個人體驗肯定不盡相同,評判必然也萬千。
也不祝什麼節日快樂了,只祝大家龍體(鳳體)安康,萬事如順心如意!
二
今個下午舍友電話中詢問,語音轉文字有什麼好的軟體?當時根據有限的使用經驗,快速在腦海中檢索過濾,回復是並沒有。
後面仔細又琢磨了一陣,感覺回復不太恰當,答案實則是有。
至少訊飛聽見就是這樣一款好用的語音轉文字軟體:新註冊用戶立享30分鐘免費轉換時長。對於偶爾使用體驗一次,江湖救急,基本夠用。
INSERT_IMAGE_HERE
儘管訊飛在中文語音識別領域可以稱得上行業一哥地位,但它的識別率也不敢拍胸脯打包票,達到百分之百。
能有個70~80%左右的識別準確率,再手動校正修改就很是很能接受的方案了,如果源頭錄音質量過硬的話,識別率在95%以上也是有可能的。
其實還有一款不錯的,這裡就不說了,因為它處在隨時可能被取消的狀態。
這裡主要重點談的是怎麼利用訊飛語音輸入法的語音輸入轉文字功能來長期使用、免費使用達到語音(錄音)轉文字目的。
可謂白嫖真香系列之訊飛專場。
當然光有它是不夠的,還得引進重量級外援:WO Mic - FREE microphone
外援的目的只有一個:將手機取代電腦默認麥克風設置為手機麥克風。
在展談之前先來個*拋玉引磚。
知乎上tkalpha大拿在「將PC瀏覽器、ZOOM等軟體正在播放一的音頻實時轉成文字!訊飛語音輸入法的妙用」文章中給出了現成解決方案,可行的提出了兩種實現方式。
方法一,利用大部分pc中有的Realtek集成音效卡,一番巧妙設置,使得訊飛語音輸入法的麥克風輸入就是當前音頻播放設備的輸出,實現了將Windows正在播放的音頻直接轉換為文字的功能。
該方式,筆者這沒能找到相應設置,未能奏效,可能手頭這個電腦並非作者認為中的大部分pc,貌似群主ABC也沒能成功復現。
方法二,藉助了兩個軟體來完成:VB-CABLE 和 Audio Router,作者的測試大概率是在Windows10 20H2環境中完成。
該方式,未進行嘗試,因為筆者腦海中冒出更熟悉的類似方式。儘管未加嘗試,但也算開了視野,長了見識:自個平時天天用訊飛輸入法的語音轉文字,多用於微信中不適合發語音又不想打字場合,當場說話轉文字再發微信,爾後略作修正,大大提升便利。但從未想到:原來還可以間接實現錄音或視頻中音頻轉文字功能!
沒有作不到,只有想不到。
這裡特別鳴謝下tkalpha的那篇知乎文章。
我暫時沒有知乎帳號,也就只能在文末羅列它的連結,有興趣的可以去點擊觀賞。
筆者的方法也並非是比tk的高到哪去,方法本無優劣好壞,只是不同的場景下運用不同的方法,使用順手就好。
原理類似,電腦端安裝完wo-mic及其驅動之後,在錄音設備中會新增出現WO Mic Device麥克風設備,將它設置為默認即可。手機端安裝wo-mic之後,選擇wifi或usb連線方式連接,手機就充當電腦的麥克風啦!
INSERT_IMAGE_HERE
這裡要贊一下wo-mic,它不像訊飛的跨屏輸入,切換至後臺就失效;可以靈活選擇usb線或同一wifi連接,斷連了可嘗試自動連接,適用筆記本和臺式機。
效果是妥妥的,放張測試結果圖。識別效果1段與2段分別是同一音頻,1段默認樣式,2段勾選了語音長文本模式。兩個整體效果都差不太多。實際操作中,默認狀態要更穩當。
INSERT_IMAGE_HERE
看出比tkalpha提及方案的異同了麼:他提及的是將電腦中播放中音頻分公開外放或靜消播放,爾後轉為文字,可以邊看視頻邊聽音頻邊轉文字。
而本文則是需要將需轉換的音視頻以手機端為源頭進行傳輸,邊聽或邊看再邊轉。
可能有人還會更加腦門大開:何須如此麻煩,只要將電腦中音視頻播放,在無人環境下,聲音調最大,把手機上訊飛輸入法打開,什麼第三方軟體或默認偵聽設備均省卻了,直接開始轉換過程。
筆者最開始也是這麼想的,簡單測試了下(聲音沒有調最大),識別準確率下降明顯,不了了之。而且筆者認為手機端的訊飛在監聽連續方面遠不如pc端設置開啟方便。如果電腦及手機均為裝備精良的型號款式,那這種法子倒也可以嘗試使用,精良裝備們外放、接收效果不一樣導致轉換效果也肯定不同。
知乎另一大拿Fury同樣受tkalpha那篇文章啟發,並寫了一個自動轉錄視頻語音的quicker動作,完成了"打開firefox瀏覽器-打開訊飛語記-開始錄音"的自動化過程,大概思路其自述為:
用訊飛語記(同為訊飛旗下產品)捕獲的系統音源之外的另外一條音源,然後把瀏覽器的輸出也設置為同一條音源,開著視頻,訊飛語記就能記了,這樣的好處也明顯:使用者在轉換的同時還可以幹其他的事,再開另外一個視頻外放聲音也不幹擾。
Fury甚至還設想,白天收集一個要看的視頻列表, 半夜掛在電腦上讓訊飛語記識別,後面再去看它的文字稿。經他測試,視頻按1.5倍速播放,識別效果也都還不錯,可能識別精度沒有訊飛輸入法高。但訊飛語記不像訊飛輸入法要佔著滑鼠光標,能夠完全後臺進行識別。雖然它的長文本識別是VIP功能,但是某寶有省錢偏方。
這裡未經別人許可放一張圖:
絕了,真是個個人才!
筆者暫時未有這個上視頻課或視音頻轉文字的剛需,也未去驗證。擱在這裡,萬一哪天需要用上了呢,以備萬一之需。
當然各位也不能高興太早,標題雖然寫著白嫖訊飛,但訊飛它也不傻,也不會坐視讓使用者們白嫖到底。
用訊飛輸入法的在線語音實時轉換識別功能,如Fury所言,大概識別個一兩分鐘就會出現網絡故障從而中斷識別。都推測是訊飛在識別接口端做了時長限制,所以不能進行連續長時間無人值守的自動識別。
對訊飛語記能否作到,不太清楚。手機上安裝它只是為了在其他app上調用它為語音引擎。對於它的實時轉寫功能,久有耳聞,未曾試過。
訊飛聽見,訊飛語記,飛輸入法語音懸浮窗,都是訊飛家的拳頭產品。
中文語(錄)音實時轉寫過程中,真的是很難繞開訊飛。
參考資料
訊飛聽見-專業在線語音錄音轉文字軟體平臺|音頻錄音整理翻譯
將PC瀏覽器、ZOOM等軟體正在播放的音頻實時轉成文字!訊飛語音輸入法的妙用 - 知乎
WO Mic - FREE microphone