如何使用Python將語音轉換為文本

2020-09-03 Python智禪

語音識別是計算機軟體識別口語中的單詞和短語,並將其轉換為可讀文本的能力。那麼如何在 Python 中將語音轉換為文本?如何使用 SpeechRecognition 庫在 Python 中將語音轉換為文本?我們不需要從頭開始構建任何機器學習模型,該庫為我們提供了各種著名的公共語音識別 API 的便捷包裝。

使用 pip 安裝庫:

pip3 install SpeechRecognition

Okey,打開一個新的 Python 文件並導入它:

import speech_recognition as sr

從文件讀取

確保當前目錄中有一個包含英語語音的音頻文件 (如果您想跟我一起學習,請在此處獲取音頻文件):

filename = 「speech.wav」

該文件是從 LibriSpeech 數據集中獲取的,但是您可以帶上任何想要的東西,只需更改文件名,就可以初始化語音識別器:

open the filewith sr.AudioFile(filename) as source:www.zpedu.com/

recognize (convert from speech to text)

text = r.recognize_google(audio_data)

print(text)

這需要幾秒鐘才能完成,因為它將文件上傳到 Google 並獲取了輸出,這是我的結果:

I believe you’re just talking nonsense

從麥克風讀取

這需要在您的計算機中安裝 PyAudio,以下是取決於您的作業系統的安裝過程:

視窗

您可以點安裝它:

pip3 install pyaudio

的 Linux

您需要首先安裝依賴項:

sudo apt-get install python-pyaudio python3-pyaudio

pip3 install pyaudio

蘋果系統

您需要先安裝 portaudio,然後才可以點安裝它:

brew install portaudio

pip3 install pyaudio

現在,讓我們使用麥克風轉換語音:

with sr.Microphone() as source:

convert speech to text

text = r.recognize_google(audio_data)

print(text)

這會從您的麥克風聽到 5 秒鐘,然後嘗試將該語音轉換為文本!

它與先前的代碼非常相似,但是我們在這裡使用 Microphone () 對象從默認麥克風讀取音頻,然後在 record () 函數中使用 duration 參數在 5 秒後停止讀取,然後上傳音頻數據向 Google 獲取輸出文本。

您還可以在 record () 函數中使用 offset 參數在偏移幾秒鐘後開始記錄。

另外,您可以通過將語言參數傳遞給 accept_google () 函數來識別不同的語言。例如,如果您想識別西班牙語語音,則可以使用:

text = r.recognize_google(audio_data, language=」es-ES」)


最後,小編想說:我是一名python開發工程師,

整理了一套最新的python系統學習教程,

想要這些資料的可以關注私信小編「01」即可(免費分享哦)希望能對你有所幫助

相關焦點

  • 如何在Python中將語音轉換為文本
    語音識別是計算機軟體識別口語中的單詞和短語並將其轉換為人類可讀文本的能力。在本教程中,你將知道如何使用SpeechRecognition 庫在Python中將語音轉換為文本 。Recognition將語音轉換為文本:# open the filewith sr.AudioFile(filename) as source: # listen for the data (load audio to memory) audio_data = r.record
  • 用 Python 將音頻內容轉換為文本格式
    轉換成文字後,便可以將其用於進一步分析或用作其他功能。在本教程中,我們將使用稱為AssemblyAI(https://www.assemblyai.com/)的高精度語音轉文本Web API從MP3錄音中提取文本(也支持許多其他格式)。
  • 用Python將音頻內容轉換為文本格式,方言可以嗎?
    轉換成文字後,便可以將其用於進一步分析或用作其他功能。在本教程中,我們將使用稱為AssemblyAI(https://www.assemblyai.com/)的高精度語音轉文本Web API從MP3錄音中提取文本(也支持許多其他格式)。
  • Google的最新技術可以將電話語音轉換為文本
    打開APP Google的最新技術可以將電話語音轉換為文本 山東信息網 發表於 2019-11-18 08:45:40 (文章來源
  • 如何將語音文件轉換為文字?這5款軟體輕鬆做到!
    在我們日常學習和日常工作中,有時會遇到將一段語音文件轉換為文字的情況。尤其是會議記錄,上面在侃侃而談,下面在奮筆疾書。小編就常常需要奮筆疾書記錄會議內容,然後在用手將會議記錄製作成電子版。後來聽說將語音文件其實是可以轉換為文字的,不用那麼麻煩,自己去錄入。
  • 使用Python將圖像轉換為ASCII Art(詞雲可視化)
    :ASCII,縮寫為「美國信息交換標準代碼」。ASCII是電子通信的字符編碼標準。ASCII碼表示計算機,電信設備和其他設備中的文本。使用的模塊:pywhatkit模塊:PyWhatKit是具有各種有用功能的Python庫。這是一個易於使用的庫,不需要您進行一些其他設置。該模塊還具有許多其他很酷的功能。
  • Python實現自動化語音轉文本,徹底解放你的雙手
    轉換成文字後,便可以將其用於進一步分析或用作其他功能。我們將使用稱為AssemblyAI(https://www.assemblyai.com/)的高精度語音轉文本Web API從MP3錄音中提取文本(也支持許多其他格式)。
  • 如何將Word文本轉換為Excel
    有時您需要將Word文檔轉換為Excel工作表。 您不必複製每條信息,然後將其粘貼到Excel工作表中。將word文本轉為excel表格,可能很多小夥伴都沒有聽說過,因為我們工作中所接觸的文件轉化比較多的,基本都是PDF文件轉word,excel等office文件,哪在意過啥word文本轉excel表格呢。所以,第一次被上司要求將word文本轉為excel表格,一臉懵是很正常的。但是,觀看到本篇文章的小夥伴,可以避免發生蒙圈的情況,因為,接下來,小編將分享關於word文本轉excel表格的操作步驟。
  • 基於python將音頻文件轉化為文本輸出
    實驗目的:學習利用python進行音頻轉文本文件實驗環境:已正確安裝python3.51、需要安裝的第三方庫(1)安裝speechrecognition>speechrecognition集合了幾個語音識別庫的接口,非常的實用,本節主要用到能脫網工作的識別方法recognize_sphinx(),該方法會依賴pocketsphinx庫。
  • 如何使用 Python 實現網頁自動化朗讀?
    網頁轉換成語音,步驟無外乎:網頁正文識別,獲取到正文的文本內容;文本轉語音,通過接口將文本轉換成語音文件;語音文件的發聲,即將語音文件讀出;網頁正文識別之所以用 Python,就是因為 Python 有著豐富的庫,網頁正文識別也不在話下。這裡我嘗試了 readability、goose3。
  • python小應用 利用python做一個文本文件轉化為音頻的小工具
    實驗環境:已正確安裝python3.51、安裝文本轉語音模塊(1)安裝pyttsx3模塊該模塊應用於文本轉語音(2)安裝了pywin32模塊>文本轉語音模塊依賴pywin32模塊2、文本轉語音實例例子:將語音字符串轉化為語音播放完整代碼:# -*- coding: utf-8 -*-#!
  • 怎麼使用閃電文字語音轉換軟體將語音轉換成文字
    要是錄製的音頻並不長還好說,但是如果錄製的很長,那我們還需要將它們一邊聽一邊手動記下來,然後再重頭整理一遍,刪去一些累贅,修飾一下文本,幾番操作下來,費時費力。但其實我們完全不必如此辛苦,因為我們有更快速更簡單的高效方法,什麼方法?
  • Python文本預處理:步驟、使用工具及示例
    標籤:機器學習 Python 算法 模型 本文將討論文本預處理的基本步驟,旨在將文本信息從人類語言轉換為機器可讀格式以便用於後續處理。此外,本文還將進一步討論文本預處理過程所需要的工具。當拿到一個文本後,首先從文本正則化(text normalization) 處理開始。
  • [圖]谷歌推「同聲傳譯」系統Translatotron:語音翻譯無需文本轉換
    谷歌AI官方博客最新博文中向我們介紹了一項實驗性質的新系統--Translatotron,它能夠直接將語音翻譯成為語音,中間不再需要任何文本
  • 前端漫談:使用Python朗讀文本
    今天來分享一段使用python來朗讀一段文本。不說廢話了,直接乾貨。'''engine.say(read)engine.runAndWait()使用的是第三方庫:pyttsx3。專門用來朗讀Python文本的庫。
  • word如何將文本轉換成表格?
    步驟一、整理需要轉換成表格的文本信息,注意我們在輸出文本時,需要使用統一的符號對每個單元格的內容進行隔斷。整理需要轉為表格的文本內容步驟二、全部選中需要轉換成表格的文本信息,滑鼠點擊導航欄的「插入」,然後點擊「表格
  • 如何使用Python創建AI虛擬助手
    介紹虛擬助手(也稱為AI助手或數字助手)是一種應用程式,可以理解自然語言的語音命令並為用戶完成任務。助手生成的響應將顯示在控制臺上,或者通過揚聲器顯示為語音。2.代碼說明-因此,讓我們創建自己的虛擬助手。筆記-所有代碼都可以在我的GitHub上找到。我的頻道上還提供了演示YouTube視頻和代碼YouTube視頻。
  • 如何將文字轉換為語音?其實沒你想像的那麼難,用它就搞定!
    那麼開始主要的話題,如何將文字轉換為語音?工具電腦,需要轉換為語音的文欄位落。第一步小編電腦上就有將文字轉換為語音的軟體,所以就以這款【風雲語音文字轉換器】軟體為例子。在網頁上搜索下載軟體,安裝在電腦上。第二步將軟體安裝在電腦上後,雙擊打開軟體。
  • 文字語音技能:如何將英文語音轉換成TXT文檔
    平時我們想要在電腦上將語音轉換成文字的時候,大家都是怎麼操作的呢?平日裡我們難免會有犯懶的時候,手指不想動不願意打字只想動動嘴發語音,但如果與對方關係並沒有鐵到可以不顧禮貌動不動發語音的情況啊,這時候我們可能就會想到轉換。
  • 文字如何轉換為語音?這四種方法,你可千萬別錯過!
    第一款:Text Speaker Text Speaker這款軟體可以很逼真的將文本轉換為語音,可以調節轉換後的語音的語速,音調以及噪音。