使用Python将语音转换为文本的方法

更新时间：2020年08月10日 09:41:58 作者：Q:458831279

这篇文章主要介绍了如何使用Python将语音转换为文本,本文给大家介绍的非常详细，对大家的学习或工作具有一定的参考借鉴价值，需要的朋友可以参考下

语音识别是计算机软件识别口语中的单词和短语，并将其转换为可读文本的能力。那么如何在 Python 中将语音转换为文本？如何使用 SpeechRecognition 库在 Python 中将语音转换为文本？我们不需要从头开始构建任何机器学习模型，该库为我们提供了各种著名的公共语音识别 API 的便捷包装。

使用 pip 安装库：

pip3 install SpeechRecognition

Okey，打开一个新的 Python 文件并导入它：

import speech_recognition as sr

从文件读取

确保当前目录中有一个包含英语语音的音频文件 (如果您想跟我一起学习，请在此处获取音频文件)：

filename = “speech.wav”

该文件是从 LibriSpeech 数据集中获取的，但是您可以带上任何想要的东西，只需更改文件名，就可以初始化语音识别器：

# initialize the recognizer

r = sr.Recognizer()

以下代码负责加载音频文件，并使用 Google Speech Recognition 将语音转换为文本：

# open the filewith sr.AudioFile(filename) as source:www.zpedu.com/

# listen for the data (load audio to memory)

audio_data = r.record(source)

# recognize (convert from speech to text)

text = r.recognize_google(audio_data)

print(text)

这需要几秒钟才能完成，因为它将文件上传到 Google 并获取了输出，这是我的结果：

I believe you're just talking nonsense

从麦克风读取

这需要在您的计算机中安装 PyAudio，以下是取决于您的操作系统的安装过程：

视窗

您可以点安装它：

pip3 install pyaudio

的 Linux

您需要首先安装依赖项：

sudo apt-get install python-pyaudio python3-pyaudio

pip3 install pyaudio

苹果系统

您需要先安装 portaudio，然后才可以点安装它：

brew install portaudio

pip3 install pyaudio

现在，让我们使用麦克风转换语音：

with sr.Microphone() as source:

# read the audio data from the default microphone

audio_data = r.record(source, duration=5)

print(“Recognizing…”)

# convert speech to text

text = r.recognize_google(audio_data)

print(text)

这会从您的麦克风听到 5 秒钟，然后尝试将该语音转换为文本！

它与先前的代码非常相似，但是我们在这里使用 Microphone () 对象从默认麦克风读取音频，然后在 record () 函数中使用 duration 参数在 5 秒后停止读取，然后上传音频数据向 Google 获取输出文本。

您还可以在 record () 函数中使用 offset 参数在偏移几秒钟后开始记录。

另外，您可以通过将语言参数传递给 accept_google () 函数来识别不同的语言。例如，如果您想识别西班牙语语音，则可以使用：

text = r.recognize_google(audio_data, language=”es-ES”)

总结

到此这篇关于使用Python将语音转换为文本的方法的文章就介绍到这了,更多相关python语音转换文本内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

您可能感兴趣的文章:

Python中random模块常用方法的使用教程
这篇文章主要给大家介绍了关于Python中random模块常用方法的使用教程，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2020-10-10
Python图像运算之图像阈值化处理详解
这篇文章将详细讲解图像阈值化处理，涉及阈值化处理、固定阈值化处理和自适应阈值化处理，这是图像边缘检测或图像增强等处理的基础，感兴趣的可以了解一下
2022-04-04
Python写代码的七条重要技巧介绍
大家好，本篇文章主要讲的是Python写代码的七条重要技巧介绍，感兴趣的同学赶快来看一看吧，对你有帮助的话记得收藏一下，方便下次浏览
2021-12-12
pygraphviz安装教程
Graphviz 是一款由 AT&T Research 和 Lucent Bell 实验室开源的可视化图形工具，可以很方便的用来绘制结构化的图形网络，支持多种格式输出，这篇文章主要介绍了pygraphviz安装教程,需要的朋友可以参考下
2023-02-02
python怎么判断素数
在本篇文章里小编给大家整理了关于python判断素数的方法和代码，需要的朋友们可以学习下。
2020-07-07
Python7个爬虫小案例详解(附源码)中篇
这篇文章主要介绍了Python7个爬虫小案例详解（附源码）中篇，本文章内容详细，通过案例可以更好的理解爬虫的相关知识，七个例子分为了三部分，本次为中篇，共有二道题，需要的朋友可以参考下
2023-01-01
Python Numpy教程之排序,搜索和计数详解
这篇文章主要为大家详细介绍了Python NumPy中排序,搜索和计数的实现，文中的示例代码讲解详细，对我们学习Python有一定帮助，需要的可以参考一下
2022-08-08
python进阶之多线程对同一个全局变量的处理方法
今天小编就为大家分享一篇python进阶之多线程对同一个全局变量的处理方法，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2018-11-11
django框架模型层功能、组成与用法分析
这篇文章主要介绍了django框架模型层功能、组成与用法,结合实例形式简单分析了Django框架中模型层的基本概念、原理、常用组件构成与相关操作技巧,需要的朋友可以参考下
2019-07-07
Tensorflow 多线程设置方式
今天小编就为大家分享一篇Tensorflow 多线程设置方式，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2020-02-02

使用Python将语音转换为文本的方法

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

常用在线小工具