Python的speech_recognition库如何将声音转为文字

 更新时间:2023年05月19日 10:10:36   作者:空空star  
这篇文章主要介绍了通过Python的speech_recognition库将声音转为文字,将声音转为文字,除了speech_recognition库,还要依赖pyaudio库,而且mac用户需要安装PortAudio,本文给大家介绍的非常详细,需要的朋友可以参考下

前言

本篇给大家分享一下通过Python的speech_recognition库将声音转为文字。
之前已经介绍了将音频文件转为文字,只依赖speech_recognition库,本篇将声音转为文字,除了speech_recognition库,还要依赖pyaudio库,而且mac用户需要安装PortAudio

Python-语音转文字相关库介绍 可见文末详细介绍

一、PortAudio

1.PortAudio是什么?

PortAudio是一种跨平台的音频I/O库,用于实现音频输入和输出功能。它提供了一种简单、一致的跨平台API,可以让开发者在不同操作系统上编写音频应用程序,如音频录制和播放器。PortAudio支持多种音频设备,包括音频接口、音频文件、网络流等,并且可以在各种操作系统上使用,如Windows、Mac OS X、Linux、Unix等。同时,PortAudio还提供了一些高级特性,如流控制、同步、缓冲管理、音频格式转换等。

2.安装PortAudio

macOS下:

brew install portaudio  

二、使用方法

1.引入库

import speech_recognition as sr

2.创建一个Recognizer对象

r = sr.Recognizer()

3.使用麦克风录音,从麦克风录制音频

# 使用麦克风录音
with sr.Microphone() as source:
    print("请说话...")
    # 从麦克风录制音频
    audio = r.listen(source)
    print("录音结束")

4.将音频转换为文字

try:
    # 将音频转换为文字
    text = r.recognize_google(audio, language='zh-CN')
    print("你说的是:", text)
except sr.UnknownValueError:
    print("Google Speech Recognition could not understand audio")
except sr.RequestError as e:
    print("Could not request results from Google Speech Recognition service; {0}".format(e))

5.转换结果

声音:深度神经网络模型部署

请说话...
录音结束
你说的是: 深度神经网络模型部署

Process finished with exit code 0

Python-语音转文字相关库介绍

一、speech_recognition库是什么?

Python的speech_recognition库是一个用于语音识别的Python包,它可以使Python程序能够识别和翻译来自麦克风、音频文件或网络流的语音。它支持多种语音识别引擎,包括Google Speech Recognition、CMU Sphinx、Microsoft Bing Voice Recognition等,可以根据需要选择不同的引擎进行语音识别。
使用speech_recognition库进行语音识别非常简单,只需要导入该库并创建一个Recognizer对象,然后调用该对象的recognize_*()方法即可。例如,调用recognize_google()方法可以使用Google Speech Recognition引擎进行语音识别。

二、安装speech_recognition库

pip install SpeechRecognition

三、查看speech_recognition版本

 pip show SpeechRecognition

Name: SpeechRecognition
Version: 3.10.0
Summary: Library for performing speech recognition, with support for several engines and APIs, online and offline.
Home-page: https://github.com/Uberi/speech_recognition#readme
Author: Anthony Zhang (Uberi)
Author-email: azhang9@gmail.com
License: BSD
Requires: requests
Required-by:

四、pyaudio库是什么?

Pyaudio是Python语言的一个音频处理库,可以用来录制音频、播放音频、读取音频文件等。它是一个跨平台的库,可以在Windows、Mac、Linux等多个操作系统上使用。Pyaudio库是基于PortAudio C库开发的,PortAudio是一个跨平台的音频处理库,Pyaudio库可以方便的使用PortAudio库的功能。

五、安装pyaudio库

pip install pyaudio

六、查看pyaudio版本

pip show pyaudio

Name: PyAudio
Version: 0.2.13
Summary: Cross-platform audio I/O with PortAudio
Home-page: https://people.csail.mit.edu/hubert/pyaudio/
Author: Hubert Pham
Author-email:
License: MIT
Requires:
Required-by:

到此这篇关于通过Python的speech_recognition库将声音转为文字的文章就介绍到这了,更多相关Python声音转为文字内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Python封装解构以及丢弃变量

    Python封装解构以及丢弃变量

    这篇文章主要介绍了Python封装解构以及丢弃变量,文章围绕主题展开详细的内容介绍,具有一定的参考价值,需要的朋友可以参考一下
    2022-09-09
  • Python使用Pandas处理测试数据的方法

    Python使用Pandas处理测试数据的方法

    Pandas是一个功能极其强大的数据分析库,可以高效地操作各种数据集,这篇文章主要介绍了Python自动化测试-使用Pandas来高效处理测试数据,需要的朋友可以参考下
    2023-02-02
  • python with语句的原理与用法详解

    python with语句的原理与用法详解

    这篇文章主要介绍了python with语句的原理与用法,结合实例形式详细分析了python with语句基本概念、原理、用法及操作注意事项,需要的朋友可以参考下
    2020-03-03
  • Python类的基础入门知识

    Python类的基础入门知识

    关于类的定义
    2008-11-11
  • Django如何开发简单的查询接口详解

    Django如何开发简单的查询接口详解

    这篇文章主要给大家介绍了使用Django如何开发简单的查询接口的相关资料,文中通过示例代码介绍的非常详细,对大家学习或者使用Django具有一定的参考学习价值,需要的朋友们下面来一起学习学习吧
    2019-05-05
  • Python人工智能深度学习RNN模型结构流程

    Python人工智能深度学习RNN模型结构流程

    这篇文章主要为大家介绍了Python人工智能深度学习RNN的模型流程结构,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步
    2021-11-11
  • python中异常捕获方法详解

    python中异常捕获方法详解

    异常信息的获取对于程序的调试非常重要,可以有助于快速定位有错误程序语句的位置。下面介绍几种python中获取异常信息的方法,希望小伙伴们能够喜欢
    2017-03-03
  • 跟老齐学Python之关于循环的小伎俩

    跟老齐学Python之关于循环的小伎俩

    不管是while还是for,所发起的循环,在python编程中是经常被用到的。特别是for,一般认为,它要比while快,而且也容易写(是否容易,可能因人而异,但是,执行时间快,是的确的),因此在实践中,for用的比较多点。
    2014-10-10
  • Django REST framework 单元测试实例解析

    Django REST framework 单元测试实例解析

    这篇文章主要介绍了Django REST framework 单元测试实例解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-11-11
  • Python中Markdown库的使用示例详解

    Python中Markdown库的使用示例详解

    Markdown 库是一个用于处理 Markdown 文本的 Python 工具,这篇文章主要为大家详细介绍了Markdown 库的具体使用,感兴趣的小伙伴可以了解下
    2025-02-02

最新评论