python pyaudio音频录制的实现

 更新时间:2023年05月06日 14:22:32   作者:假装我不帅  
这篇文章主要介绍了python pyaudio音频录制的实现方式,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教

python pyaudio音频录制

安装所需要的包

pip install pyaudio

监听麦克风

import pyaudio
import wave
def luyin():
    # 实例化一个对象
    pa = pyaudio.PyAudio()
    # 打开声卡,设置 采样深度为16位、声道数为2、采样率为16、输入、采样点缓存数量为2048
    stream = pa.open(format=pyaudio.paInt16, channels=2, rate=16000, input=True, frames_per_buffer=2048)
    # 新建一个列表,用来存储采样到的数据
    record_buf = []
    # 然后就通过声卡循环采用,采样到一定数据后即可停止采样
    count = 0
    while count < 8 * 5:
        audio_data = stream.read(2048)  # 读出声卡缓冲区的音频数据
        record_buf.append(audio_data)  # 将读出的音频数据追加到record_buf列表
        count += 1
        print('*')
    stream.stop_stream()
    stream.close()
    pa.terminate()
    wf = wave.open('02.wav', 'wb')          # 创建一个音频文件,名字为“01.wav"
    wf.setnchannels(2)                      # 设置声道数为2
    wf.setsampwidth(2)                      # 设置采样深度为
    wf.setframerate(16000)                  # 设置采样率为16000
    # 将数据写入创建的音频文件
    wf.writeframes("".encode().join(record_buf))
    # 写完后将文件关闭
    wf.close()
if __name__ == '__main__':
    luyin()

插入麦克风

录制启用麦克风

监听系统声音

要求

  • 系统不能静音,需要插入耳机
  • 设置录制为立体混声

编写代码

import os
import pyaudio
import threading
import wave
import time
from datetime import datetime
# 需要系统打开立体声混音
# 录音类
class Recorder():
    def __init__(self, chunk=1024, channels=2, rate=44100):
        self.CHUNK = chunk
        self.FORMAT = pyaudio.paInt16
        self.CHANNELS = channels
        self.RATE = rate
        self._running = True
        self._frames = []
    # 获取内录设备序号,在windows操作系统上测试通过,hostAPI = 0 表明是MME设备
    def findInternalRecordingDevice(self, p):
        # 要找查的设备名称中的关键字
        target = '立体声混音'
        # 逐一查找声音设备
        for i in range(p.get_device_count()):
            devInfo = p.get_device_info_by_index(i)
            # print(devInfo)
            if devInfo['name'].find(target) >= 0:  # and devInfo['hostApi'] == 0:
                # print('已找到内录设备,序号是 ',i)
                return i
        print('无法找到内录设备!')
        return -1
    # 开始录音,开启一个新线程进行录音操作
    def start(self):
        threading._start_new_thread(self.__record, ())
    # 执行录音的线程函数
    def __record(self):
        self._running = True
        self._frames = []
        p = pyaudio.PyAudio()
        # 查找内录设备
        dev_idx = self.findInternalRecordingDevice(p)
        if dev_idx < 0:
            return
        # 在打开输入流时指定输入设备
        stream = p.open(
            # input_device_index=dev_idx,
            format=self.FORMAT,
            channels=self.CHANNELS,
            rate=self.RATE,
            input=True,
            frames_per_buffer=self.CHUNK)
        # 循环读取输入流
        while (self._running):
            data = stream.read(self.CHUNK)
            self._frames.append(data)
        # 停止读取输入流
        stream.stop_stream()
        # 关闭输入流
        stream.close()
        # 结束pyaudio
        p.terminate()
        return
    # 停止录音
    def stop(self):
        self._running = False
    # 保存到文件
    def save(self, fileName):
        # 创建pyAudio对象
        p = pyaudio.PyAudio()
        # 打开用于保存数据的文件
        wf = wave.open(fileName, 'wb')
        # 设置音频参数
        wf.setnchannels(self.CHANNELS)
        wf.setsampwidth(p.get_sample_size(self.FORMAT))
        wf.setframerate(self.RATE)
        # 写入数据
        wf.writeframes(b''.join(self._frames))
        # 关闭文件
        wf.close()
        # 结束pyaudio
        p.terminate()
if __name__ == "__main__":
    # 检测当前目录下是否有record子目录
    if not os.path.exists('record'):
        os.makedirs('record')
    print("\npython 录音机 ....\n")
    print("提示:按 r 键并回车 开始录音\n")
    i = input('请输入操作码:')
    if i == 'r':
        rec = Recorder()
        begin = time.time()
        print("\n开始录音,按 s 键并回车 停止录音,自动保存到 record 子目录\n")
        rec.start()
        running = True
        while running:
            i = input("请输入操作码:")
            if i == 's':
                running = False
                print("录音已停止")
                rec.stop()
                t = time.time() - begin
                print('录音时间为%ds' % t)
                # 以当前时间为关键字保存wav文件
                rec.save("record/rec_" + datetime.now().strftime("%Y-%m-%d_%H-%M-%S") + ".wav")

调用pyaudio库录制以及播放wav音频文件

Pyaudio简介

PyAudio 是语音处理的 Python 库,提供了比较丰富的功能。

功能

python的Pyaud模块可以调用电脑的麦克风或音响进行录音,音频播放,生成wav文件等。

wave是录音是用的标准的WINDOWS文件格式,扩展名为WAV,数据本身的格式为PCM或压缩型,属于无损音乐格式的一种。

Pyaudio安装

pip install pyaudio

使用Pyaudio进行录音

导入所需库

import wave
import pyaudio
def audio_record(out_file, rec_time):
    CHUNK = 1024
    FORMAT = pyaudio.paInt16  # 16bit编码格式
    CHANNELS = 1  # 单声道
    RATE = 16000  # 16000采样频率
​
    p = pyaudio.PyAudio()
    # 创建音频流
    stream = p.open(format=FORMAT,  # 音频流wav格式
                    channels=CHANNELS,  # 单声道
                    rate=RATE,  # 采样率16000
                    input=True,
                    frames_per_buffer=CHUNK)
​
    print("开始录制。。。")
​
    frames = []  # 录制的音频流
    # 录制音频数据
    for i in range(0, int(RATE / CHUNK * rec_time)):
        data = stream.read(CHUNK)
        frames.append(data)
​
    # 录制完成
    stream.stop_stream()
    stream.close()
    p.terminate()
​
    print("完成。。。。。")

将它封装成函数,直接去调用,函数的参数分别为文件名称和录制时间。

使用Pyaudio库播放录音

import wave
import pyaudio
​
def play():
    chunk = 1024  
    wf = wave.open(r"文件名", 'rb')
    p = pyaudio.PyAudio()
    stream = p.open(format=p.get_format_from_width(wf.getsampwidth()), channels=wf.getnchannels(),
                    rate=wf.getframerate(), output=True)
​
    data = wf.readframes(chunk)  # 读取数据
    print(data)
    while data != b'':  # 播放
        stream.write(data)
        data = wf.readframes(chunk)
        print('while循环中!')
        print(data)
    stream.stop_stream()  # 停止数据流
    stream.close()
    p.terminate()  # 关闭 PyAudio
play()

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • TensorFlow实现自定义Op方式

    TensorFlow实现自定义Op方式

    今天小编就为大家分享一篇TensorFlow实现自定义Op方式,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-02-02
  • python对离散变量的one-hot编码方法

    python对离散变量的one-hot编码方法

    今天小编就为大家分享一篇python对离散变量的one-hot编码方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-07-07
  • Python调用Google Bard的图文详解

    Python调用Google Bard的图文详解

    Google Bard 是一种开源数据可视化和探索工具,可为 开发人员 提供支持,本文主要为大家介绍了Python调用Google Bard的方法,需要的可以参考下
    2023-08-08
  • Jupyter Notebook输出矢量图实例

    Jupyter Notebook输出矢量图实例

    这篇文章主要介绍了Jupyter Notebook输出矢量图实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-04-04
  • Python超有趣实例通过冒泡排序来实现LOL厄斐琉斯控枪

    Python超有趣实例通过冒泡排序来实现LOL厄斐琉斯控枪

    冒泡排序是一种简单的排序算法,它也是一种稳定排序算法。其实现原理是重复扫描待排序序列,并比较每一对相邻的元素,当该对元素顺序不正确时进行交换。一直重复这个过程,直到没有任何两个相邻元素可以交换,就表明完成了排序
    2022-05-05
  • Python文件操作之合并文本文件内容示例代码

    Python文件操作之合并文本文件内容示例代码

    众所周知Python文件处理操作方便快捷,下面这篇文章主要给大家介绍了关于Python文件操作之合并文本文件内容的相关资料,文中通过示例代码介绍的非常详细,需要的朋友可以参考借鉴,下面随着小编来一起学习学习吧。
    2017-09-09
  • 详解Python OpenCV图像分割算法的实现

    详解Python OpenCV图像分割算法的实现

    图像分割是指根据灰度、色彩、空间纹理、几何形状等特征把图像划分成若干个互不相交的区域。本文就来和大家聊聊OpenCV的图像分割算法及基于轮廓的字符分离,感兴趣的可以了解一下
    2022-08-08
  • Python 元组拆包示例(Tuple Unpacking)

    Python 元组拆包示例(Tuple Unpacking)

    今天小编就为大家分享一篇Python 元组拆包实例(Tuple Unpacking),具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-12-12
  • 教你利用python实现企业微信发送消息

    教你利用python实现企业微信发送消息

    今天带大家来练习python实战,文中对利用python实现企业微信发送消息作了详细的图文解说及代码示例,对正在学习python的小伙伴很有帮助,需要的朋友可以参考下
    2021-05-05
  • PIL对上传到Django的图片进行处理并保存的实例

    PIL对上传到Django的图片进行处理并保存的实例

    今天小编就为大家分享一篇PIL对上传到Django的图片进行处理并保存的实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-08-08

最新评论