Python使用Pydub处理音频的方法详解

 更新时间:2026年06月15日 09:27:12   作者:sitellla  
Pydub 是一个简洁高效的 Python 音频处理库,支持 MP3、WAV 等多种格式,它提供了直观的链式调用 API,可实现音频切片、音量调节、拼接、淡入淡出等操作,本文给大家介绍了Python使用Pydub处理音频的方法,需要的朋友可以参考下

Pydub 在 GitHub 上已经拿到 9,763 个 Star。

这个 Python 库的目标是让音频操作变得简单直观。打开文件、剪片段、调音量、拼接、淡入淡出、格式转换,全部链式调用,几行代码写完。

1、 核心能力

打开音频文件:

from pydub import AudioSegment
song = AudioSegment.from_wav("file.wav")
song = AudioSegment.from_mp3("file.mp3")

MP3、WAV、Ogg、FLV、MP4,只要 ffmpeg 支持的格式,它都认识。统一用 AudioSegment 对象,不用为每种格式写不同的解析逻辑。

切片基于毫秒:

first_10_seconds = song[:10000]
last_5_seconds = song[-5000:]

调音量直接用加减运算符:

louder = first_10_seconds + 6
quieter = last_5_seconds - 3

拼接和重复:

mix = beginning + end
loop = mix * 2

2、 链式调用

因为每个操作都返回新的 AudioSegment,可以一口气串起来:

result = (song[:10000] + 6)
    .append(song[-5000:] - 3, crossfade=1500)
    .fade_in(2000)
    .fade_out(3000)
result.export("output.mp3", format="mp3", bitrate="192k")

不用手动算帧率,不用管采样率,不用写循环。AudioSegment 是不可变对象,所有操作不修改原数据。

导出时支持更多参数,直接透传给 ffmpeg:

song.export("output.mp3", format="mp3",
    parameters=["-ac", "2", "-vol", "150"],
    tags={"artist": "Pydub", "album": "Demo"})

3、 调试

转换出错时可以打开日志,查看实际执行的 ffmpeg 命令:

import logging
l = logging.getLogger("pydub.converter")
l.setLevel(logging.DEBUG)
l.addHandler(logging.StreamHandler())

大多数转换问题来自 ffmpeg 环境配置,日志能直接暴露是哪一步出了问题。

4、 安装

pip install pydub

然后装 ffmpeg。macOS 用 brew install ffmpeg,Linux 用 apt-get install ffmpeg,Windows 下载二进制文件加到 PATH 就行。

5、 实际场景

批量转视频为音频:

import glob
from pydub import AudioSegment

for video in glob.glob("*.mp4"):
    mp3 = video.replace(".mp4", ".mp3")
    AudioSegment.from_file(video).export(mp3, format="mp3")

拼接歌单,带交叉淡化:

playlist = None
for mp3_file in glob("*.mp3"):
    song = AudioSegment.from_mp3(mp3_file)
    if playlist is None:
        playlist = song[:30000]
    else:
        playlist = playlist.append(song, crossfade=10000)
playlist.fade_out(30000).export("mix.mp3", format="mp3")

6、 适合谁

处理音频批量的开发者、做播客剪辑工具的、跑语音识别预处理的、需要在 Python 项目里加音效播放的。API 足够直观,看过 Quickstart 就能上手。

项目基于 MIT 协议,由 James Robert 在 2011 年发布,社区活跃,问题可以在 Stack Overflow 上找到解答。

thon 项目里加音效播放的。API 足够直观,看过 Quickstart 就能上手。

项目基于 MIT 协议,由 James Robert 在 2011 年发布,社区活跃,问题可以在 Stack Overflow 上找到解答。

以上就是Python使用Pydub处理音频的方法详解的详细内容,更多关于Python Pydub处理音频的资料请关注脚本之家其它相关文章!

相关文章

  • vscode配置与python虚拟环境切换的几种方式总结

    vscode配置与python虚拟环境切换的几种方式总结

    Python之所以强大,除了语言本身的特性外,更重要的是拥有无所不及的第三方库,下面这篇文章主要给大家介绍了关于vscode配置与python虚拟环境切换的几种方式,文中通过图文介绍的非常详细,需要的朋友可以参考下
    2022-12-12
  • Python requests请求响应以流stream的方式实现打印输出

    Python requests请求响应以流stream的方式实现打印输出

    在使用requests库时,接收响应并打印内容需注意:若响应内容过大,应设置合理的chunk_size参数以避免内存溢出,当设置了stream=True时,不能使用response.text或response.content属性读取响应内容,否则会抛出异常
    2025-10-10
  • python调用java的jar包方法

    python调用java的jar包方法

    今天小编就为大家分享一篇python调用java的jar包方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-12-12
  • 介绍Python的@property装饰器的用法

    介绍Python的@property装饰器的用法

    这篇文章主要介绍了介绍Python的@property装饰器的用法,是Python学习进阶中的重要知识,代码基于Python2.x版本,需要的朋友可以参考下
    2015-04-04
  • Zookeeper接口kazoo实例解析

    Zookeeper接口kazoo实例解析

    这篇文章主要介绍了Zookeeper接口kazoo实例解析,简单介绍了Zookeeper接口接口的开发,然后分享了相关实例,小编觉得还是挺不错的,具有一定借鉴价值,需要的朋友可以参考下
    2018-01-01
  • Python3使用xml.dom.minidom和xml.etree模块儿解析xml文件封装函数的方法

    Python3使用xml.dom.minidom和xml.etree模块儿解析xml文件封装函数的方法

    这篇文章主要介绍了Python3使用xml.dom.minidom和xml.etree模块儿解析xml文件,封装函数的方法,代码简单易懂,非常不错,具有一定的参考借鉴价值,需要的朋友可以参考下
    2019-09-09
  • Python 多线程共享变量的实现示例

    Python 多线程共享变量的实现示例

    这篇文章主要介绍了Python 多线程共享变量的实现示例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-04-04
  • Python之列表的append()方法最容易踩的坑

    Python之列表的append()方法最容易踩的坑

    这篇文章主要介绍了Python之列表的append()方法最容易踩的坑及解决,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2022-11-11
  • Python pexpect模块及shell脚本except原理解析

    Python pexpect模块及shell脚本except原理解析

    这篇文章主要介绍了Python pexpect模块及shell脚本except原理解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-08-08
  • 通过Python 获取Android设备信息的轻量级框架

    通过Python 获取Android设备信息的轻量级框架

    今天跟大家分享一下,如何通过Python实现一个轻量级的库来获取电脑上连接的Android设备信息,需要的朋友参考下吧
    2017-12-12

最新评论