Python使用moviepy读取字幕srt文件报错的解决方法详解

更新时间：2024年01月23日 09:00:12 作者：IT里的交易员

这篇文章主要为大家详细介绍了Python使用moviepy读取字幕srt文件报错‘gbk‘ codec can‘t decode的两种解决办法,有需要的小伙伴可以跟随小编一起学习一下

前言

最近研究moviepy，使用其给视频添加字幕，却发现一个很久不会碰到的问题----文件编码问题。这在python3.x很少发生了。不成想，moviepy还是有bug。

debug也是编程乐趣之一。不过写到这里，希望以后官方升级可以修复这个问题。

一、SubtitlesClip读取srt文件报错

报错信息如下：

subtitles = SubtitlesClip(srt_path, generator)
File "d:\ProgramData\anaconda3\envs\python38\lib\site-packages\moviepy\video\tools\subtitles.py", line 42, in __init__
subtitles = file_to_subtitles(subtitles)
File "d:\ProgramData\anaconda3\envs\python38\lib\site-packages\moviepy\video\tools\subtitles.py", line 154, in file_to_subtitles
for line in f:
UnicodeDecodeError: 'gbk' codec can't decode byte 0xad in position 54: illegal multibyte sequence

二、问题剖析

打开d:\ProgramData\anaconda3\envs\python38\lib\site-packages\moviepy\video\tools\subtitles.py

我这里是虚拟了一个python3.8的环境（每个人不一样），看报错信息即可知道文件在哪里。

根据以上报错信息，可以知道：

    def __init__(self, subtitles, make_textclip=None):
        
        VideoClip.__init__(self, has_constant_size=False)

        if isinstance(subtitles, str):
            subtitles = file_to_subtitles(subtitles)

42行，也就是最后一样，调用了154行。

    with open(filename,'r') as f:
        for line in f:

因为153行，with open(filename,‘r’) as f: 没有添加打开文件使用的编码，所以UTF-8格式的srt文件被Windows系统默认使用GBK模式打开，就出现了文章开通的报错提示了。

三、解决办法（2种）

这个问题很好解决，就是打开文件时增加编码格式就行。

（唉，这么low的bug）

如果srt文件都是utf-8编码格式，使用1方法即可解决。如果还有其它格式，可通过2方法完美解决。

1. 增加encoding='utf-8’的临时解决办法

    with open(filename,'r') as f:
        for line in f:

将以上修改如下，增加encoding='utf-8’即可。

    with open(filename,'r', encoding='utf-8') as f:
        for line in f:

2. 通过类初始化传递参数的终极解决办法

上面的方法，如果srt文件不是utf-8则也会报错，是否可以将其改为参数运行呢？

那当然可以啦！

不过，需要修改多个地方，分别在class定义的 init()参数里增加encoding=‘utf-8’，然后在调用函数将encoding进行传递；file_to_subtitles(filename)参数增加encoding，打开文件也增加。至此完成修改。目的就是在class初始化时就传递encoding参数，并层层调用后增加到with open(filename,‘r’, encoding=encoding) as f:这一行。

修改后的代码如下：

class SubtitlesClip(VideoClip):
    """ A Clip that serves as "subtitle track" in videos.
    
    One particularity of this class is that the images of the
    subtitle texts are not generated beforehand, but only if
    needed.

    Parameters
    ==========

    subtitles
      Either the name of a file, or a list

    Examples
    =========
    
    >>> from moviepy.video.tools.subtitles import SubtitlesClip
    >>> from moviepy.video.io.VideoFileClip import VideoFileClip
    >>> generator = lambda txt: TextClip(txt, font='Georgia-Regular', fontsize=24, color='white')
    >>> sub = SubtitlesClip("subtitles.srt", generator)
    >>> myvideo = VideoFileClip("myvideo.avi")
    >>> final = CompositeVideoClip([clip, subtitles])
    >>> final.write_videofile("final.mp4", fps=myvideo.fps)
    
    """

    def __init__(self, subtitles, make_textclip=None,encoding='utf-8'):
        
        VideoClip.__init__(self, has_constant_size=False)

        if isinstance(subtitles, str):
            subtitles = file_to_subtitles(subtitles,encoding=encoding)

def file_to_subtitles(filename,encoding):
    """ Converts a srt file into subtitles.

    The returned list is of the form ``[((ta,tb),'some text'),...]``
    and can be fed to SubtitlesClip.

    Only works for '.srt' format for the moment.
    """
    times_texts = []
    current_times = None
    current_text = ""
    with open(filename,'r', encoding=encoding) as f:

因为这里给类初始化赋值了encoding=‘utf-8’，所以默认是此格式的话，调用方法不加此参数一样可以使用，不会报错。如下：

sub = SubtitlesClip("subtitles.srt", generator)

如果是gbk的格式，才需要在类初始化时增加encoding参数，如下：

sub = SubtitlesClip("subtitles.srt", generator, encoding='gbk')

总结

以前python2.x文字编码老是各种出错，改用python3.x后，编码及中文问题都得到了解决。不曾想还是会应为编码问题倒是文件打不开或者乱码。

UnicodeDecodeError: 'gbk' codec can't decode byte 0xad in position 54: illegal multibyte sequence

以后看到这个提示，先检查字符编码。然后就是打开方式，通常都可以解决。

到此这篇关于Python使用moviepy读取字幕srt文件报错的解决方法详解的文章就介绍到这了,更多相关Python解决moviepy读取字幕srt报错内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

您可能感兴趣的文章:

python IDLE添加行号显示教程
这篇文章主要介绍了python IDLE添加行号显示教程，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2020-04-04
在python3中使用shuffle函数要注意的地方
今天小编就为大家分享一篇在python3中使用shuffle函数要注意的地方，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2020-02-02
python简单获取数组元素个数的方法
这篇文章主要介绍了python简单获取数组元素个数的方法,实例分析了Python中len方法的相关使用技巧,非常简单实用,需要的朋友可以参考下
2015-07-07
Flask添加路由的三种方法
Flask 是一个流行的 Python Web 框架,它提供了多种方法来添加路由,本文详细的介绍了Flask添加路由的三种方法,感兴趣的可以了解一下
2023-11-11
Python:format格式化字符串详解
这篇文章主要介绍了Python中用format函数格式化字符串的用法,格式化字符串是Python学习当中的基础知识,本文主要针对Python2.7.x版本,需要的朋友可以参考下
2021-09-09
Python 对输入的数字进行排序的方法
今天小编就为大家分享一篇Python 对输入的数字进行排序的方法，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2018-06-06
使用Python编写一个递归文件删除工具
在日常的文件管理工作中,我们经常需要清理一些目录中的文件,特别是在开发过程中产生的临时文件、缓存文件等,下面我们就来使用PyQt5开发一个功能完整的递归文件删除工具吧
2025-11-11
关于Python数据处理中的None、NULL和NaN的理解与应用
这篇文章主要介绍了关于Python数据处理中的None、NULL和NaN的理解与应用,None表示空值,一个特殊Python对象,None的类型是NoneType,需要的朋友可以参考下
2023-08-08
Python脚本实现统计与可视化COCO数据集标注信息
COCO（Common Objects in Context）是目前计算机视觉领域最流行的数据集之一,下面我们就来看看如何使用Python脚本实现统计与可视化COCO数据集标注信息吧
2026-03-03
python正则表达中的re库常用方法总结
这篇文章主要介绍了python正则表达中的re库常用方法总结文章围绕主题展开详细的内容介绍，具有一定的参考价值，感兴趣的小伙伴可以参考一下
2022-08-08