Python实现视频下载与合成的示例代码

 更新时间:2022年04月16日 08:57:54   作者:魔王不会哭  
这篇文章主要为大家详细介绍了Python是如何实现视频的下载以及合成的,文中的实现步骤讲解详细,感兴趣的小伙伴快跟随小编一起学习一下吧

模块使用

requests >>> pip install requests (数据请求 第三方模块)

re # 正则表达式 去匹配提取数据

json

开发环境

Python 3.8 解释器

Pycharm 2021.2 版本 建议

win + R 输入cmd 输入安装命令 pip install 模块名 如果出现爆红 可能是因为 网络连接超时 切换国内镜像源

案例实现

1.明确需求

采集内容, 先分析一个视频是从哪里获取

通过开发者工具进行抓包分析, 分析视频数据可以从哪里获取内容 格式 m3u8视频内容

当我们网站视频格式 是m3u8的时候, 有一个专门存放所有ts视频片段的文件

2.代码实现步骤

  • 发送请求
  • 获取数据
  • 解析数据
  • 保存数据

1. 发送请求, 对于视频播放页面url地址发送请求

2. 获取数据, 获取服务器返回response响应数据

3. 解析数据, 提取我们想要的数据内容 视频标题 以及 m3u8 链接

4. 发送请求, 对于 m3u8 链接 发送请求

5. 获取数据, 获取服务器返回response响应数据

6. 解析数据, 提取所有ts文件url [视频片段]

7. 保存数据, 把所有视频保存下来, 然后合成为一个整体视频内容

实现代码

import requests  # 数据请求模块 pip install requests  在cmd里面 输入命令
import re  # 导入正则表达式模块 内置模块
import json
import pprint  # 格式化输出模块

for page in range(1, 17):
    print(f'--------------------正在采集第{page}页的数据内容--------------------')
    list_url = 'https://www.acfun.cn/u/45321802'
    # 批量 ctrl + R 选中目标
    data = {
        'quickViewId': 'ac-space-video-list',
        'reqID': page + 1,
        'ajaxpipe': '1',
        'type': 'video',
        'order': 'newest',
        'page': page,
        'pageSize': '20',
        't': '1649944573765',
    }
    headers = {
        # 'cookies': '你的cookie',
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/100.0.4896.75 Safari/537.36'
    }
    # get请求 有一个params参数
    # post请求 data 参数
    response = requests.get(url=list_url, params=data, headers=headers)
    # print(response.text)
    id_list = re.findall('a href=.*?ac(.*?)"', response.text)
    for index in id_list:
        video_id = index.replace('\\', '')
        """
        1. 发送请求, 对于视频播放页面url地址发送请求
            用python代码去模拟浏览器 对于 url地址发送请求
        video 
        """
        url = f'https://www.acfun.cn/v/ac{video_id}'  # 确定请求url地址
        # 请求头 用伪装python代码, 为了被服务器识别出来 是爬虫程序 一种简单反反爬手段 当你加ua 得到数据的时候, 可能要cookie
        # 需要登陆才能获得数据的, 需要加cookie 用户信息, 常用于检测是否登陆账号
        headers = {
            # 'cookies': '你的cookie',
            'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/100.0.4896.75 Safari/537.36'
        }
        # 通过requests模块里面get请求方式, 对于url地址发送请求, 并且携带上headers请求头伪装, 最后用response自定义变量接收返回数据
        response = requests.get(url=url, headers=headers)
        # 2. 获取数据
        # print(response.text)
        # 3. 解析数据 通过re模块里面findall的方法 在response.text里面去找寻 标题数据 re.S 匹配换行
        # 正则表达式提取出来的数据返回都是列表数据类型  实现过程不重要, 方式方法很多, 你喜欢用哪个都可以 只要可以取到数据都OK
        title = re.findall('<title >(.*?) - AcFun弹幕视频网 - 认真你就输啦 \(\?ω\?\)ノ- \( ゜- ゜\)つロ</title>', response.text)[0]
        video_info = re.findall('window.pageInfo = window.videoInfo = (.*?);', response.text)[0]

        # print(video_info) # 字符串转成字典 怎么转  最稳妥查看数据类型 直接用 type() 这个函数去查看
        json_data = json.loads(video_info)
        # pprint.pprint(json_data)
        # 字典取值 根据冒号左边的内容(键) 提取冒号右边的内容(值)
        m3u8_url = \
        json.loads(json_data['currentVideoInfo']['ksPlayJson'])['adaptationSet'][0]['representation'][0]['backupUrl'][0]
        # print(title)
        # print(m3u8_url)
        # 通过requests模块里面get请求方式, 对于m3u8_url地址发送请求, 并且携带上headers请求头伪装, 获取响应体文本数据, 用m3u8_data自定义变量接收数据
        m3u8_data = requests.get(url=m3u8_url, headers=headers).text
        # split() 字符串分割
        m3u8_data = re.sub('#E.*', '', m3u8_data).split()
        # print(m3u8_data)
        for ts in m3u8_data:
            ts_url = 'https://ali-safety-video.acfun.cn/mediacloud/acfun/acfun_video/' + ts
            ts_content = requests.get(url=ts_url, headers=headers).content
            # ab 是什么意思 a追加保存, b 二进制数据 ab 以二进制数据追加保存
            with open('video\\' + title + '.mp4', mode='ab') as f:
                f.write(ts_content)
        print('视频保存完成: ', title)

视频教程

到此这篇关于Python实现视频下载与合成的示例代码的文章就介绍到这了,更多相关Python视频下载 合成内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • python中正则表达式findall的用法实例

    python中正则表达式findall的用法实例

    在写着自动化测试的脚本时重新复习了一下正则表达式findall()方法,下面这篇文章主要给大家介绍了关于python中正则表达式findall用法的相关资料,文中通过实例代码介绍的非常详细,需要的朋友可以参考下
    2022-09-09
  • Python中CSV文件(逗号分割)实战操作指南

    Python中CSV文件(逗号分割)实战操作指南

    CSV文件默认以英文逗号做为列分隔符,换行符作为行分隔符,下面这篇文章主要给大家介绍了关于Python中CSV文件(逗号分割)的相关资料,文中通过示例代码介绍的非常详细,需要的朋友可以参考下
    2022-07-07
  • Python文件的压缩与解压

    Python文件的压缩与解压

    这篇文章主要介绍了Python文件的压缩与解压,Python进行文件、文件夹压缩与解压,用到的是zipfile的第三方依赖库。根据不同应用场景封装了几个方法,下文相关内容需要的小伙伴可以参考一下
    2022-04-04
  • python中利用zfill方法自动给数字前面补0

    python中利用zfill方法自动给数字前面补0

    python中有一个zfill方法用来给字符串前面补0,非常不错,下面小编给大家分享了实例代码,非常不错,具有参考借鉴价值,需要的朋友参考下吧
    2018-04-04
  • 使用 Python 在京东上抢口罩的思路详解

    使用 Python 在京东上抢口罩的思路详解

    受疫情影响全民真的在抢口罩,而且还是抢不到的那种。这篇文章主要介绍了用 Python 在京东上抢口罩的实例代码,代码简单易懂,非常不错,具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-02-02
  • 使用pytorch和torchtext进行文本分类的实例

    使用pytorch和torchtext进行文本分类的实例

    今天小编就为大家分享一篇使用pytorch和torchtext进行文本分类的实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-01-01
  • python hough变换检测直线的实现方法

    python hough变换检测直线的实现方法

    这篇文章主要介绍了python hough变换检测直线的实现方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-07-07
  • Python微信操控itchat的方法

    Python微信操控itchat的方法

    itchat是一个开源的微信个人号接口,使用python调用微信从未如此简单。这篇文章主要介绍了Python微信操控itchat的方法,需要的朋友可以参考下
    2019-05-05
  • 一行代码生成Tableau可视化图表的方法

    一行代码生成Tableau可视化图表的方法

    本文主要介绍了一行代码生成Tableau可视化图表的方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2023-04-04
  • 详解Python3中字符串中的数字提取方法

    详解Python3中字符串中的数字提取方法

    这篇文章主要介绍了详解Python3中字符串中的数字提取方法,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2017-01-01

最新评论