Python得到弹幕并保存到Excel中怎么设置

 更新时间:2023年01月05日 10:06:55   作者:-李华同学-  
今天给大家分享一个得到弹幕的代码,本文通过实例代码给大家介绍Python得到弹幕并保存到Excel中怎么设置,感兴趣的朋友跟随小编一起看看吧

hello,我是李华同学,最近开始学习爬虫,下面是我实现的一个得到弹幕的代码

找一个的URL

想要得到一个网站的内容,首先要找到你想要内容的具体位置,首先你先找到一个有弹幕的地方,找到后按F12,找到在网络下,然后刷新页面,在左边搜索栏搜history可以找到储存弹幕的地址(图1),弹幕地址具体情况具体分析。

在标头下的“请求URL”,后面那一串链接就是要爬取的位置。(图2)

图1

图2

实现代码过程

将Python代码和Excel文件放在一个文件下

图3

用request库进行操作

不会下载库的同学可以在pycharm终端下用pip下载,也可以在设置setting的project下下载,具体步骤不会可以搜大佬的文章。

用requests对网站进行访问,这里用到了get请求方法,请求方法可以在之前找URL下看到。(图2)

requests.get('https://api.live.bilibili.com/xlive/web-room/v1/dM/gethistory?roomid=5050')

对访问的内容进行选择

我这里就选择了姓名和弹幕

for ac in d['data']['room']:
        s = "{}说:{}".format(ac['nickname'], ac['text'])
防止得到的内容重复

用列表储存爬取的数据,用if条件判断新爬取的内容是否在列表ls中,如果不在就用append追加到列表中。

ls = []
if s not in ls:
            ls.append(ls)         

把得到的数据保存到Excel中

在这个过程中用到了openpyxl库。

首先在Excel中先写下表头(图4),为接下来插入得到的内容找位置,然后保存(记得爬取的时候不要打开Excel文件)。

# 打开文件
wb = openpyxl.Workbook()
# 使用的工作对象创建一张表
sheet = wb.active
# 在sheet1表中写入内容    插入内容
sheet.append(['B友姓名', 'B友说的话'])

保存内容,这个是借鉴一篇文章Python提取PDF发票信息保存Excel文件并制作EXE程序的全过程,具体的解释可以看这位大佬的,还有实例。

print('B友姓名' + nickname, 'B友说的话' + text)
            print('开始写入excel,请稍等...', end='')
            xx_info = [nickname, text]
            sheet.append(xx_info)
            print('写入成功\n')
            # 关闭保存工作簿
        wb.save('data.xls')

图4

全部代码(代码的直接取)

import random
import requests
import time
import openpyxl
 
# 打开文件
wb = openpyxl.Workbook()
# 使用的工作对象创建一张表
sheet = wb.active
# 在sheet1表中写入内容    插入内容
sheet.append(['B友姓名', 'B友说的话'])  #这是在excel第一行插入,可以相当于一个文件的表头
# 用列表储存爬取内容,防止出现相似值
ls = []
# 循环实时弹幕
while True:
    # 爬取的直播间
    r = requests.get('')#这里括号里放找到的URL
    # 每次爬取的间隔,防止让服务器崩溃
    time.sleep(random.randint(1, 3))
    # 将输出的字符串内容转换成字典形式
    d = eval(r.text)
    # 在这两字典中爬取
    for ac in d['data']['room']:
        s = "{}说:{}".format(ac['nickname'], ac['text'])
        nickname = ac['nickname']
        text = ac['text']
        # 判断输出内容是否重复
        if s not in ls:
            ls.append(ls)
            # 确定没有重复值了输出
            # 颜色
            sheet.sheet_properties.tabColor = '000000'
            print('B友姓名' + nickname, 'B友说的话' + text)
            print('开始写入excel,请稍等...', end='')
            xx_info = [nickname, text]
            sheet.append(xx_info)
            print('写入成功\n')
            # 关闭保存工作簿
        wb.save('data.xls')

到此这篇关于Python得到弹幕并保存到Excel中怎么设置的文章就介绍到这了,更多相关Python弹幕保存到Excel中内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • python3.6 如何将list存入txt后再读出list的方法

    python3.6 如何将list存入txt后再读出list的方法

    这篇文章主要介绍了python3.6 如何将list存入txt后再读出list的方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-07-07
  • python爬虫之自动登录与验证码识别

    python爬虫之自动登录与验证码识别

    这篇文章主要为大家详细介绍了python爬虫之自动登录与验证码识别,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-09-09
  • Keras 多次加载model出错的解决方案

    Keras 多次加载model出错的解决方案

    这篇文章主要介绍了Keras 多次加载model出错的解决方案,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2021-05-05
  • Python opencv实现人眼/人脸识别以及实时打码处理

    Python opencv实现人眼/人脸识别以及实时打码处理

    这篇文章主要为大家详细介绍了Python opencv实现人眼、人脸识别,以及实时打码处理,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2019-04-04
  • Django代码性能优化与Pycharm Profile使用详解

    Django代码性能优化与Pycharm Profile使用详解

    本文通过一个简单的实例一步一步引导读者对其进行全方位的性能优化,这篇文章主要给大家介绍了关于Django代码性能优化与Pycharm Profile使用的相关资料,文中通过示例代码介绍的非常详细,需要的朋友可以参考下
    2018-08-08
  • Python3.5实现的三级菜单功能示例

    Python3.5实现的三级菜单功能示例

    这篇文章主要介绍了Python3.5实现的三级菜单功能,涉及Python针对json格式数据的读取、遍历、查找、判断等相关操作技巧,需要的朋友可以参考下
    2019-03-03
  • python 图片验证码代码

    python 图片验证码代码

    在网络应用中,验证码常常作为一个必备的手段,用来避免机器人恶意注册,保证坐在浏览器前的是一个人。
    2008-12-12
  • python中有函数重载吗

    python中有函数重载吗

    在本篇内容里下边给大家整理的是关于python函数重载的知识点总结,有需要的朋友们可以学习下。
    2020-05-05
  • No module named ‘win32gui‘ 的解决方法(踩坑之旅)

    No module named ‘win32gui‘ 的解决方法(踩坑之旅)

    这篇文章主要介绍了No module named ‘win32gui‘ 的解决方法(踩坑之旅),文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-02-02
  • Python 统计Jira的bug 并发送邮件功能

    Python 统计Jira的bug 并发送邮件功能

    这篇文章主要介绍了Python 统计Jira的bug 并发送邮件,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2022-01-01

最新评论