用python爬取今日说法每期数据

 更新时间:2022年02月10日 16:37:58   作者:Aaron_Yang.  
大家好,本篇文章主要讲的是用python爬取今日说法每期数据,感兴趣的同学赶快来看一看吧,对你有帮助的话记得收藏一下

实验目的

主要是获取2021年今日说法每期节目主要内容及时间
今日说法的网址为:http://tv.cctv.com/lm/jrsf/index.shtml
当时怎么写的思路有点不太记得了,先把代码贴上,后续有时间再补上。

代码

import xlwt
import re

import requests


# url = "https://tv.cctv.com/lm/jrsf/index.shtml"

def get_data(page):
    url = 'https://api.cntv.cn/NewVideo/getVideoListByColumn?id=TOPC145146466500891' \
          '4&n=1000&sort=desc&p={pageNo}&mode=0&serviceId=tvcctv&cb=Callback'.format(pageNo=page)
    headers = {
        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 '
                      '(KHTML, like Gecko) Chrome/92.0.4515.131 Safari/537.36'
    }
    response = requests.get(url=url, headers=headers)
    return response.text
    # print(response.text)


if __name__ == "__main__":

    headers = {
        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 '
                      '(KHTML, like Gecko) Chrome/92.0.4515.131 Safari/537.36'
    }

    book = xlwt.Workbook(encoding='utf-8', style_compression=0)
    sheet = book.add_sheet('今日说法', cell_overwrite_ok=True)

    count = 0
    for page in range(1,5):
        page_content = get_data(page)
        obj = re.compile(r'url":"(.*?.shtml)"', re.S)
        imgUrl = re.findall(obj, page_content.replace('\\', ''))
        for i in range(len(imgUrl)):
            resp = requests.get(url=imgUrl[i], headers=headers)
            resp.encoding = 'utf-8'

            obj2 = re.compile(r'更新时间:</em>(.*?)</p>', re.S)
            time = re.findall(obj2, resp.text)
            obj3 = re.compile(r'视频简介:</em>(.*?)</p>', re.S)
            jianjie = re.findall(obj3, resp.text)
            content = []
            content.append(time)
            content.append(jianjie)
            for j in range(2):
                sheet.write(count, j, content[j])
                count+=1

    book.save("./data_5.xls")

实验结果

在这里插入图片描述

总结

到此这篇关于用python爬取今日说法每期数据的文章就介绍到这了,更多相关python爬取今日说法内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • python自动发送邮件脚本

    python自动发送邮件脚本

    这篇文章主要为大家详细介绍了python自动发送邮件的脚本源码,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-06-06
  • Python数据结构与算法中的栈详解(3)

    Python数据结构与算法中的栈详解(3)

    这篇文章主要为大家详细介绍了Python中的栈,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下,希望能够给你带来帮助
    2022-03-03
  • python使用win32com库播放mp3文件的方法

    python使用win32com库播放mp3文件的方法

    这篇文章主要介绍了python使用win32com库播放mp3文件的方法,涉及Python使用win32com库操作音频文件的相关技巧,需要的朋友可以参考下
    2015-05-05
  • Python OpenCV 图像矫正的原理实现

    Python OpenCV 图像矫正的原理实现

    这篇文章主要介绍了Python OpenCV 图像矫正的原理实现,检测边缘点;以边缘点作为输入,采用Hough直线检测,检测出最多点共线的四条直线,更多相关内容需要的朋友可以参考一下
    2022-07-07
  • python中list常用操作实例详解

    python中list常用操作实例详解

    这篇文章主要介绍了python中list常用操作,以实例形式较为详细的分析了列表list中常用的建立、添加、删除、搜索、过滤等操作技巧,需要的朋友可以参考下
    2015-06-06
  • Matplotlib实战之平行坐标系绘制详解

    Matplotlib实战之平行坐标系绘制详解

    平行坐标系是一种统计图表,它包含多个垂直平行的坐标轴,每个轴表示一个字段,并用刻度标明范围,下面我们就来看看如何绘制平行坐标系吧
    2023-08-08
  • python3爬取各类天气信息

    python3爬取各类天气信息

    这篇文章主要为大家详细介绍了python3爬取各类天气信息,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-02-02
  • Python开发的单词频率统计工具wordsworth使用方法

    Python开发的单词频率统计工具wordsworth使用方法

    wordsworth是字母,单词和n元组频率分析,用来分析文件中的单词出现频率的工具。
    2014-06-06
  • python imutils包基本概念及使用

    python imutils包基本概念及使用

    python imutils包可以很简洁的调用opencv接口,轻松实现图像的平移,旋转,缩放,骨架化等操作,对python imutils包基本概念及使用方法感兴趣的朋友一起看看吧
    2021-07-07
  • python自动化之re模块详解

    python自动化之re模块详解

    这篇文章主要为大家介绍了python自动化之re模块,具有一定的参考价值,感兴趣的小伙伴们可以参考一下,希望能够给你带来帮助
    2022-01-01

最新评论