Python如何自动获取目标网站最新通知

 更新时间:2020年06月18日 09:22:10   作者:其实还好啦  
这篇文章主要介绍了Python如何自动获取目标网站最新通知,本文给大家分享实现思路及示例代码,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下

不管是一名学生,亦或是一名员工,我们都需要时刻注意学校或公司网站的通知,尽量做到即时获取最新消息。

大部分博客或数据资源网站都会有自己的RSS提示系统,便于将网站的最新信息及时推送给需要的用户,而用户也可以通过RSS阅读器来即时地获取到目标网站的最新内容。

由于学校或公司网站服务对象的特殊性和局限性,一般不会建立自己的RSS系统。

作为优秀的人儿,我们可以建立自己的RSS提示系统。

这里介绍了如何使用Python和常用的计算机小程序来构建一个RSS提示系统,做到定时自动检测目标网站发布的通知,并即时发送提示邮件。

本期文章设计RSS提示系统的主要思路是:

  • 爬取目标网站内容,建立本地已有通知数据库;
  • 模拟smtp服务器,建立邮件发送系统;
  • 解析检测目标网站发布的通知,若有新内容,则更新数据库并发送提示邮件;
  • 制定计划任务实现定时自动执行Python脚本程序。

1.建立通知数据库

这一步的目的是爬取目标网站已经发布的通知的数据,并进行存储,从而建立与该目标网站内容相对应的本地数据库。

考虑到数据库中的数据将是辨别和获取一则新通知的唯一方法,因此所建立的数据库将存储每一条通知的标题、发布日期和访问链接。

第一步使用到的模块有urllib、BeautifulSoup和sqlite3模块。其中,通过urllib模块爬取目标网页html数据;通过BeautifulSoup模块解析网页数据、爬取网页内容;通过sqlite3模块建立目标网站已有通知数据库。

该步主要代码展示如下。

2.建立邮件发送系统

这一步的目的是使用Python标准库模块smtplib来访问网络,创建一个发送电子邮件的功能。

由于我们大部分人的计算机并没有建立自己的邮件服务器,因此需借助第三方服务器来模拟邮件发送。

常用的有谷歌邮件系统、网易邮件系统和QQ邮件系统,如QQ邮件系统的SMTP服务器和端口号分别为smtp.qq.com和465。

该步主要代码展示如下。

在这个示例中,使用了Python标准库中的email模块将电子邮件信息进行了格式化,主要包括邮件的主题与发件人、收件人邮箱昵称和邮件内容等信息。

3.解析检测目标网站通知

前面两步,已经完成了目标网站已有通知数据库和邮件发送系统的建立,第三步要完成的工作,主要由两部分组成。

一是,利用第一步使用的urllib、BeautifulSoup模块解析目标网站内容数据,并与前面建立的数据库进行对比检测。

二是,若检测到目标网站有新的通知,则将新通知数据插入到数据库中,然后,发送提示电子邮件。

该步主要代码展示如下。

在这个示例中,只选取了最新的一条通知发送了电子邮件提示,具体邮件信息可自己设定。

4.制定计划任务

前面三步,已经完成了使用Python获取目标网站最新通知,并发送提示电子邮件的脚本程序。

在这一步,将使用Windows自带的DOS命令框架和任务计划程序去每小时自动运行一次Python脚本,实现自动更新通知的目的。

首先,需要编写一个cmd命令文件,方便在DOS框架下执行Python脚本。

主要代码展示如下:

@echo off # 关闭回显
cd C:\demo # 找到Python脚本文件的路径
python Python.py # 执行Python脚本文件

最后,使用任务计划程序制定一个任务,可设定为每隔一小时自动运行一次cmd命令文件。

总结

到此这篇关于Python如何自动获取目标网站最新通知的文章就介绍到这了,更多相关python自动获取最新通知内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • 利用Python如何实现数据驱动的接口自动化测试

    利用Python如何实现数据驱动的接口自动化测试

    这篇文章主要给大家介绍了关于利用Python如何实现数据驱动的接口自动化测试的相关资料,文中通过示例代码介绍的非常详细,对大家学习或者使用python具有一定的参考学习价值,需要的朋友们来一起看看吧
    2018-05-05
  • python-docx 页面设置详解

    python-docx 页面设置详解

    今天小编就为大家分享一篇python docx 中页面的设置,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-10-10
  • Python嵌入C/C++进行开发详解

    Python嵌入C/C++进行开发详解

    在本篇文章里小编给大家分享了关于Python嵌入C/C++进行开发的相关知识点内容,有兴趣的朋友们可以参考下。
    2020-06-06
  • 如何在Django项目中引入静态文件

    如何在Django项目中引入静态文件

    这篇文章主要介绍了如何在Django项目中引入静态文件,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-07-07
  • python嵌套try...except如何使用详解

    python嵌套try...except如何使用详解

    有时候我们写程序的时候,会出现一些错误或异常,导致程序终止,使用try…except,这样程序就不会因为异常而中断,下面这篇文章主要给大家介绍了关于python嵌套try...except如何使用的相关资料,需要的朋友可以参考下
    2022-08-08
  • Python的numpy选择特定行列的方法

    Python的numpy选择特定行列的方法

    这篇文章主要介绍了Python的numpy选择特定行列的方法,有时需要抽取矩阵中特定行的特定列,比如,需要抽取矩阵x的0,1行的0,3列,结果为矩阵域,需要的朋友可以参考下
    2023-08-08
  • Python学习之私有函数,私有变量及封装详解

    Python学习之私有函数,私有变量及封装详解

    私有函数与私有变量中的私有就是独自拥有、不公开、不分享的意思。放到函数与变量中就是独自拥有的函数与独自拥有的变量,并且不公开。本文将通过示例详细讲解Python中的私有函数、私有变量及封装,感兴趣的可以学习一下
    2022-03-03
  • 解决Python print输出不换行没空格的问题

    解决Python print输出不换行没空格的问题

    今天小编就为大家分享一篇解决Python print输出不换行没空格的问题,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-11-11
  • 使用python的turtle绘画滑稽脸实例

    使用python的turtle绘画滑稽脸实例

    今天小编就为大家分享一篇使用python的turtle绘画滑稽脸实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-11-11
  • 常见Python AutoEDA工具库及功能使用探究

    常见Python AutoEDA工具库及功能使用探究

    AutoEDA(自动探索性数据分析)工具库是数据科学中至关重要的一部分,它们能够自动生成数据摘要、探查数据的基本特征、检测异常值和提供可视化,为数据科学家和分析师们提供了解数据的便捷方式,本文为大家介绍常见的AutoEDA工具库及其功能和示例代码
    2024-01-01

最新评论