Python实现周期性抓取网页内容的方法

 更新时间:2015年11月04日 15:22:07   作者:intergret  
这篇文章主要介绍了Python实现周期性抓取网页内容的方法,涉及Python时间函数及正则匹配的相关操作技巧,具有一定参考借鉴价值,需要的朋友可以参考下

本文实例讲述了Python实现周期性抓取网页内容的方法。分享给大家供大家参考,具体如下:

1.使用sched模块可以周期性地执行指定函数

2.在周期性执行指定函数中抓取指定网页,并解析出想要的网页内容,代码中是六维论坛的在线人数

论坛在线人数统计代码:

#coding=utf-8
import time,sched,os,urllib2,re,string
#初始化sched模块的scheduler类
#第一个参数是一个可以返回时间戳的函数,第二个参数可以在定时未到达之前阻塞。
s = sched.scheduler(time.time,time.sleep)
#被周期性调度触发的函数
def event_func():
  req = urllib2.Request('http://bt.neu6.edu.cn/')
  response = urllib2.urlopen(req)
  rawdata = response.read()
  response.close()
  usernump = re.compile(r'总计 <em>.*?</em> 人在线')
  usernummatch = usernump.findall(rawdata)
  if usernummatch:
    currentnum=usernummatch[0]
    currentnum=currentnum[string.index(currentnum,'>')+1:string.rindex(currentnum,'<')]
    print "Current Time:",time.strftime('%Y,%m,%d,%H,%M',time.localtime(time.time())),'User num:',currentnum
    # 保存结果,供图表工具amcharts使用
    result=open('liuvUserNUm','a')
    result.write('{year: new Date('+time.strftime('%Y,%m,%d,%H,%M',time.localtime(time.time()))+'),value:'+currentnum+'},\n')
    result.close()
#enter四个参数分别为:间隔事件、优先级(用于同时间到达的两个事件同时执行时定序)、被调用触发的函数,给他的参数(注意:一定要以tuple给如,如果只有一个参数就(xx,))
def perform(inc):
  s.enter(inc,0,perform,(inc,))
  event_func()
def mymain(inc=900):
  s.enter(0,0,perform,(inc,))
  s.run()
if __name__ == "__main__":
  mymain()

希望本文所述对大家Python程序设计有所帮助。

相关文章

  • Django零基础入门之常用过滤器详解

    Django零基础入门之常用过滤器详解

    这篇文章主要介绍了Django零基础入门之常用过滤器的使用,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2021-09-09
  • Python Tkinter图形工具使用方法及实例解析

    Python Tkinter图形工具使用方法及实例解析

    这篇文章主要介绍了Python Tkinter图形工具使用方法及实例解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-06-06
  • python 开发的三种运行模式详细介绍

    python 开发的三种运行模式详细介绍

    这篇文章主要介绍了python 开发的三种运行模式详细介绍的相关资料,需要的朋友可以参考下
    2017-01-01
  • 一起来看看python的装饰器代码

    一起来看看python的装饰器代码

    这篇文章主要为大家详细介绍了python装饰器代码,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下,希望能够给你带来帮助
    2022-03-03
  • python 使用openpyxl读取excel数据

    python 使用openpyxl读取excel数据

    这篇文章主要介绍了python 使用openpyxl读取excel数据的方法,帮助大家更好的理解和学习使用python,感兴趣的朋友可以了解下
    2021-02-02
  • 浅析python打包工具distutils、setuptools

    浅析python打包工具distutils、setuptools

    python包在开发中十分常见,一般的使用套路是所有的功能做一个python模块包,打包模块,然后发布,安装使用。这篇文章给大家介绍了python打包工具distutils、setuptools的相关知识,感兴趣的朋友一起看看吧
    2018-04-04
  • Python中map,reduce,filter和sorted函数的使用方法

    Python中map,reduce,filter和sorted函数的使用方法

    这篇文章主要介绍了Python中map,reduce,filter和sorted函数的使用方法,是Python入门学习中的基础知识,需要的朋友可以参考下
    2015-08-08
  • python自带tkinter库实现棋盘覆盖图形界面

    python自带tkinter库实现棋盘覆盖图形界面

    这篇文章主要为大家详细介绍了python自带tkinter库实现棋盘覆盖图形界面,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2019-07-07
  • Python中字典列表中删除重复项

    Python中字典列表中删除重复项

    本文主要介绍了Python中字典列表中删除重复项,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2023-04-04
  • Python Celery定时任务详细讲解

    Python Celery定时任务详细讲解

    这篇文章主要介绍了Python Celery定时任务详细讲解,文章围绕主题展开详细的内容介绍,具有一定的参考价值,需要的朋友可以参考一下
    2022-08-08

最新评论