使用Python抓取模板之家的CSS模板

 更新时间:2015年03月16日 14:32:57   投稿:hebedich  
本文给大家介绍的是使用Python抓取模板之家的CSS模板并打包成zip文件的代码,使用的是单线程,非常简单实用,这里分享给大家,有相同需求的小伙伴参考下吧。

Python版本是2.7.9,在win8上测试成功,就是抓取有点慢,本来想用多线程的,有事就罢了。模板之家的网站上的url参数与页数不匹配,懒得去做分析了,就自己改代码中的url吧。大神勿喷!

复制代码 代码如下:

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# by ustcwq
# 2015-03-15
 
import urllib,urllib2,os,time
from bs4 import BeautifulSoup
 
start = time.clock()
path = os.getcwd()+u'/模板之家抓取的模板/'
if not os.path.isdir(path):
    os.mkdir(path)
 
url = "http://www.cssmoban.com/cssthemes/index_80.shtml"    # 源网站中的index后面数字怎么编排的?
theme_url ='http://www.cssmoban.com/cssthemes/'
response = urllib2.urlopen(url)
soup = BeautifulSoup(response)
result = soup.select('p[class="title"] a')
print result
 
for item in result:
    link = item['href']
    # down_name = item.text   # 文件名称
    new_url = theme_url+link.split('/')[-1]
    response = urllib2.urlopen(new_url)
    soup = BeautifulSoup(response)
    result = soup.select('.btn a')
    down_url = result[1]['href']    # 文件链接
 
    local = path+time.strftime('%Y%m%d%H%M%S',time.localtime(time.time()))+'.zip'
    urllib.urlretrieve(down_url, local) # 远程保存函数
 
end = time.clock()
print u'模板抓取完成!'
print u'一共用时:',end-start,u'秒'

以上所述就是本文的全部内容了,希望大家能够喜欢。

相关文章

  • Python+Selenium实现读取网易邮箱验证码

    Python+Selenium实现读取网易邮箱验证码

    在自动化工作中,有可能会遇到一些发送邮箱验证码类似的功能。本文将利用Python Selenium实现自动化读取网易邮箱验证码,感兴趣的可以了解一下
    2022-03-03
  • python3中sort和sorted使用与区别

    python3中sort和sorted使用与区别

    python3中sort()和sorted()都可以用来排序,本文主要介绍了python3中sort和sorted使用与区别,具有一定的参考价值,感兴趣的可以了解一下
    2024-02-02
  • Python中selenium_webdriver下拉框操作指南

    Python中selenium_webdriver下拉框操作指南

    selenium 虽然过了这么多年,但是到目前为止依然是比较流行的自动化框架了,下面这篇文章主要给大家介绍了关于Python中selenium_webdriver下拉框操作的相关资料,文中通过实例代码介绍的非常详细,需要的朋友可以参考下
    2022-01-01
  • flask解析海康摄像头视频的使用

    flask解析海康摄像头视频的使用

    本文主要介绍了flask解析海康摄像头视频的使用,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2023-03-03
  • 解决Jupyter Notebook使用parser.parse_args出现错误问题

    解决Jupyter Notebook使用parser.parse_args出现错误问题

    这篇文章主要介绍了解决Jupyter Notebook使用parser.parse_args出现错误问题,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-04-04
  • Python中PyExecJS(执行JS代码库)的具体使用

    Python中PyExecJS(执行JS代码库)的具体使用

    pyexecjs是一个用Python来执行JavaScript代码的工具库,本文主要介绍了Python中PyExecJS(执行JS代码库)的具体使用,具有一定的参考价值,感兴趣的可以了解一下
    2024-02-02
  • Python实现获取当前日期的所属信息

    Python实现获取当前日期的所属信息

    在Python中,处理日期和时间是一个常见的任务,它涉及到许多方面,例如获取日期的年、月、日、星期几等等,本文将详细介绍如何使用Python来获取当前日期的各种相关信息,需要的可以了解下
    2024-01-01
  • 浅析python 定时拆分备份 nginx 日志的方法

    浅析python 定时拆分备份 nginx 日志的方法

    本文给大家分享python 定时拆分备份 nginx 日志的方法,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧
    2020-04-04
  • Python2中的raw_input() 与 input()

    Python2中的raw_input() 与 input()

    这篇文章主要介绍了Python2中的raw_input() 与 input(),本文分析了它们的内部实现和不同之处,并总结了什么情况下使用哪个函数,需要的朋友可以参考下
    2015-06-06
  • Python使用pyforms实现轻松构建GUI

    Python使用pyforms实现轻松构建GUI

    pyforms是一个基于Python的GUI框架,它提供了一种简单而强大的方式来构建图形用户界面,本文将介绍pyforms的使用场景、优势以及常用的Python代码案例,需要的小伙伴可以了解下
    2024-01-01

最新评论