Python使用正则匹配实现抓图代码分享

 更新时间:2015年04月02日 09:51:31   作者:ghoulangle  
本文给大家分享的是个人的第一个作品,使用Python正则匹配实现抓图代码,非常的简单实用,推荐给大家,小伙伴们可以自由扩展下。

内涵:正则匹配,正则替换,页面抓取,图片保存 。

实用的第一次 Python 代码 参考

#!/usr/bin/env python
import urllib
import re
 
x=0
def getHtml(url):
 page = urllib.urlopen(url)
 html = page.read()
 return html
 
def getImg(html):
 global x
 reg = 'alt=".+?" src="(.+?\.jpg)"'
 imgre = re.compile(reg)
 imglist = re.findall(imgre,html)
 for imgurl in imglist:
  urllib.urlretrieve(re.sub(r',\d+,\d+',',800,450',imgurl),"img/%s.jpg" % x)
  print "\n"+re.sub(r',\d+,\d+',',800,450',imgurl)+"========"+"img/%s.jpg" % x
  x+=1
 
print 'Starting...'
 
pages = range(1,9)
 
for p in pages:
 html = getHtml('http://m.lovebizhi.com/category/7655/%d/' % p)
 print "\n-------------------------page:%d-------------------------------" % p
 getImg(html)
 
print "\nDone!"

以上所述就是本文给大家分享的全部代码了,本人Python菜鸟,第一个作品,希望对大家能有所帮助。

相关文章

  • Deepsort + Yolo 实现行人检测和轨迹追踪的方法

    Deepsort + Yolo 实现行人检测和轨迹追踪的方法

    这篇文章主要介绍了Deepsort + Yolo 实现行人检测和轨迹追踪,本项目通过采用深度学习方法实现YOLO算法行人检测和deepsort算法对人员定位的和轨迹跟踪,需要的朋友可以参考下
    2021-09-09
  • Python使用迭代器捕获Generator返回值的方法

    Python使用迭代器捕获Generator返回值的方法

    这篇文章主要介绍了Python使用迭代器捕获Generator返回值的方法,结合具体实例形式分析了Python迭代器获取生成器返回值的相关操作技巧,需要的朋友可以参考下
    2017-04-04
  • python manage.py createsuperuser运行错误问题解决

    python manage.py createsuperuser运行错误问题解决

    这篇文章主要介绍了python manage.py createsuperuser运行错误,本文给大家分享错误复现及解决方案,感兴趣的朋友一起看看吧
    2023-10-10
  • python web框架中实现原生分页

    python web框架中实现原生分页

    这篇文章主要为大家详细介绍了python web框架中使用原生分页的方法,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2019-09-09
  • Python基于LightGBM进行时间序列预测

    Python基于LightGBM进行时间序列预测

    LightGBM是扩展机器学习系统。是一款基于GBDT(梯度提升决策树)算法的分布梯度提升框架。其设计思路主要集中在减少数据对内存与计算性能的使用上,以及减少多机器并行计算时的通讯代价。本文将通过LightGBM进行时间序列预测,感兴趣的可以了解一下
    2022-03-03
  • django model 条件过滤 queryset.filter(**condtions)用法详解

    django model 条件过滤 queryset.filter(**condtions)用法详解

    这篇文章主要介绍了django model 条件过滤 queryset.filter(**condtions)用法详解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-05-05
  • Python的hashlib库获取超大文件的md5值实例探究

    Python的hashlib库获取超大文件的md5值实例探究

    这篇文章主要为大家介绍了Python的hashlib库获取超大文件的md5值实现示例,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2024-01-01
  • Python基于回溯法子集树模板解决全排列问题示例

    Python基于回溯法子集树模板解决全排列问题示例

    这篇文章主要介绍了Python基于回溯法子集树模板解决全排列问题,简单描述了全排列问题并结合实例形式分析了Python使用回溯法子集树模板解决全排列问题的具体步骤与相关操作注意事项,需要的朋友可以参考下
    2017-09-09
  • 解决Python3中二叉树前序遍历的迭代问题

    解决Python3中二叉树前序遍历的迭代问题

    二叉树是分层数据结构,其中每个父节点最多有 2 个子节点,在今天的文章中,我们将讨论一个在大量技术编码面试中出现的重要主题,对Python二叉树遍历相关知识感兴趣的朋友一起看看吧
    2022-09-09
  • python获取程序执行文件路径的方法(推荐)

    python获取程序执行文件路径的方法(推荐)

    下面小编就为大家分享一篇python获取程序执行文件路径的方法(推荐),具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-04-04

最新评论