Python使用正则匹配实现抓图代码分享

 更新时间:2015年04月02日 09:51:31   作者:ghoulangle  
本文给大家分享的是个人的第一个作品,使用Python正则匹配实现抓图代码,非常的简单实用,推荐给大家,小伙伴们可以自由扩展下。

内涵:正则匹配,正则替换,页面抓取,图片保存 。

实用的第一次 Python 代码 参考

#!/usr/bin/env python
import urllib
import re
 
x=0
def getHtml(url):
 page = urllib.urlopen(url)
 html = page.read()
 return html
 
def getImg(html):
 global x
 reg = 'alt=".+?" src="(.+?\.jpg)"'
 imgre = re.compile(reg)
 imglist = re.findall(imgre,html)
 for imgurl in imglist:
  urllib.urlretrieve(re.sub(r',\d+,\d+',',800,450',imgurl),"img/%s.jpg" % x)
  print "\n"+re.sub(r',\d+,\d+',',800,450',imgurl)+"========"+"img/%s.jpg" % x
  x+=1
 
print 'Starting...'
 
pages = range(1,9)
 
for p in pages:
 html = getHtml('http://m.lovebizhi.com/category/7655/%d/' % p)
 print "\n-------------------------page:%d-------------------------------" % p
 getImg(html)
 
print "\nDone!"

以上所述就是本文给大家分享的全部代码了,本人Python菜鸟,第一个作品,希望对大家能有所帮助。

相关文章

  • 一文搞懂Python中subprocess模块的使用

    一文搞懂Python中subprocess模块的使用

    subprocess是子流程,即进程的意思,该模块可以启动一个新进程,并连接到它们的输入/输出/错误管道,从而获取返回值。本文将和大家聊聊subprocess模块的使用,需要的可以参考一下
    2022-11-11
  • python引入不同文件夹下的自定义模块方法

    python引入不同文件夹下的自定义模块方法

    今天小编就为大家分享一篇python引入不同文件夹下的自定义模块方法。具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-10-10
  • Python搭建HTTP服务器和FTP服务器

    Python搭建HTTP服务器和FTP服务器

    这篇文章主要为大家详细介绍了Python搭建HTTP服务器和FTP服务器的相关资料,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2017-03-03
  • python类方法和静态方法详解

    python类方法和静态方法详解

    这篇文章主要为大家介绍了python类方法和静态方法,具有一定的参考价值,感兴趣的小伙伴们可以参考一下,希望能够给你带来帮助
    2022-01-01
  • Python Pandas 中的 shift() 函数实现数据平移的示例详解

    Python Pandas 中的 shift() 函数实现数据平移的示例详解

    shift() 函数是 Pandas 中用于移动或偏移数据的重要工具,它可以处理时间序列数据、计算数据差值以及进行数据预处理,通过本文的介绍和示例,应该已经掌握了 shift() 函数的基本用法和常见应用场景,感兴趣的朋友一起看看吧
    2024-03-03
  • python Crypto模块的安装与使用方法

    python Crypto模块的安装与使用方法

    本篇文章主要介绍了python Crypto模块的安装与使用方法,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2017-12-12
  • 在pycharm创建scrapy项目的实现步骤

    在pycharm创建scrapy项目的实现步骤

    这篇文章主要介绍了在pycharm创建scrapy项目的实现步骤,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-12-12
  • windows系统中Python多版本与jupyter notebook使用虚拟环境的过程

    windows系统中Python多版本与jupyter notebook使用虚拟环境的过程

    这篇文章主要介绍了windows中Python多版本与jupyter notebook中使用虚拟环境的安装过程,本文分步骤给大家介绍的非常详细,具有一定的参考借鉴价值 ,需要的朋友可以参考下
    2019-05-05
  • 解决django无法访问本地static文件(js,css,img)网页里js,cs都加载不了

    解决django无法访问本地static文件(js,css,img)网页里js,cs都加载不了

    这篇文章主要介绍了解决django无法访问本地static文件(js,css,img)网页里js,cs都加载不了的问题,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-04-04
  • pytorch 实现tensor与numpy数组转换

    pytorch 实现tensor与numpy数组转换

    今天小编就为大家分享一篇使用pytorch 实现tensor与numpy数组转换,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-12-12

最新评论