Python实现简单的获取图片爬虫功能示例

 更新时间:2017年07月12日 08:50:24   作者:微烟波  
这篇文章主要介绍了Python实现简单的获取图片爬虫功能,涉及Python使用urllib模块及正则模块操作页面元素获取图片的相关技巧,需要的朋友可以参考下

本文实例讲述了Python实现简单的获取图片爬虫功能。分享给大家供大家参考,具体如下:

简单Python爬虫,获得网页上的照片

#coding=utf-8
import urllib
import re
def getHtml(url):
  page = urllib.urlopen(url)
  html = page.read()
  return html
def getImg(html):
  reg = r'src="(.+?\.jpg)" pic_ext'
  imgre = re.compile(reg)
  imglist = re.findall(imgre, html)
  return imglist
// 网站地址
url = "http://tieba.baidu.com/p/3368048910?pn=2"
html = getHtml(url)
listimg = getImg(html)
x = 0
for imgAddress in listimg:
  print imgAddress
  urllib.urlretrieve(imgAddress, 'image%s.jpg' % x)
  x+=1

更多关于Python相关内容可查看本站专题:《Python Socket编程技巧总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总

希望本文所述对大家Python程序设计有所帮助。

相关文章

  • 设置python3为默认python的方法

    设置python3为默认python的方法

    我们知道在Windows下多版本共存的配置方法就是改可执行文件的名字,配置环境变量。接下来通过本文给大家介绍设置python3为默认python的方法,一起看看吧
    2018-10-10
  • Python2与Python3的区别实例总结

    Python2与Python3的区别实例总结

    这篇文章主要介绍了Python2与Python3的区别,结合实例形式总结分析了Python2与Python3打印输出、编码、数值运算、异常处理等使用区别,需要的朋友可以参考下
    2019-04-04
  • python流水线框架pypeln的安装使用教程

    python流水线框架pypeln的安装使用教程

    这篇文章主要介绍了python流水线框架pypeln的安装使用教程,通过安装pip install pypeln,基本元素在文中给大家介绍过,需要的朋友可以参考下
    2021-05-05
  • pytorch矩阵乘法的实现

    pytorch矩阵乘法的实现

    本文主要介绍了pytorch矩阵乘法的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2023-11-11
  • python利用7z批量解压rar的实现

    python利用7z批量解压rar的实现

    这篇文章主要介绍了python利用7z批量解压rar的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-08-08
  • Python第三方模块apscheduler安装和基本使用

    Python第三方模块apscheduler安装和基本使用

    本文主要介绍了Python第三方模块apscheduler安装和基本使用,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2023-03-03
  • 举例讲解Python中的迭代器、生成器与列表解析用法

    举例讲解Python中的迭代器、生成器与列表解析用法

    这篇文章主要介绍了Python中的迭代器、生成器与列表解析用法,还对Python3.x版本中的一些改变作出了提示,需要的朋友可以参考下
    2016-03-03
  • Python的deque双端队列详解

    Python的deque双端队列详解

    这篇文章主要介绍了Python的deque双端队列详解,deque(双端队列)是一种数据结构,允许使用O(1)时间复杂度从两端添加和删除元素, Python的deque类实现了此数据结构,需要的朋友可以参考下
    2023-09-09
  • 10个必须要掌握的Python内置函数

    10个必须要掌握的Python内置函数

    Python 解释器自带的函数叫做 内置函数,这些函数不需要import 导入就可以直接使用。本文小编为大家总结了十个必须要掌握的Python内置函数,实用且高效,需要的可以参考一下
    2022-02-02
  • Python新版极验验证码识别验证码教程详解

    Python新版极验验证码识别验证码教程详解

    这篇文章主要介绍了Python新版极验验证码识别验证码,极验验证是一种在计算机领域用于区分自然人和机器人的,通过简单集成的方式,为开发者提供安全、便捷的云端验证服务
    2023-02-02

最新评论