使用Python保存网页上的图片或者保存页面为截图

 更新时间:2016年03月05日 14:47:28   作者:j_akill  
这篇文章主要介绍了使用Python保存网页上的图片或者保存页面为截图的方法,保存网页图片主要用到urllib模块,即简单的爬虫原理,需要的朋友可以参考下

Python保存网页图片
这个是个比较简单的例子,网页中的图片地址都是使用'http://。。。。.jpg'这种方式直接定义的。

使用前,可以先建立好一个文件夹用于保存图片,本例子中使用的文件夹是 d:\\pythonPath这个文件夹

代码如下:

# -*- coding: UTF-8 -*- 
import os,re,urllib,uuid 
 
#首先定义云端的网页,以及本地保存的文件夹地址 
urlPath='http://gamebar.com/' 
localPath='d:\\pythonPath' 
 
 
#从一个网页url中获取图片的地址,保存在 
#一个list中返回 
def getUrlList(urlParam): 
  urlStream=urllib.urlopen(urlParam) 
  htmlString=urlStream.read() 
  if( len(htmlString)!=0 ): 
    patternString=r'http://.{0,50}\.jpg' 
    searchPattern=re.compile(patternString) 
    imgUrlList=searchPattern.findall(htmlString) 
    return imgUrlList 
 
     
#生成一个文件名字符串  
def generateFileName(): 
  return str(uuid.uuid1()) 
 
   
#根据文件名创建文件  
def createFileWithFileName(localPathParam,fileName): 
  totalPath=localPathParam+'\\'+fileName 
  if not os.path.exists(totalPath): 
    file=open(totalPath,'a+') 
    file.close() 
    return totalPath 
   
 
#根据图片的地址,下载图片并保存在本地  
def getAndSaveImg(imgUrl): 
  if( len(imgUrl)!= 0 ): 
    fileName=generateFileName()+'.jpg' 
    urllib.urlretrieve(imgUrl,createFileWithFileName(localPath,fileName)) 
 
 
#下载函数 
def downloadImg(url): 
  urlList=getUrlList(url) 
  for urlString in urlList: 
    getAndSaveImg(urlString) 
     
downloadImg(urlPath) 

保存的文件如下:

201635144749913.jpg (755×329)


网页的一部分保存为图片
主要思路是selenium+phantomjs(中文网页需要设置字体)+PIL切图

def webscreen():
  url = 'http://www.xxx.com'
  driver = webdriver.PhantomJS()
  driver.set_page_load_timeout(300)
  driver.set_window_size(1280,800)
  driver.get(url)
  imgelement = driver.find_element_by_id('XXXX')
  location = imgelement.location
  size = imgelement.size
  savepath = r'XXXX.png'
  driver.save_screenshot(savepath)
  im = Image.open(savepath)
  left = location['x']
  top = location['y']
  right = left + size['width']
  bottom = location['y'] + size['height']
  im = im.crop((left,top,right,bottom))
  im.save(savepath)

相关文章

  • python3.5实现socket通讯示例(TCP)

    python3.5实现socket通讯示例(TCP)

    本篇文章主要介绍了python3.5实现socket通讯示例(TCP),小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2017-02-02
  • python实现猜数字游戏(无重复数字)示例分享

    python实现猜数字游戏(无重复数字)示例分享

    这篇文章主要介绍了python实现猜数字游戏(无重复数字)示例,需要的朋友可以参考下
    2014-03-03
  • pytorch DataLoaderj基本使用方法详解

    pytorch DataLoaderj基本使用方法详解

    这篇文章主要为大家介绍了pytorch DataLoaderj基本使用方法详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-04-04
  • 在Pandas中导入CSV数据时去除默认索引的方法汇总

    在Pandas中导入CSV数据时去除默认索引的方法汇总

    在Pandas中读取CSV数据时,会默认将第一列设为索引列index,但有时候我们并不需要索引,或者希望指定自己的索引列,本文将介绍几种在Pandas中导入CSV数据时去除默认索引的方法,需要的朋友可以参考下
    2023-05-05
  • 浅谈django rest jwt vue 跨域问题

    浅谈django rest jwt vue 跨域问题

    这篇文章主要介绍了django rest jwt vue 跨域问题,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2018-10-10
  • Python 探针的实现原理

    Python 探针的实现原理

    本文将简单讲述一下 Python 探针的实现原理。 同时为了验证这个原理,我们也会一起来实现一个简单的统计指定函数执行时间的探针程序。
    2016-04-04
  • python图片验证码识别最新模块muggle_ocr的示例代码

    python图片验证码识别最新模块muggle_ocr的示例代码

    这篇文章主要介绍了python图片验证码识别最新模块muggle_ocr的相关知识,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-07-07
  • python导入pandas具体步骤方法

    python导入pandas具体步骤方法

    在本篇文章中小编给大家分享了关于python导入pandas的相关知识点内容,有兴趣的朋友们参考学习下。
    2019-06-06
  • Python安装jieba库详细教程

    Python安装jieba库详细教程

    jieba库是一款优秀的 Python 第三方中文分词库,jieba 支持三种分词模式:精确模式、全模式和搜索引擎模式,这篇文章主要介绍了Python安装jieba库教程,需要的朋友可以参考下
    2023-03-03
  • Python字节码与程序执行过程详解

    Python字节码与程序执行过程详解

    这篇文章主要为大家介绍了Python字节码与程序执行过程详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2022-05-05

最新评论