python抓取网页中链接的静态图片

 更新时间:2018年01月29日 11:45:46   作者:zoujm-hust12  
这篇文章主要为大家详细介绍了python抓取网页中链接的静态图片,具有一定的参考价值,感兴趣的小伙伴们可以参考一下

本文实例为大家分享了python抓取网页中链接的静态图片的具体代码,供大家参考,具体内容如下

# -*- coding:utf-8 -*- 
 
#http://tieba.baidu.com/p/2460150866 
#抓取图片地址 
 
from bs4 import BeautifulSoup 
import urllib.request 
from time import sleep 
 
html_doc = "http://tieba.baidu.com/p/2460150866" 
 
def get_image(url): 
 req = urllib.request.Request(url) 
 webpage = urllib.request.urlopen(req) 
 
 html = webpage.read() 
 soup = BeautifulSoup(html, 'html.parser') 
 
 #抓取图片地址 
 #抓取img标签且class为BDE_Image的所有内容 
 img_src=soup.findAll("img",{'class':'BDE_Image'}) 
 i = 1 
 for img in img_src: 
  img_url = img.get('src') #抓取src 
 # print(img) 
  req = urllib.request.Request(img_url) 
  u = urllib.request.urlopen(req) 
  data = u.read() 
  with open("AutoCodePng20180119-"+str(i)+".jpg", 'wb') as f: 
   sleep(2) 
   f.write(data) 
   i += 1 
 
def getImg(url): 
 html = urllib.request(url) 
 page = html.read() 
 soup = BeautifulSoup(page, "html.parser") 
 imglist = soup.find_all('img') #发现html中带img标签的数据,输出格式为<img xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx,存入集合 
 lenth = len(imglist) #计算集合的个数 
 for i in range(lenth): 
  print imglist[i].attrs['src'] #抓取img中属性为src的信息,例如<img src="123456" xxxxxxxxxxxxxxxx,则输出为123456 

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。

相关文章

  • Python的函数使用示例详解

    Python的函数使用示例详解

    在Python的函数中,我们将其分为内置函数、自定义函数、main函数三个模块,当然,使用的过程中会涉及到变量以及参数,这些都会举例进行说明,对Python函数使用相关知识感兴趣的朋友跟随小编一起看看吧
    2021-12-12
  • 使用Keras实现Tensor的相乘和相加代码

    使用Keras实现Tensor的相乘和相加代码

    这篇文章主要介绍了使用Keras实现Tensor的相乘和相加代码,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-06-06
  • Python实现的数据结构与算法之队列详解

    Python实现的数据结构与算法之队列详解

    这篇文章主要介绍了Python实现的数据结构与算法之队列,详细分析了队列的定义、功能与Python实现队列的相关技巧,以及具体的用法,需要的朋友可以参考下
    2015-04-04
  • python psutil库安装教程

    python psutil库安装教程

    这篇文章给大家介绍了python psutil库安装教程,首先要确认本机已安装python环境,具体安装过程大家参考下本文
    2018-03-03
  • 初学Python实用技巧两则

    初学Python实用技巧两则

    这篇文章主要介绍了初学Python实用技巧两则,包括可变参数的应用级execfile函数的用法,需要的朋友可以参考下
    2014-08-08
  • python删除列表元素的三种方法(remove,pop,del)

    python删除列表元素的三种方法(remove,pop,del)

    这篇文章主要介绍了python删除列表元素的三种方法(remove,pop,del),文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-07-07
  • Python机器学习iris数据集预处理和模型训练方式

    Python机器学习iris数据集预处理和模型训练方式

    iris数据集包含150个样本,每个样本有4个特征及其类别信息,本文介绍了iris数据集的基本操作和如何使用knn模型进行花卉种类预测,是机器学习中的经典案例,适用于监督式学习
    2024-10-10
  • matplotlib之轻松解决中文乱码的问题

    matplotlib之轻松解决中文乱码的问题

    这篇文章主要介绍了matplotlib之轻松解决中文乱码的问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2023-09-09
  • PyQt5每天必学之日历控件QCalendarWidget

    PyQt5每天必学之日历控件QCalendarWidget

    这篇文章主要为大家详细介绍了PyQt5每天必学之日历控件QCalendarWidget,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-04-04
  • 用Python下载一个网页保存为本地的HTML文件实例

    用Python下载一个网页保存为本地的HTML文件实例

    今天小编就为大家分享一篇用Python下载一个网页保存为本地的HTML文件实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-05-05

最新评论