Python使用BeautifulSoup解析并获取图片的实战分享

更新时间：2024年06月05日 08:50:13 作者：江禾藜

这篇文章主要介绍了Python使用BeautifulSoup解析并获取图片的实战分享,文中通过代码和图文结合的方式给大家讲解的非常详细,对大家的学习或工作有一定的帮助,需要的朋友可以参考下

一、前言

在本文我们将以下面的例子带着大家去看看在实战中是如何运用的。

目标url：https://www.58pic.com/tupian/1272.html

二、数据分析

根据下图所示，图片被保存至img标签下，并且class值为lazy。当然这个网站除了lazy的img标签还有其他的(比如：class="lazy-bg-img")，这个可以自己想办法处理一下，如何去获取所有跟图片有关的img标签。

三、数据获取及展示

数据获取

 '''
 爬虫：
 
 目标网站：https://www.58pic.com/c/27075257
 
 任务需求：1、抓取第一页前36张图片   2、使用bs4解析
 '''
 import time
 
 import requests
 from bs4 import BeautifulSoup
 
 
 class Image(object):
     def __init__(self):
         self.headers = {
             'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/116.0.0.0 Safari/537.36 Edg/116.0.1938.62'
         }
 
     def parse_url(self,url):
         print('开始分析')
         resp = requests.get(url,headers=self.headers)
         #print(resp.text)
         if resp.status_code == 200:
             soup = BeautifulSoup(resp.text,'lxml')
             image_list = soup.find_all('img',class_='lazy-bg-img',limit=36)
             #print(image_list)
             for data in image_list:
                 title = data.get('alt')
                 # print(title)
                 print(f"开始下载 {title}")
                 img_url = 'https:'+data.get('data-original')
                 self.image_save(title,img_url)
         else:
             return None
 
     def image_save(self,title,url):
         resp = requests.get(url,headers=self.headers)
         content = resp.content
         with open('./img/'+title+'.jpg',mode='wb')as f:
             f.write(content)
 
 if __name__ == '__main__':
     t = time.time()
     url='https://www.58pic.com/tupian/1272.html'
     image = Image()
     image.parse_url(url)
     print("总共耗时：",time.time()-t)

最终效果展示

四、结语

根据示例，我们会发现通过bs4解析可以很快速的根据标签的特殊性得到我们想要的数据。但要注意，有时候我们得到的响应内容会与F12打开看到的不同，所有在发现没有拿到数据的时候，请考虑我们得到的相应内容里面究竟是什么样子的。

到此这篇关于Python使用BeautifulSoup解析并获取图片的实战分享的文章就介绍到这了,更多相关Python BeautifulSoup获取图片内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

您可能感兴趣的文章:

Python运算符+与+=的方法实例
这篇文章主要介绍了Python运算符+与+=的相关资料，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2021-02-02
python 3.6.2 安装配置方法图文教程
这篇文章主要为大家详细介绍了python 3.6.2 安装配置方法图文教程，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2018-09-09
浅谈django开发者模式中的autoreload是如何实现的
下面小编就为大家带来一篇浅谈django开发者模式中的autoreload是如何实现的。小编觉得挺不错的，现在就分享给大家，也给大家做个参考。一起跟随小编过来看看吧
2017-08-08
windows python3安装Jupyter Notebooks教程
这篇文章主要介绍了windows python3安装Jupyter Notebooks教程，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2020-04-04
python自动获取微信公众号最新文章的实现代码
这篇文章主要介绍了python自动获取微信公众号最新文章,本文通过实例代码给大家介绍的非常详细，对大家的学习或工作具有一定的参考借鉴价值，需要的朋友可以参考下
2022-07-07
python如何绘制登陆时的卫星云图(TBB)
这篇文章主要介绍了python如何绘制登陆时的卫星云图(TBB),具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
2023-08-08
python办公自动化之读取本地OUTLOOK客户端邮件
这篇文章主要为大家详细介绍了如何使用python实现读取本地OUTLOOK客户端邮件,文中的示例代码讲解详细,具有一定的参考价值,需要的小伙伴可以了解下
2023-10-10
python查找第k小元素代码分享
这篇文章分享了python查找第k小的元素程序代码，大家参考使用吧
2013-12-12
Pytorch中transforms.Resize()的简单使用
这篇文章主要介绍了Pytorch中transforms.Resize()的简单使用方式，具有很好的参考价值，希望对大家有所帮助。如有错误或未考虑完全的地方，望不吝赐教
2022-07-07
用Python编写一个简单的俄罗斯方块游戏的教程
这篇文章主要介绍了用Python编写一个简单的俄罗斯方块游戏的教程,编写俄罗斯方块几乎是每门编程语言基础学习后的必备实践,需要的朋友可以参考下
2015-04-04