Python数据解析bs4库使用BeautifulSoup方法示例

 更新时间:2023年08月21日 09:59:25   作者:YiYa_咿呀  
这篇文章主要为大家介绍了Python数据解析bs4库使用BeautifulSoup方法示例,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪

1. 安装bs4库

pip install bs4

2. 使用beautiful soup

用法如下:

find_all:find_all找到所有符合条件的节点

find:find指的是找第一个符合条件的节点

calss_:因为和python中的关键字class重合,因此在后面加个_加以区分

attrs={"":""}:attrs的对象存储条件,此时的class无需加_

import requests
from bs4 import BeautifulSoup
import re
url = "http://www.crazyant.net/"
r = requests.get(url)
if r.status_code != 200:
    raise Exception()
html_doc = r.text
# 创建beautiful soup,将爬取的内容通过BeautifulSoup解析,这里告诉BeautifulSoup这个是爬取到的html页面,默认也是这个,但是会发出警告
soup = BeautifulSoup(html_doc,"html.parser")
# find_all找到所有符合条件的节点,find指的是找第一个
h2_nodes = soup.find_all("h2",class_="entry-title")

3. 使用bs4爬取优美图库的图片

from bs4 import BeautifulSoup
import requests
import time
url = "https://www.umei.cc/weimeitupian/oumeitupian/nvsheng.htm"
resp = requests.get(url)
resp.encoding = 'utf-8'
page = resp.text
soup = BeautifulSoup(page,'html.parser')
oAs = soup.find("div",class_='pic-list').find_all('a')
aLinks = []
for a in oAs:
    aLinks.append("https://www.umei.cc"+str(a.get("href")))
print(aLinks)
for link in aLinks:
    content = requests.get(link)
    content.encoding = 'utf-8'
    img = BeautifulSoup(content.text,'html.parser').find("div",class_='big-pic').find('img')
    src = img.get("src")
    print(img)
    print(src)
    img_name = src.split('/')[-1]
    img_resp = requests.get(src)
    with open('img/'+img_name,mode = "wb") as f:
        f.write(img_resp.content)
    time.sleep(1)
f.close()
resp.close()
img_resp.close()

结果:

以上就是Python数据解析bs4库使用BeautifulSoup方法示例的详细内容,更多关于Python bs4 BeautifulSoup的资料请关注脚本之家其它相关文章!

相关文章

  • python Pexpect 实现输密码 scp 拷贝的方法

    python Pexpect 实现输密码 scp 拷贝的方法

    今天小编就为大家分享一篇python Pexpect 实现输密码 scp 拷贝的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-01-01
  • 基于python中staticmethod和classmethod的区别(详解)

    基于python中staticmethod和classmethod的区别(详解)

    下面小编就为大家带来一篇基于python中staticmethod和classmethod的区别(详解)。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2017-10-10
  • Python3安装pip工具的详细步骤

    Python3安装pip工具的详细步骤

    这篇文章主要介绍了Python3安装pip工具的详细步骤,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-10-10
  • Python JSON格式数据的提取和保存的实现

    Python JSON格式数据的提取和保存的实现

    这篇文章主要介绍了Python JSON格式数据的提取和保存的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-03-03
  • numpy多级排序lexsort函数的使用

    numpy多级排序lexsort函数的使用

    本文主要介绍了numpy多级排序lexsort函数的使用,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2023-03-03
  • python文件排序的方法总结

    python文件排序的方法总结

    在本篇内容里小编给各位整理的是一篇关于python文件排序的方法总结,有需要的朋友们可以参考下。
    2020-09-09
  • Python实现GUI学生信息管理系统

    Python实现GUI学生信息管理系统

    这篇文章主要为大家详细介绍了Python实现GUI学生信息管理系统,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-01-01
  • python编写的最短路径算法

    python编写的最短路径算法

    本文给大家分享的是python 无向图最短路径算法:请各位大大指教,继续改进。(修改了中文字符串,使py2exe中文没烦恼),需要的朋友可以参考下
    2015-03-03
  • keras的三种模型实现与区别说明

    keras的三种模型实现与区别说明

    这篇文章主要介绍了keras的三种模型实现与区别说明,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-07-07
  • Python图像处理之目标物体轮廓提取的实现方法

    Python图像处理之目标物体轮廓提取的实现方法

    目标物体的轮廓实质是指一系列像素点构成,这些点构成了一个有序的点集,这篇文章主要给大家介绍了关于Python图像处理之目标物体轮廓提取的实现方法,需要的朋友可以参考下
    2021-08-08

最新评论