浅谈Python中的bs4基础

 更新时间:2018年10月21日 11:23:04   作者:回忆不说话  
今天小编就为大家分享一篇关于Python中的bs4基础,小编觉得内容挺不错的,现在分享给大家,具有很好的参考价值,需要的朋友一起跟随小编来看看吧

安装

在命令提示符框中直接输入pip install beautifulsoup4

介绍

beautifulsoup是python的一个第三方库,和xpath一样,都是用来解析html数据的。

引入

from bs4 import BeautifulSoup

使用

将一段文档传入BeautifulSoup的构造方法,就能得到一个文档的对象。

bs = BeautifulSoup(open('index.html',encoding='utf-8'),'lxml')
print(bs)

注意:这样上传文档的话,BeautifulSoup里面需要两个参数。一个为open方法,一个是固定写法,也就是解析器。

open方法里面也同样需要两个参数,一个是想要解析的数据,另一个为设置编码的格式。

(1)获取网页中的title标签

print(bs.title)

(2)获取head标签及标签内部的所有其他标签

print(bs.head)

(3)获取当中的第一个a标签

print(bs.a)

注意:获取文档当中所有的xx当中第一个xx或者第一个xx里面的内容。都可以用bs.xx来获取

(4)获取指定标签的所有属性

print(bs.a.attrs)

(5)获取标签的属性

print(bs.a['href'])

(6)获取标签的文本内容。

print(bs.a.string)

注意:string获取的文本指的是本标签的文本,不包含子标签的文本

(7)contents能够获取指定标签下面的所有内容。

print(bs.body.contents)

(8)获取所有内容当中指定索引的内容

print(bs.div.contents[3])

(9)通过id和类名来找标签

print(bs.find(id='kw'))
print(bs.find(class_='shopping'))

注意:id是唯一的,通过id来找,只能找到一个,所以用find,而class不是唯一的,通过class来找,就有可能找到多个。

(10)select选择指定的标签

print(bs.select('title'))
print(bs.select('a'))

在bs4中,小数点“.”表示类名,#表示id

print(bs.select('.first'))
print(bs.select('#kw'))
print(bs.select('div.now'))

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对脚本之家的支持。如果你想了解更多相关内容请查看下面相关链接

相关文章

  • Django中数据在前后端传递的方式之表单、JSON与ajax

    Django中数据在前后端传递的方式之表单、JSON与ajax

    Django从后台往前台传递数据时有多种方法可以实现,下面这篇文章主要给大家介绍了关于Django中数据在前后端传递的方式之表单、JSON与ajax的相关资料,需要的朋友可以参考下
    2022-10-10
  • Python选课系统开发程序

    Python选课系统开发程序

    这篇文章主要为大家详细介绍了Python选课系统开发程序,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2016-09-09
  • Python获取浏览器Cookies的方法总结

    Python获取浏览器Cookies的方法总结

    在现代网络应用和开发中,使用Cookies是一种常见的方式,它们用于存储用户信息、会话状态等,本文为大家整理了多种Python获取浏览器Cookies的方法,希望对大家有所帮助
    2023-12-12
  • django model通过字典更新数据实例

    django model通过字典更新数据实例

    这篇文章主要介绍了django model通过字典更新数据实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-04-04
  • 使用icecream实现优雅调试Python代码

    使用icecream实现优雅调试Python代码

    在大型项目中,使用print()调试代码可能导致终端输出过多,难以分辨输出结果与代码的对应关系,为了更清晰地调试,可以采用Icecream库,本文介绍了如何使用icecream实现优雅调试Python代码,需要的朋友可以参考下
    2024-08-08
  • pytorch判断是否cuda 判断变量类型方式

    pytorch判断是否cuda 判断变量类型方式

    这篇文章主要介绍了pytorch判断是否cuda 判断变量类型方式,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-06-06
  • 使用OpCode绕过Python沙箱的方法详解

    使用OpCode绕过Python沙箱的方法详解

    这篇文章主要给大家介绍了关于如何使用OpCode绕过Python沙箱的相关资料,文中通过示例代码介绍的非常详细,对大家学习或者使用Python具有一定的参考学习价值,需要的朋友们下面来一起学习学习吧
    2019-09-09
  • 如何用Python生成二维码、解析二维码

    如何用Python生成二维码、解析二维码

    这篇文章主要介绍了如何用Python生成二维码、解析二维码,帮助大家更好的理解和学习使用python,感兴趣的朋友可以了解下
    2021-03-03
  • 基于Python绘制一个摸鱼倒计时界面

    基于Python绘制一个摸鱼倒计时界面

    前端时间推出了一个摸鱼APP,这篇文章将为大家介绍基于Python绘制一个摸鱼倒计时界面,文中的示例代码讲解详细,感兴趣的可以学习一下
    2021-12-12
  • Python通过select实现异步IO的方法

    Python通过select实现异步IO的方法

    这篇文章主要介绍了Python通过select实现异步IO的方法,实例分析了Python中select模块的使用技巧,需要的朋友可以参考下
    2015-06-06

最新评论