python 如何使用find和find_all爬虫、找文本的实现

 更新时间:2020年10月16日 08:33:44   作者:狗风暴  
这篇文章主要介绍了python 如何使用find和find_all,爬虫、找文本,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧

这篇文章我们来讲讲如何在python使用bs4模块返回值中正确使用find和find_all来取值。

我们先来看看find函数在两种场景使用: 一、 find在字符串(str)时可以查找使用。

在字符串(str)是怎么来使用find函数,find函数就是找到的意思。

我们来看看下面案例

#---------案例1-----------
a='0123456789'#因为我们电脑中的字节都是从0开始算第一个位置
b=a.find('0')#这行代码的意思就是我要查找a中0的位置
print(b)

>>0

#这里就是打印出来的内容

应为0在a中的第0个位置

在来试试第二个案例

#---------案例2-----------
a='0123456789' 
b=a.find('5')#我要查找a中5的位置
print(b)

>>5

其中你要查找的内容不在a中,则会返回 -1 。在str中的使用方法说到这里。

二、 find在bs4模块返回值中怎么使用

我们在课堂上学过,bs4返回的值是 <class 'bs4.BeautifulSoup'>

假设我把把bs4返回的值赋值给 bs

这时我们就要用 bs.find(class_=‘one')

这个代码就是在bs值中从上往下找,找到第一个类等于one的值。

如果下图

在这里插入图片描述

从上到下找是不是我标出来蓝色区域是我要找的类,对的我们把他赋值给one,我们把他打印出来

print('one')

这时候系统就会返回这样一个值给我们,如下图

在这里插入图片描述

大家看,他返回的是从 class='one'开始到这个类标签ul结束,对的,他不会返回其他值,他只会返回这个类的标签开始到结束。

所以当bs4返回值时,第一步使用find找打包含自己要找的所有值中第一个父类,再赋值给函数,这样这个函数就是我们进行下一步查找的对象。

接下俩我们就还可以使用find(找到)或者find_all(找到全部一样的),来定位函数位置,像图中:

在这里插入图片描述

class="navbar-branding"就只有一个,我们像打印出 开发者的网上家园 怎么写

这时候我们假设,上面bs.find(class_='one')赋值给one函数那么我们就从one开始查找
one.find(class="navbar-branding")这样查找出来的内哦让那个就会返回给我们这个区域内容

在这里插入图片描述

然后这个区域的文字再title值里面,我们就没办法直接用 .text 取值了,所以我们要接着查找

one.find(class="navbar-branding")赋值给 one_1

然后用 one_1.find('a')来查找到a标签

后面加一个中括号取值[‘title']这样打印出来内容就是“开发者的网上家园”了。

连起来就是这样写

print(one_1.find('a') ['title'])

下面我们把代码连起来打一遍看图

在这里插入图片描述

看代码

one=bs.find(class_='one')
		one_1=one.find(class="navbar-branding")
	print(one_1.find('a') ['title'])

>>开发者的网上家园
#这就是最后返回的值

就这么简单。

三、 find_all在bs4模块返回值中怎么使用

还是用上图举例

在这里插入图片描述

我们可以看到如果我要取下面的 li 标签中的值怎么办

这时候我们就得用到find_al了(查找全部一样的)

先补充代码到这个li标签的父类

one=bs.find(class_='one')
one_1=one.find(class="navbar-branding")

然后我们用one_1来取值如下代码

one_1.find_all('li')#这时候我们取值了再one_1区域中所有有li便签的内容

他会返回给我们一个列表

列表时这样的

<li>…</li>,<li>…</li>,<li>…</li>,<li>…</li>,<li>…</li>,<li>…</li>

每一个区域就是一个内容,中间的。。。我时为了图省事,其实都是内容。

竟然得到这样的一个列表我们就可以使用for I in one_1.find_all('li')

这样取遍历出这个列表的东西,然后取值,

或者我只要其中一个就是ne_1.find_all('li')[2] 后面加一个数字,

列表取值大家应该都会把,这样就可以定位到我们想要的东西了。

总结一下find就是查找某一项的第一个数据,find_all就是找所有数据,然后用for遍历就能取出

到此这篇关于python 如何使用find和find_all爬虫、找文本的实现的文章就介绍到这了,更多相关python find和find_all爬虫 内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • 详解SQLAlchemy框架使用手册

    详解SQLAlchemy框架使用手册

    SQLAlchemy是一个灵活且功能强大的ORM框架,它可以让Python开发者轻松地管理数据库,本文主要介绍了SQLAlchemy框架使用手册,需要的朋友们下面随着小编来一起学习学习吧
    2023-05-05
  • python 实现非极大值抑制算法(Non-maximum suppression, NMS)

    python 实现非极大值抑制算法(Non-maximum suppression, NMS)

    这篇文章主要介绍了python 如何实现非极大值抑制算法(Non-maximum suppression, NMS),帮助大家更好的进行机器学习,感兴趣的朋友可以了解下
    2020-10-10
  • python 中的 return 解析

    python 中的 return 解析

    这篇文章主要介绍了python 中的 return 解析,return 语句用于退出函数,向调用方返回一个表达式。执行到 return 语句时,会退出函数,return 之后的语句不再执,下文下边就利用举例给大家讲解该内容得相关资料,需要的小伙伴可以参考一下
    2022-02-02
  • Python __slots__的使用方法

    Python __slots__的使用方法

    这篇文章主要介绍了Python __slots__的使用方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-11-11
  • Python生成随机密码

    Python生成随机密码

    这篇文章主要介绍了Python生成随机密码的代码分享,由于是新手,仅仅是简单的实现,未作任何其他处理,小伙伴们自己参考下吧。
    2015-03-03
  • 如何用pandas处理hdf5文件

    如何用pandas处理hdf5文件

    这篇文章主要介绍了如何用pandas处理hdf5文件,帮助大家更好的理解和学习使用python进行数据处理,感兴趣的朋友可以了解下
    2021-03-03
  • Python实现基于多线程、多用户的FTP服务器与客户端功能完整实例

    Python实现基于多线程、多用户的FTP服务器与客户端功能完整实例

    这篇文章主要介绍了Python实现基于多线程、多用户的FTP服务器与客户端功能,结合完整实例形式分析了Python多线程、多用户FTP服务器端与客户端相关实现技巧与注意事项,需要的朋友可以参考下
    2017-08-08
  • python的json包位置及用法总结

    python的json包位置及用法总结

    在本篇内容里小编给大家分享了关于python的json包用法详解内容,需要的朋友们跟着学习下吧。
    2020-06-06
  • python中adb有什么功能

    python中adb有什么功能

    在本篇文章里小编给大家分享的是关于python中adb有功能的知识点总结,有需要的可以跟着学习下。
    2020-06-06
  • Qt通过QGraphicsview实现简单缩放及还原效果

    Qt通过QGraphicsview实现简单缩放及还原效果

    本文主要介绍通过QGraphicsview实现简单的缩放以及缩放后还原原始大小,通过scale可以对view进行放大或缩小,具体内容详情跟随小编一起看看吧
    2021-09-09

最新评论