Python操作lxml库实战之Xpath篇

 更新时间:2022年12月23日 11:22:27   作者:醉蕤  
XPath是一门在XML文档中查找信息的语言,下面这篇文章主要给大家介绍了关于Python操作lxml库实战之Xpath篇的相关资料,文中通过示例代码介绍的非常详细,需要的朋友可以参考下

​一、Xpath概述

1、Xpath简介

Xpath(XML Path Language) 是一门在 XML 文档中查找信息的语言,可以用来在XML文档中对元素和属性进行遍历。XPath 用于在 XML 文档中通过元素和属性进行导航。其是一种路径语言(XML Path Language),用来确定XML文档中某部分的位置。

XPath基于XML的树状结构,提供在数据结构树中找寻节点的能力。起初XPath的提出的初衷是将其作为一个通用的、介于XPointerXSL间的语法模型。但是XPath很快的被开发者采用来当作小型*查询语言被广泛使用。

2、 Xpath的安装

Xpath只是 lxml 库中的一个模块,想要使用 Xpath 那么就需要安装 lxml 库

pip install lxml

二、Xpath的常用规则

1、路径查找

Xpath 的主要语法

2、节点查找

查找节点的一些语法

3、未知节点

当我们匹配时会出现路径不确定的情况,这个时候我们就要涉及到匹配未知节点。匹配未知节点也有对应的语法。

4、获取节点中的文本

通过 属性方法可以获取属性内的内容,但是位于节点之间的内容无法获取到,这个时候就可以通过 text() 与 string() 方法来获得其中的文本。

通过 text() 获取某个节点中的文本

In [1]: page.xpath('//li/a[3]/text()')
Out[1]: ['霸道总裁爱上我', '斗罗大陆']
#通过 text() 属性可以很轻松的获取标签之间的文本。

通过 string() 获取某个节点中的文本

In [1]: page.xpath('string(//li[1]/a[3])')
Out[1]: '霸道总裁爱上我'

5、选取多个路径

需要同时查找多个条件时可以通过在路径表达式中使用管道符("|"),选取若干个路径

In [1]: page.xpath('XXXXXXX | XXXXXXXtext()')
Out[1]: ['']

总结

到此这篇关于Python操作lxml库实战之Xpath篇的文章就介绍到这了,更多相关Python操作lxml库Xpath篇内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Python logging管理不同级别log打印和存储实例

    Python logging管理不同级别log打印和存储实例

    这篇文章主要介绍了Python logging管理不同级别log打印和存储实例,具有一定借鉴价值,需要的朋友可以参考下
    2018-01-01
  • Django数据库连接丢失问题的解决方法

    Django数据库连接丢失问题的解决方法

    这篇文章主要介绍了Django数据库连接丢失问题的解决方法,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2018-12-12
  • Vue中自定义指令的三个常用方法小结

    Vue中自定义指令的三个常用方法小结

    这篇文章主要为大家详细介绍了Vue中自定义指令的三个常用方法,文中的示例代码讲解详细,具有一定的借鉴价值,有需要的小伙伴可以了解一下
    2024-02-02
  • Python Map 函数详解

    Python Map 函数详解

    这篇文章主要为大家介绍了Python Map 函数,具有一定的参考价值,感兴趣的小伙伴们可以参考一下,希望能够给你带来帮助
    2021-12-12
  • pandas的Series类型与基本操作详解

    pandas的Series类型与基本操作详解

    这篇文章主要介绍了pandas的Series类型与基本操作详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-03-03
  • Python插入Elasticsearch操作方法解析

    Python插入Elasticsearch操作方法解析

    这篇文章主要介绍了Python插入Elasticsearch操作方法解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-01-01
  • python解包用法详解

    python解包用法详解

    在本篇文章里小编给大家整理的是关于python解包用法详解内容,有需要的朋友们可以跟着一起学习下。
    2021-02-02
  • Python httplib模块使用实例

    Python httplib模块使用实例

    这篇文章主要介绍了Python httplib模块使用实例,httplib模块是一个底层基础模块,本文讲解了httplib模块的常用方法及使用实例,需要的朋友可以参考下
    2015-04-04
  • Python实现的朴素贝叶斯分类器示例

    Python实现的朴素贝叶斯分类器示例

    这篇文章主要介绍了Python实现的朴素贝叶斯分类器,结合具体实例形式分析了基于Python实现的朴素贝叶斯分类器相关定义与使用技巧,需要的朋友可以参考下
    2018-01-01
  • Django中使用CORS实现跨域请求过程解析

    Django中使用CORS实现跨域请求过程解析

    这篇文章主要介绍了Django中使用CORS实现跨域请求过程解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-08-08

最新评论