Python对HTML转义字符进行反转义的实现方法

 更新时间:2019年04月28日 15:08:18   投稿:zx  
这篇文章主要介绍了Python对HTML转义字符进行反转义的实现方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧

什么是转义字符

在 HTML 中 <、>、& 等字符有特殊含义(<,> 用于标签中,& 用于转义),他们不能在 HTML 代码中直接使用,如果要在网页中显示这些符号,就需要使用 HTML 的转义字符串(Escape Sequence),例如 < 的转义字符是 <,浏览器渲染 HTML 页面时,会自动把转移字符串换成真实字符。

转义字符(Escape Sequence)由三部分组成:第一部分是一个 & 符号,第二部分是实体(Entity)名字,第三部分是一个分号。 比如,要显示小于号(<),就可以写< 。

Python 转义字符串反转义

用 Python 来处理转义字符串有多种方式,而且 py2 和 py3 中处理方式不一样,在 python2 中,反转义的模块是 HTMLParser。

# Python2
import HTMLParser
>>> HTMLParser().unescape('param=p1&amp;param=p2')
'param=p1&param=p2'

Python3 HTMLParser 模块迁移到了 html.parser

# Python3
>>> from html.parser import HTMLParser
>>> HTMLParser().unescape('param=p1&amp;param=p2')
'param=p1&param=p2'

到 python3.4 以后的版本,在 html 模块新增了 unescape 方法。

# Python3.4
>>> import html
>>> html.unescape('param=p1&amp;param=p2')
'param=p1&param=p2'

推荐最后一种写法,因为 HTMLParser.unescape 方法在 Python3.4 就已经被废弃掉不推荐使用了,意味着之后的版本会被彻底移除。

另外,xml的sax模块也有支持反转义的函数

>>> from xml.sax.saxutils import unescape
>>> unescape('param=p1&amp;param=p2')
'param=p1&param=p2'

当然,你完全可以实现自己的反转义功能,不复杂,当然,我们崇尚不重复造轮子。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。

相关文章

  • python 全局变量的import机制介绍

    python 全局变量的import机制介绍

    在之前学习python设计模式(工厂模式实践篇),希望使用全局变量代替c++的宏完成服务自动注册功能时,遇到过一个问题,全局变量的定义和使用放在同一个可执行脚本中的问题
    2017-09-09
  • Python编程实现小姐姐跳舞并生成词云视频示例

    Python编程实现小姐姐跳舞并生成词云视频示例

    本文用Python做了一个词云视频,以另一种角度来看小姐姐跳舞视频左半部分是小姐姐跳舞视频,右半部分是根据动作生成的的词云视频,有需要的朋友可以借鉴参考下
    2021-10-10
  • Python如何利用正则表达式爬取网页信息及图片

    Python如何利用正则表达式爬取网页信息及图片

    这篇文章主要给大家介绍了关于Python如何利用正则表达式爬取网页信息及图片的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-04-04
  • 微软开源最强Python自动化神器Playwright(不用写一行代码)

    微软开源最强Python自动化神器Playwright(不用写一行代码)

    这篇文章主要介绍了微软开源最强Python自动化神器Playwright(不用写一行代码),文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-01-01
  • 图文详解感知机算法原理及Python实现

    图文详解感知机算法原理及Python实现

    感知机是二类分类的线性分类模型,其输入为实例的特征向量,输出为实例的类别(取+1和-1二值)。本文将为大家详细讲讲感知机算法的原理及实现,需要的可以参考一下
    2022-08-08
  • Python 生成短8位唯一id实战教程

    Python 生成短8位唯一id实战教程

    这篇文章主要介绍了Python 生成短8位唯一id实战教程,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-01-01
  • Python提取转移文件夹内所有.jpg文件并查看每一帧的方法

    Python提取转移文件夹内所有.jpg文件并查看每一帧的方法

    今天小编就为大家分享一篇Python提取转移文件夹内所有.jpg文件并查看每一帧的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-06-06
  • Jupyter Notebook出现不是内部或外部的命令解决方案

    Jupyter Notebook出现不是内部或外部的命令解决方案

    这篇文章主要介绍了Jupyter Notebook出现不是内部或外部的命令解决方案,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2023-06-06
  • 一文详解如何使用Python批量拼接图片

    一文详解如何使用Python批量拼接图片

    这篇文章主要给大家介绍了关于如何使用Python批量拼接图片的相关资料,文中主要用的是PIL库,PIL库是一个具有强大图像处理能力的第三方库,不仅包含了丰富的像素、色彩操作功能,还可以用于图像归档和批量处理,需要的朋友可以参考下
    2023-05-05
  • Python list与NumPy array 区分详解

    Python list与NumPy array 区分详解

    这篇文章主要介绍了Python list与NumPy array 区分详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-11-11

最新评论