Python对HTML转义字符进行反转义的实现方法

 更新时间:2019年04月28日 15:08:18   投稿:zx  
这篇文章主要介绍了Python对HTML转义字符进行反转义的实现方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧

什么是转义字符

在 HTML 中 <、>、& 等字符有特殊含义(<,> 用于标签中,& 用于转义),他们不能在 HTML 代码中直接使用,如果要在网页中显示这些符号,就需要使用 HTML 的转义字符串(Escape Sequence),例如 < 的转义字符是 <,浏览器渲染 HTML 页面时,会自动把转移字符串换成真实字符。

转义字符(Escape Sequence)由三部分组成:第一部分是一个 & 符号,第二部分是实体(Entity)名字,第三部分是一个分号。 比如,要显示小于号(<),就可以写< 。

Python 转义字符串反转义

用 Python 来处理转义字符串有多种方式,而且 py2 和 py3 中处理方式不一样,在 python2 中,反转义的模块是 HTMLParser。

# Python2
import HTMLParser
>>> HTMLParser().unescape('param=p1&amp;param=p2')
'param=p1&param=p2'

Python3 HTMLParser 模块迁移到了 html.parser

# Python3
>>> from html.parser import HTMLParser
>>> HTMLParser().unescape('param=p1&amp;param=p2')
'param=p1&param=p2'

到 python3.4 以后的版本,在 html 模块新增了 unescape 方法。

# Python3.4
>>> import html
>>> html.unescape('param=p1&amp;param=p2')
'param=p1&param=p2'

推荐最后一种写法,因为 HTMLParser.unescape 方法在 Python3.4 就已经被废弃掉不推荐使用了,意味着之后的版本会被彻底移除。

另外,xml的sax模块也有支持反转义的函数

>>> from xml.sax.saxutils import unescape
>>> unescape('param=p1&amp;param=p2')
'param=p1&param=p2'

当然,你完全可以实现自己的反转义功能,不复杂,当然,我们崇尚不重复造轮子。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。

相关文章

  • 详解Python if-elif-else知识点

    详解Python if-elif-else知识点

    本篇文章给大家总结了Python中if-elif-else的相关知识点以及语法相关内容,有兴趣的朋友参考学习下。
    2018-06-06
  • Python Celery多队列配置代码实例

    Python Celery多队列配置代码实例

    这篇文章主要介绍了Python Celery多队列配置代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-11-11
  • 通过实例浅析Python对比C语言的编程思想差异

    通过实例浅析Python对比C语言的编程思想差异

    这篇文章主要介绍了通过实例浅析Python对比C语言的编程思想差异,作为面向对象和面向过程的编程语言代表,二者的对比可谓经典,需要的朋友可以参考下
    2015-08-08
  • Python利用LyScript插件实现批量打开关闭进程

    Python利用LyScript插件实现批量打开关闭进程

    LyScript是一款x64dbg主动化操控插件,经过Python操控X64dbg,完成了远程动态调试,解决了逆向工作者剖析漏洞,寻觅指令片段,原生脚本不行强壮的问题。本文将利用LyScript插件实现批量打开关闭进程,感兴趣的可以了解一下
    2022-07-07
  • 如何将Python脚本打包成exe应用程序介绍

    如何将Python脚本打包成exe应用程序介绍

    大家好,本篇文章主要讲的是如何将Python脚本打包成exe应用程序介绍,感兴趣的同学赶快来看一看吧,对你有帮助的话记得收藏一下
    2022-02-02
  • 超全Python图像处理讲解(多模块实现)

    超全Python图像处理讲解(多模块实现)

    这篇文章主要介绍了超全Python图像处理讲解(多模块实现),文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-04-04
  • Python多继承原理与用法示例

    Python多继承原理与用法示例

    这篇文章主要介绍了Python多继承原理与用法,简单描述了Python多继承的相关概念、原理并结合实例形式分析了Python多继承的具体定义、使用方法及相关操作注意事项,需要的朋友可以参考下
    2018-08-08
  • Tensorflow与RNN、双向LSTM等的踩坑记录及解决

    Tensorflow与RNN、双向LSTM等的踩坑记录及解决

    这篇文章主要介绍了Tensorflow与RNN、双向LSTM等的踩坑记录及解决方案,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2021-05-05
  • 20行Python代码实现视频字符化功能

    20行Python代码实现视频字符化功能

    这篇文章主要介绍了20行Python代码实现视频字符化功能,本文通过实例代码截图的形式给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-04-04
  • Python实现计算函数或程序执行时间

    Python实现计算函数或程序执行时间

    在Python程序的开发过程中,一些程序需要获取函数或程序的开始时间、结束时间和时间间隔等内容用来分析和处理内容。本文就来聊聊具体实现方法
    2023-02-02

最新评论