Python正则表达式匹配HTML页面编码

 更新时间:2015年04月08日 09:17:52   投稿:junjie  
这篇文章主要介绍了Python正则表达式匹配HTML页面编码,本文直接给出代码和匹配实例,需要的朋友可以参考下

html页面一般都会指定一个编码,如何获取到是处理html页面的第一步,因为错误的编码必然带来后面处理的问题。这里我用python的正则表达式写了个:

import re

a = ["<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />",
   '<meta http-equiv=Content-Type content="text/html;charset=gb2312">',
   '<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">',
   '<meta http-equiv="Content-Type" content="text/html; charset=gb2312" />',
   '<meta http-equiv="content-type" content="text/html; charset=utf-8" />',
   '<meta http-equiv="Content-Type" content="text/html; charset=gb2312" />',
   '<meta http-equiv="Content-Type" content="text/html; charset=gb2312" />'
   ]



b = "<meta[ ]+http-equiv=["']?content-type["']?[ ]+content=["']?text/html;[ ]*charset=([0-9-a-zA-Z]+)["']?"


B = re.compile(b, re.IGNORECASE)


for ax in a:
  r1 = B.search(ax)

  if r1:
    print r1.group()
    print r1.group(1), len(r1.group())
  else:
    print 'not match'

相关文章

  • Python threading模块中lock与Rlock的使用详细讲解

    Python threading模块中lock与Rlock的使用详细讲解

    python的thread模块是比较底层的模块,python的threading模块是对thread做了一些包装的,可以更加方便的被使用。这篇文章主要介绍了Python threading模块中lock与Rlock的使用
    2022-10-10
  • Django Model层F,Q对象和聚合函数原理解析

    Django Model层F,Q对象和聚合函数原理解析

    这篇文章主要介绍了Django Model层F,Q对象和聚合函数原理解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-11-11
  • python冒泡排序算法的实现代码

    python冒泡排序算法的实现代码

    这篇文章主要介绍了python冒泡排序算法的实现代码,大家参考使用
    2013-11-11
  • keras-siamese用自己的数据集实现详解

    keras-siamese用自己的数据集实现详解

    这篇文章主要介绍了keras-siamese用自己的数据集实现详解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-06-06
  • python解析xml文件方式(解析、更新、写入)

    python解析xml文件方式(解析、更新、写入)

    这篇文章主要介绍了python解析xml文件方式(解析、更新、写入),具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-03-03
  • python实战之用emoji表情生成文字

    python实战之用emoji表情生成文字

    这篇文章主要介绍了python实战之用emoji表情生成文字,文中有非常详细的代码示例,对正在学习python的小伙伴们有很好地帮助,需要的朋友可以参考下
    2021-05-05
  • 如何搜索查找并解决Django相关的问题

    如何搜索查找并解决Django相关的问题

    每个程序员都会在开发过程中遇到这样或那样的问题, 有时光靠一个人是无法解决所有问题的, 所以我们应该找到适当的地方提问.
    2014-06-06
  • 基于Python实现五子棋游戏

    基于Python实现五子棋游戏

    这篇文章主要为大家详细介绍了基于Python实现五子棋游戏,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2022-04-04
  • pytorch中[..., 0]的用法说明

    pytorch中[..., 0]的用法说明

    这篇文章主要介绍了pytorch中[..., 0]的用法说明,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2021-05-05
  • python实现学生信息管理系统

    python实现学生信息管理系统

    这篇文章主要为大家详细介绍了python实现学生信息管理系统,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-03-03

最新评论