python字符串编码识别模块chardet简单应用

 更新时间:2015年06月15日 08:55:26   投稿:hebedich  
有时候需要先检测一个文件的编码,然后将其转化为另一种编码。这时候就会用到chardet(chardet是python的一个第三方库,是非常优秀的编码识别模块)

python的字符串编码识别模块(第三方库):

官方地址: http://pypi.python.org/pypi/chardet

 
import chardet
import urllib
 
# 可根据需要,选择不同的数据
TestData = urllib.urlopen('http://www.baidu.com/').read()
print chardet.detect(TestData)
 
# 运行结果:
# {'confidence': 0.99, 'encoding': 'GB2312'}
运行结果表示有99%的概率认为这段代码是GB2312编码方式。
 
import urllib
from chardet.universaldetector import UniversalDetector
usock = urllib.urlopen('http://www.baidu.com/')
# 创建一个检测对象
detector = UniversalDetector()
for line in usock.readlines():
# 分块进行测试,直到达到阈值
detector.feed(line)
if detector.done: break
# 关闭检测对象
detector.close()
usock.close()
# 输出检测结果
print detector.result
 
# 运行结果:
# {'confidence': 0.99, 'encoding': 'GB2312'}

应用背景,如果要对一个大文件进行编码识别,使用这种高级的方法,可以只读一部,去判别编码方式从而提高检测速度。如果希望使用一个检测对象检测多个数据,在每次检测完,一定要运行一下detector.reset()。清除之前的数据。

以上所述就是本文的全部内容了,希望大家能够喜欢。

相关文章

  • 一小时学会TensorFlow2之基本操作2实例代码

    一小时学会TensorFlow2之基本操作2实例代码

    这篇文章主要介绍了TensorFlow2的基本操作和实例代码,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2021-09-09
  • python分析作业提交情况

    python分析作业提交情况

    这篇文章主要为大家详细介绍了python分析作业提交情况,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2017-11-11
  • Python调用百度根据经纬度查询地址的示例代码

    Python调用百度根据经纬度查询地址的示例代码

    今天小编就为大家分享一篇Python调用百度根据经纬度查询地址的示例代码,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-07-07
  • Python实现数据透视表详解

    Python实现数据透视表详解

    今天小编就为大家分享一篇用Python实现数据的透视表的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-10-10
  • 自定义python日志文件系统实例

    自定义python日志文件系统实例

    这篇文章主要介绍了自定义python日志文件系统方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2023-08-08
  • Python NumPy科学计算库的高级应用

    Python NumPy科学计算库的高级应用

    这篇文章主要为大家介绍了Python NumPy科学计算库的高级应用深入详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-07-07
  • python实现邮件自动发送

    python实现邮件自动发送

    这篇文章主要为大家详细介绍了python实现邮件自动发送,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2019-08-08
  • Python打包exe时各种异常处理方案总结

    Python打包exe时各种异常处理方案总结

    今天教大家用Python打包exe时各种异常处理的方案总结,下文中有非常详细的介绍,对正在学习python的小伙伴们很有帮助哟,需要的朋友可以参考下
    2021-05-05
  • 在python3环境下的Django中使用MySQL数据库的实例

    在python3环境下的Django中使用MySQL数据库的实例

    下面小编就为大家带来一篇在python3环境下的Django中使用MySQL数据库的实例。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2017-08-08
  • Python调用C语言的实现

    Python调用C语言的实现

    这篇文章主要介绍了Python调用C语言的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-07-07

最新评论