Python简单检测文本类型的2种方法【基于文件头及cchardet库】
更新时间:2016年09月18日 11:36:21 作者:RQSLT
这篇文章主要介绍了Python简单检测文本类型的方法,结合实例形式分析了基于基于文件头及cchardet库两种文本类型检测的方法,需要的朋友可以参考下
本文实例讲述了Python简单检测文本类型的方法。分享给大家供大家参考,具体如下:
1、根据文件头。
#是否为带BOM头的UTF8文件
def IsUtf8BomFile(pathfile):
if b'\xef\xbb\xbf' == open(pathfile, mode='rb').read(3)):
return True
return False
2、用cchardet库。
>>> import cchardet
>>> cchardet.detect(open(pathfile, 'rb').read())
{'encoding': 'UTF-8', 'confidence': 0.9900000095367432}
更多关于Python相关内容感兴趣的读者可查看本站专题:《Python文件与目录操作技巧汇总》、《Python文本文件操作技巧汇总》、《Python URL操作技巧总结》、《Python图片操作技巧总结》、《Python数据结构与算法教程》、《Python Socket编程技巧总结》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》及《Python入门与进阶经典教程》
希望本文所述对大家Python程序设计有所帮助。
相关文章
使用Anaconda创建Python指定版本的虚拟环境的教程详解
由于工作的需要和学习的需要,需要创建不同Python版本的虚拟环境,所以这篇文章主要为大家详细介绍了如何使用Anaconda创建Python指定版本的虚拟环境,需要的可以参考下2024-03-03
python数据可视化 – 利用Bokeh和Bottle.py在网页上展示你的数据
本文将展示如何使用python搭建一个网页应用来展示你的数据图表 很多有关于使用python搭建网页应用的文章聚焦在如何教读者搭建一个网页应用(大多是博客),很多关于使用python做数据可视化的文章聚焦在如何教读者使用python的图表库来做可视化2021-10-10
使用sklearn之LabelEncoder将Label标准化的方法
今天小编就为大家分享一篇使用sklearn之LabelEncoder将Label标准化的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧2018-07-07


最新评论