Python3 中文文件读写方法

 更新时间:2018年01月23日 15:08:59   作者:SuPhoebe  
下面小编就为大家分享一篇Python3 中文文件读写方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧

字符串在Python内部的表示是Unicode编码,因此,在做编码转换时,通常需要以Unicode作为中间编码,即先将其他编码的字符串解码(decode)成Unicode,再从Unicode编码(encode)成另一种编码。

在新版本的python3中,取消了unicode类型,代替它的是使用unicode字符的字符串类型(str),字符串类型(str)成为基础类型如下所示,而编码后的变为了字节类型(bytes) 但是两个函数的使用方法不变:

  decode    encode
bytes ------> str(unicode)------>bytes
u = '中文' #指定字符串类型对象u 
str = u.encode('gb2312') #以gb2312编码对u进行编码,获得bytes类型对象str 
u1 = str.decode('gb2312')#以gb2312编码对字符串str进行解码,获得字符串类型对象u1 
u2 = str.decode('utf-8')#如果以utf-8的编码对str进行解码得到的结果,将无法还原原来的字符串内容

文件读取问题

假如我们读取一个文件,文件保存时,使用的编码格式,决定了我们从文件读取的内容的编码格式,例如,我们从记事本新建一个文本文件test.txt, 编辑内容,保存的时候注意,编码格式是可以选择的,例如我们可以选择gb2312,那么使用python读取文件内容,方式如下:

f = open('test.txt','r')
s = f.read() #读取文件内容,如果是不识别的encoding格式(识别的encoding类型跟使用的系统有关),这里将读取失败
'''假设文件保存时以gb2312编码保存'''
u = s.decode('gb2312') #以文件保存格式对内容进行解码,获得unicode字符串
'''下面我们就可以对内容进行各种编码的转换了'''
str = u.encode('utf-8')#转换为utf-8编码的字符串str
str1 = u.encode('gbk')#转换为gbk编码的字符串str1
str1 = u.encode('utf-16')#转换为utf-16编码的字符串str1

codecs进行文件的读取

python给我们提供了一个包codecs进行文件的读取,这个包中的open()函数可以指定编码的类型:

import codecs 
f = codecs.open('text.text','r+',encoding='utf-8')#必须事先知道文件的编码格式,这里文件编码是使用的utf-8 
content = f.read()#如果open时使用的encoding和文件本身的encoding不一致的话,那么这里将将会产生错误 
f.write('你想要写入的信息') 
f.close()

以上这篇Python3 中文文件读写方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • Tensorflow中的dropout的使用方法

    Tensorflow中的dropout的使用方法

    这篇文章主要介绍了Tensorflow中的dropout的使用方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-03-03
  • Python中的Sequence类型使用实例

    Python中的Sequence类型使用实例

    这篇文章主要为大家介绍了Python中的Sequence类型使用实例,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-12-12
  • Python统计日志中每个IP出现次数的方法

    Python统计日志中每个IP出现次数的方法

    这篇文章主要介绍了Python统计日志中每个IP出现次数的方法,实例分析了Python基于正则表达式解析日志文件的相关技巧,需要的朋友可以参考下
    2015-07-07
  • Python isdigit()函数判断字符串是否全都是数字字符示例

    Python isdigit()函数判断字符串是否全都是数字字符示例

    这篇文章主要为大家介绍了Python判断字符串是否全都是数字字符示例,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2024-01-01
  • python中networkx函数的具体使用

    python中networkx函数的具体使用

    本文主要介绍了python中networkx函数的具体使用,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2023-02-02
  • python中tkinter实现GUI程序三个实例教程

    python中tkinter实现GUI程序三个实例教程

    Python提供了多个GUI库,使开发人员能够轻松创建各种交互式界面,这篇文章主要给大家介绍了关于python中tkinter实现GUI程序的三个实例教程,文中通过代码介绍的非常详细,需要的朋友可以参考下
    2024-05-05
  • PyCharm导入numpy库的几种方式

    PyCharm导入numpy库的几种方式

    今天给大家带来的是关于Python的相关知识,文章围绕着PyCharm导入numpy库的几种方式展开,文中有非常详细的解释及代码示例,需要的朋友可以参考下
    2021-06-06
  • python翻译软件实现代码(使用google api完成)

    python翻译软件实现代码(使用google api完成)

    这篇文章主要介绍了python结合google api完成的翻译软件实现代码,大家参考使用
    2013-11-11
  • Python不要再使用while死循环,定时器代替效果更佳

    Python不要再使用while死循环,定时器代替效果更佳

    在python开发的过程中,经常见到小伙伴直接使用while True的死循环+sleep的方式来保存程序的一直运行。这种方式虽然能达到效果,但是说不定什么时候就直接崩溃了,其实使用定时器效果也不错哦
    2023-03-03
  • 基于Tensorflow:CPU性能分析

    基于Tensorflow:CPU性能分析

    今天小编就为大家分享一篇基于Tensorflow:CPU性能分析,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-02-02

最新评论