python 中文字符串的处理实现代码

 更新时间:2009年10月25日 18:00:09   作者:  
python中直接将一个中文字符串赋值给一个变量使用的是utf-8格式的编码,以下为证.
>>> teststr = '我的eclipse不能正确的解码gbk码!'
>>> teststr
'\xe6\x88\x91\xe7\x9a\x84eclipse\xe4\xb8\x8d\xe8\x83\xbd\xe6\xad\xa3\xe7\xa1\xae\xe7\x9a\x84\xe8\xa7\xa3\xe7\xa0\x81gbk\xe7\xa0\x81\xef\xbc\x81'
>>> tests2 = u'我的eclipse不能正确的解码gbk码!'
>>> test3 = tests2.encode('gb2312')
>>> test3
'\xce\xd2\xb5\xc4eclipse\xb2\xbb\xc4\xdc\xd5\xfd\xc8\xb7\xb5\xc4\xbd\xe2\xc2\xebgbk\xc2\xeb\xa3\xa1'
>>> test3
'\xce\xd2\xb5\xc4eclipse\xb2\xbb\xc4\xdc\xd5\xfd\xc8\xb7\xb5\xc4\xbd\xe2\xc2\xebgbk\xc2\xeb\xa3\xa1'
>>> teststr
'\xe6\x88\x91\xe7\x9a\x84eclipse\xe4\xb8\x8d\xe8\x83\xbd\xe6\xad\xa3\xe7\xa1\xae\xe7\x9a\x84\xe8\xa7\xa3\xe7\xa0\x81gbk\xe7\xa0\x81\xef\xbc\x81'
>>> test3.decode('gb2312').encode('utf-8')
'\xe6\x88\x91\xe7\x9a\x84eclipse\xe4\xb8\x8d\xe8\x83\xbd\xe6\xad\xa3\xe7\xa1\xae\xe7\x9a\x84\xe8\xa7\xa3\xe7\xa0\x81gbk\xe7\xa0\x81\xef\xbc\x81'
>>> test3.decode('gb2312').encode('utf-8') == teststr
True
如上所见,test3变量(gb2312编码)经过解码(变成unicode字符串)后再使用utf-8编码,就成了与teststr值相同的串了.

通过上面的例子我们也发现,unicode字符串是gb2312字符串(windows就使用这种格式)与utf-8字符串(python本身使用)之间的一座桥梁.

相关文章

  • Python数据预处理之数据规范化(归一化)示例

    Python数据预处理之数据规范化(归一化)示例

    这篇文章主要介绍了Python数据预处理之数据规范化,简单描述了数据规范化的原理、用法及相关操作技巧,需要的朋友可以参考下
    2019-01-01
  • python使用tesseract实现字符识别功能

    python使用tesseract实现字符识别功能

    Tesseract 是一个开源的光学字符识别(OCR)引擎,它能够识别多种语言的文本,可将扫描文档、图像中的文字提取并转换为计算机可编辑的文本格式,本文给大家介绍了python使用tesseract实现字符识别功能,需要的朋友可以参考下
    2024-10-10
  • 从Python的源码来解析Python下的freeblock

    从Python的源码来解析Python下的freeblock

    这篇文章主要介绍了从Python的源码来解析Python下的freeblock,包括内存空间分配等知识,需要的朋友可以参考下
    2015-05-05
  • Python调用Elasticsearch更新数据库的操作方法

    Python调用Elasticsearch更新数据库的操作方法

    Elasticsearch是一个分布式、多租户的全文搜索引擎,支持HTTP Web接口和无模式的JSON文档,本文介绍Python调用Elasticsearch更新数据库的相关操作,感兴趣的朋友一起看看吧
    2024-12-12
  • Python实现多个视频合成一个视频的功能

    Python实现多个视频合成一个视频的功能

    这篇文章主要介绍了可以将多个视频拼接为一个视频的Python工具代码,文中的代码讲解详细,对我们学习Python有一定的帮助,快来跟随小编一起学习一下吧
    2021-12-12
  • Python实现读取mat、tif和hdr格式数据

    Python实现读取mat、tif和hdr格式数据

    遥感影像数据大多以tif格式或者以hdr格式进行存储,如果以mat格式进行存储,不会保留坐标信息,本文将详细介绍如何使用python来读取这三种格式的数据,需要的可以参考下
    2023-12-12
  • 提升python处理速度原理及方法实例

    提升python处理速度原理及方法实例

    这篇文章主要介绍了提升python处理速度原理及方法实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-12-12
  • python中random.randint和random.randrange的区别详解

    python中random.randint和random.randrange的区别详解

    这篇文章主要介绍了python中random.randint和random.randrange的区别详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-09-09
  • 对python sklearn one-hot编码详解

    对python sklearn one-hot编码详解

    今天小编就为大家分享一篇对python sklearn one-hot编码详解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-07-07
  • Python 读取用户指令和格式化打印实现解析

    Python 读取用户指令和格式化打印实现解析

    这篇文章主要介绍了Python 读取用户指令和格式化打印实现解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-09-09

最新评论