Python处理字符串中文(汉字)编码的实例

 更新时间:2024年04月17日 09:02:02   作者:蛋蛋の微笑  
这篇文章主要介绍了Python处理字符串中文(汉字)编码的实例,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教

Python处理字符串中文(汉字)编码

在实际开发中,发现打印Python打印经常出现乱码,大部分都是编码引起

简单说一下utf-8/ gbk/ unicode编码之间的相互转换问题

  • utf-8是Unix下的一种通用编码
  • gbk是win环境下的一种汉字编码
  • unicode是一种二进制编码

所有的utf-8和gbk编码都得通过unicode编码进行转码如图:

首先,我们可以查看自己的字符串是什么编码格式:

注意:

在Python3 中,需要将strTest转换成二进制,再获取编码格式;

而在2.x时,不需要转换,之接传入:print chardet.detect(strTest)

import chardet
strTest = "这是一个测试用例"
print(chardet.detect(str_test.encode()))

得到输出结果:

然后根据你的需要转码:

如   xxx.decode('utf-8').encode('gbk')

python有两个函数 decode() 和 encode()

  • decode(‘utf-8’) 是从utf-8编码转换成unicode编码,当然括号里也可以写'gbk'
  • encode('gbk') 是将unicode编码编译成gbk编码,当然括号里也可以写'utf-8'
str_to_gbk = str_test.encode('gbk')
print(chardet.detect(str_to_gbk))

另外,有些时候,我们输出打印时,会出现中文打印是 \uxxx 等,可以试试以下代码:

xxx.encode('utf-8').decode('unicode_escape')

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • Django在win10下的安装并创建工程

    Django在win10下的安装并创建工程

    本篇文章主要介绍了Django在win10下的安装并创建工程,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2017-11-11
  • 使用Django搭建一个基金模拟交易系统教程

    使用Django搭建一个基金模拟交易系统教程

    今天小编就为大家分享一篇使用Django搭建一个基金模拟交易系统教程,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-11-11
  • 10 个Python统计分析常用的经典脚本分享

    10 个Python统计分析常用的经典脚本分享

    在数据科学和统计分析中,Python 是一门非常流行的语言,本文整理了 10 个经典的 Python 脚本,用于执行日常的统计分析任务,感兴趣的小伙伴可以跟随小编一起学习一下
    2026-01-01
  • django 外键model的互相读取方法

    django 外键model的互相读取方法

    今天小编就为大家分享一篇django 外键model的互相读取方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-12-12
  • python+selenium实现QQ邮箱自动发送功能

    python+selenium实现QQ邮箱自动发送功能

    这篇文章主要为大家详细介绍了python+selenium实现QQ邮箱自动发送功能,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2019-01-01
  • Python中SOAP项目的介绍及其在web开发中的应用

    Python中SOAP项目的介绍及其在web开发中的应用

    这篇文章主要介绍了Python中的SOAP项目及其在web开发中的应用,本文来自于IBM官方网站技术文档,需要的朋友可以参考下
    2015-04-04
  • Pandas DataFrame实现任意位置插入一列或一行

    Pandas DataFrame实现任意位置插入一列或一行

    Pandas是Python中最流行的数据处理和分析库之一,在数据分析过程中,有时候需要在Dataframe中插入新的数据列,本文主要介绍了Pandas DataFrame实现任意位置插入一列或一行,具有一定的参考价值,感兴趣的可以了解一下
    2023-08-08
  • python实现博客文章爬虫示例

    python实现博客文章爬虫示例

    简单的博客文章爬虫,比较通用,因为大部分的网站结构都差不多,需要的朋友可以参考下
    2014-02-02
  • 使用Python算法实现从字符串中提取重复子串

    使用Python算法实现从字符串中提取重复子串

    在文本处理和数据分析中,经常需要从字符串中提取重复出现的子串,本文将解析一个高效的Python算法,用于从给定字符串中提取长度超过3的重复子串,需要的朋友可以参考下
    2025-10-10
  • pycharm配置python 设置pip安装源为豆瓣源

    pycharm配置python 设置pip安装源为豆瓣源

    这篇文章主要介绍了pycharm配置python 设置pip安装源为豆瓣源,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-02-02

最新评论