浅谈Python2之汉字编码为unicode的问题(即类似\xc3\xa4)

更新时间：2019年08月12日 16:47:18 作者：mighty13

今天小编就为大家分享一篇浅谈Python2之汉字编码为unicode的问题(即类似\xc3\xa4)，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

Python2中编码相关的问题很是让人蛋疼，特别是中文字符。

比如本文所述的中文网页GBK编码的诡异问题。

现象

例如：盲录職氓聭聵，其实网页里面正常的应该是会员

分析

接着上面的例子，会员这部分乱码通过repr()函数求值得到如下结果

\xc3\xa4\xc2\xbc\xc2\x9a\xc3\xa5\xc2\x91\xc2\x98

使用type()函数求值得到的结果为unicode

eval(repr())出来值为

盲录職氓聭聵

通过查表上述6个汉字对应

c3a4 c2bc c29a c3a5 c291 c298

而上面内容对应的UTF-8值就是会员

解决方法

相当诡异的是本身是unicode编码，却被当作GBK系列来解码，结果导致乱码。因此将这些字符先编码再解决解决问题。

encode('raw_unicode_escape').decode()

以上这篇浅谈Python2之汉字编码为unicode的问题(即类似\xc3\xa4)就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持脚本之家。

您可能感兴趣的文章:

Python实现希尔排序,归并排序和桶排序的示例代码
希尔、归并、快速排序算法可归为同一类，它们的共同点都是建立在分治思想之上。把大问题分拆成小问题，解决所有小问题后，再合并每一个小问题的结果，最终得到对原始问题的解答。本文将介绍这三种算法的实现代码，需要的可以参考一下
2022-04-04
使用python快速在局域网内搭建http传输文件服务的方法
这篇文章主要介绍了使用 python快速在局域网内搭建http传输文件服务,但是这种方法不要传输机密文件，安全性不高，只用到http协议没有使用任何加密协议，具体实现方法跟随小编一起看看吧
2019-11-11
Python cookbook（数据结构与算法）从任意长度的可迭代对象中分解元素操作示例
这篇文章主要介绍了Python 数据结构与算法从任意长度的可迭代象中分解元素操作,结合实例形式分析了Python使用*表达式针对可迭代对象的分解操作相关实现技巧,需要的朋友可以参考下
2018-02-02
使用python加密主机文件几种方法实现
本文主要介绍了使用python加密主机文件几种方法实现，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2023-02-02
Python爬虫实现全国失信被执行人名单查询功能示例
这篇文章主要介绍了Python爬虫实现全国失信被执行人名单查询功能,涉及Python爬虫相关网络接口调用及json数据转换等相关操作技巧,需要的朋友可以参考下
2018-05-05
SageMath与Python的使用示例教程
SageMath是一个开源的数学软件,它可以与Python进行交互,本文通过实例代码介绍了SageMath与Python的使用,需要的朋友可以参考下
2024-03-03
Django+Nginx+uWSGI 定时任务的实现方法
本文主要介绍了Django+Nginx+uWSGI 定时任务的实现方法，文中通过示例代码介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2022-01-01
对Python中小整数对象池和大整数对象池的使用详解
今天小编就为大家分享一篇对Python中小整数对象池和大整数对象池的使用详解，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2019-07-07
Python通过正则库爬取淘宝商品信息代码实例
这篇文章主要介绍了Python通过正则库爬取淘宝商品信息代码实例,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
2020-03-03
图文详解Django使用Pycharm连接MySQL数据库
这篇文章主要介绍了Django使用Pycharm连接MySQL数据库的实现,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
2019-08-08

浅谈Python2之汉字编码为unicode的问题(即类似\xc3\xa4)

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

常用在线小工具