Python 处理带有 \u 的字符串操作
最近遇到一个头疼的问题,用socket接收到一个字符串
格式如下:
{“trade_status”: {“desc”: “\u30106\u3011 - \u8d22\u52a1\u7ed3\u7b97\u5df2\u5b8c\u6210 “}}/end/
其中含有一段含有\u的编码字串,怎么将其转化为汉字。
decode().encode(‘utf-8') 不行,decode、encode半天搞不定,后来偶然发现,在decode时可以选则unicode-escape
代码如下:
# -*- coding: utf-8 -*-
import socket
if __name__ == '__main__':
sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
sock.connect(('192.168.6.63', 10001))
sock.send('[{"action": "trade_status"}]')
rec = sock.recv(1024)
print rec
print rec.decode('unicode-escape').encode('utf-8')
print rec.decode('raw_unicode-escape').encode('utf-8')
sock.close()
输出结果:
{"trade_status": {"desc": "\u30101\u3011 - \u4ea4\u6613\u4e2d "}}/**end**/
{"trade_status": {"desc": "【1】 - 交易中 "}}/**end**/
{"trade_status": {"desc": "【1】 - 交易中 "}}/**end**/
补充:Python3解析【\u】和【\\u】字符
【\u】字符示例
a = '\u5317\u4eac\u5e02' print(a)
北京市
b = '\\u5317\\u4eac\\u5e02' print(b)
\u5317\u4eac\u5e02
json.loads解析
import json a = '\\u5317\\u4eac\\u5e02' b = '"%s"' % a c = json.loads(b) print(a, b, c, sep='\n')
\u5317\u4eac\u5e02
“\u5317\u4eac\u5e02”
北京市
读取文件中\u字符

demjson
from demjson import decode # pip install demjson

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。如有错误或未考虑完全的地方,望不吝赐教。
相关文章
基于SQLAlchemy实现操作MySQL并执行原生sql语句
这篇文章主要介绍了基于SQLAlchemy实现操作MySQL并执行原生sql语句,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下2020-06-06
Python在终端通过pip安装好包以后在Pycharm中依然无法使用的问题(三种解决方案)
这篇文章主要介绍了Python在终端通过pip安装好包以后在Pycharm中依然无法使用的问题及解决方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下2020-03-03


最新评论