解决python2中unicode()函数在python3中报错的问题

 更新时间:2021年05月12日 14:37:09   作者:哦摩西罗伊  
这篇文章主要介绍了在python2中unicode()函数在python3中报错的解决方案,希望给大家做个参考,下次出现这个问题的时候,也知道如何应对

python2中的unicode()函数在python3中会报错:

NameError: name 'unicode' is not defined

There is no such name in Python 3, no. You are trying to run Python 2 code in Python 3. In Python 3, unicode has been renamed to str.

翻译过来就是:Python 3中没有这样的名字,没有。 您正在尝试在Python 3中运行Python 2代码。在Python 3中,unicode已重命名为str。

函数转换:unicode()到 str()为:

//python2:
unicode(nn,'utf-8')
//python3:
str(nn)

补充:根本解决Python2中unicode编码问题

Python2中编码问题

因为计算机只识别01这要的二进制,所以在计算机存储我们的文件时,要使用二进制数来表示。所以编码就是哪个二进制数表示哪个字符:

编码原由系统编码、文件编码与python系统编码Python字符编码python中的字典、数组转字符串中的中文编码

编码原由

ASCII编码

最早出现的是ASCII码,使用8位二进制数组合表示128种字符。因为ASCII编码是美国人发明的,当初没考虑给别的国家用,所以,它仅仅表示了所有美式英语的语言字符。但是没有使用完。

ISO 8859-1/windows-1252

128位字符满足了美国人的需求,但是随之欧洲人加入互联网,为了满足欧洲人的需求,8位二进制后面还有128位。这一段编码我们称之扩展字符集,即ISO 8859-1编码标准,后来欧洲的需求变更,即规定了windows-1252代替了ISO 8859-1

GB2312

然后当我国加入后,8位二进制(即一个字节)用完了,于是我们保留ASCII编码即前128位,后面的全部删除。因为我国得语言博大精深,所以需要2个字节,即16位才能满足我们得需求,所以当计算机遇到大于127的字节时,就一次性读取两个字节,将他解码成汉字。即GB2312编码

GBK

相当于GB2312的改进版,增添了中文字符。但还是2个字节表示汉字

GB18030

为了满足日韩和我国的少数民族的需求,对GBK的改进,使用变长编码,要么使用两个字节,要么使用四个字节。

Unicode

虽然每种编码都兼容ASCII编码,但是各个国家是不兼容的。于是出现了Unicode,它将所有的编码进行了统一。它不能算是一种具体的编码标准,只是将全世界的字符进行了编号,并没有指定他们具体在计算机种以什么样的形式存储。

它的具体实现有UTF-8,UTF-16,UTF-32等。

系统编码、文件编码与python系统编码

在linux中获取系统编码结果:

这里写图片描述

Windows系统的编码,代码页936表示GBK编码

这里写图片描述

可以看到linux系统默认使用UTF-8编码,windows默认使用GBK编码。Linux环境下,文件默认使用UTF-8编码。当然你也可以指定文件编码方式。

Python解释器内部默认使用的ASCII编码方式去解读python源文件。

这里写图片描述

所以当文件内存在非ASCII字符时,python解释器无 法识别,就会出现编码错误。

这里写图片描述

So,这个时候需要告诉python解释器用utf-8去解读python源文件

这里写图片描述

这里写图片描述

Python字符编码

Python2中有两类字符串,分别是str与unicode。这两类字符串都派生自抽象类basestring。 Str即普通字符串类型

这里写图片描述

在字符串前加上u即unicode编码

这里写图片描述

在代码中通常用到的是unicode,文件保存的是utf-8编码。Unicode编码是固定2个字节代表一个字符。Utf-8是对英文只用一个字节,对中文是3个字节。所以unicode运行效率高,utf-8运行效率相比要低,但是空间存储要小。

这里写图片描述

Python中str与unicode转换

Unicode转str

这里写图片描述

str转unicode

这里写图片描述

其函数中参数UTF-8是,以utf-8编码对unicode对象解码,或编码。

python中的字典、数组转字符串中的中文编码

当字典中的中文字符是unicode类型时

这里写图片描述

这里写图片描述

这里写图片描述

这里写图片描述

decode(“unicode-escape”)相当是反向编码.然后再进行utf-8编码即可

当字典中的字符串是string类型时

name = {"name": "中国"}
name = str(name)
print name.decode("string-escape")

这里写图片描述

当数组进行字符串化时

这里写图片描述

最后总结

不管是数组还是字典,在进行字符串转换是,即是又一次编码,所以,对于本身还有的中文字符串又一次编码,所以要进行一次反编码,才能看到原有的编码。

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。如有错误或未考虑完全的地方,望不吝赐教。

相关文章

  • python学习与数据挖掘应知应会的十大终端命令

    python学习与数据挖掘应知应会的十大终端命令

    今天我们将介绍一些基本的数据收集、探索和聚合—所有这些都是通过shell完成的。如果你使用的是Linux或Mac,那么接下来就不会有任何问题,但是Windows用户应该在继续之前下载一个终端仿真器
    2021-11-11
  • Python高级特性切片(Slice)操作详解

    Python高级特性切片(Slice)操作详解

    在Python中对于具有序列结构的数据来说都可以使用切片操作,需注意的是序列对象某个索引位置返回的是一个元素,而切片操作返回是和被切片对象相同类型对象的副本。
    2018-09-09
  • python 的列表遍历删除实现代码

    python 的列表遍历删除实现代码

    这篇文章主要介绍了python 的列表遍历删除,需要的朋友可以参考下
    2015-11-11
  • Python3.9.0 a1安装pygame出错解决全过程(小结)

    Python3.9.0 a1安装pygame出错解决全过程(小结)

    这篇文章主要介绍了Python3.9.0 a1安装pygame出错解决全过程(小结),文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-02-02
  • python正则表达式常见的知识点汇总

    python正则表达式常见的知识点汇总

    正则表达式提供了一些可用的匹配模式,比如忽略大小写、多行匹配等,下面这篇文章主要给大家介绍了关于python正则表达式常见的知识点,文中通过实例代码介绍的非常详细,需要的朋友可以参考下
    2022-05-05
  • python文件操作整理汇总

    python文件操作整理汇总

    本文主要记录了个人在项目中遇到的一些Python中对于文件、文件夹的操作需要涉及到的函数等内容,非常的详尽,有需要的可以参考下
    2014-10-10
  • Python中dumps与dump及loads与load的区别

    Python中dumps与dump及loads与load的区别

    这篇文章主要介绍了Python中dumps与dump、loads与load的区别,json模块提供了一种很简单的方式来编码和解码JSON数据。其中两个主要的函数是json.dumps()和json.loads(),需要的朋友可以参考下
    2022-04-04
  • 详解flask表单提交的两种方式

    详解flask表单提交的两种方式

    这篇文章主要介绍了详解flask表单提交的两种方式,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2018-07-07
  • Python深度学习之Unet 语义分割模型(Keras)

    Python深度学习之Unet 语义分割模型(Keras)

    这篇文章主要介绍了语义分割任务中Unet一个有意思的模型-Keras。Keras是一个由Python编写的开源人工神经网络库,可进行深度学习模型的设计、调试、评估、应用和可视化。感兴趣的小伙伴快来跟随小编一起学习一下吧
    2021-12-12
  • Python使用gRPC传输协议教程

    Python使用gRPC传输协议教程

    今天小编就为大家分享一篇关于Python使用gRPC传输协议教程,小编觉得内容挺不错的,现在分享给大家,具有很好的参考价值,需要的朋友一起跟随小编来看看吧
    2018-10-10

最新评论