Python编码解码之encode()函数详解

 更新时间:2023年07月26日 09:50:05   作者:士别三日wyx  
这篇文章主要给大家介绍了关于Python编码解码之encode()函数的相关资料,Python的encode函数用于将字符串按照指定的编码方式进行编码,返回一个bytes类型的对象,需要的朋友可以参考下

encode

encode() 可以对字符串进行「编码」,常用来对「中文」字符串进行编码,以解决「乱码」问题。

语法

string.encode( encoding, errors )

参数

  • encodeing :(可选)指定编码,默认 UTF-8
  • errors :(可选)设置错误处理方式,默认

返回值

  • 返回编码后的「新字符串」

实例:对字符串进行GBK编码

str1 = 'hello'
print(str1.encode('gbk'))

输出:

b'hello'

1、常见编码格式

  • ASCLL:美国早期制定的编码规范,只能表示128个字符。
  • GB2312:中国在ASCLL基础上对中文进行扩展,可以表示6763个汉字符号。
  • GBK:对GB2312的进一步扩展(K指扩),收录了21886个汉字符号。
  • GB18030:对GBK再一次扩充,收录了70244个汉字符号。
  • Unicode:字符集,包含了世界上目前所有的符号,全球的所有文字都可以解析,字符是定长的,统一为16位
  • UTF-8:使用最广的一种Unicode的实现方式,每次8个位传输数据;体积太大,国内通常使用GBK。
  • UTF-16:Unicode的另一种实现方式,每次传输16位数据

各个编码实例:

print('hello'.encode('gb2312'))
print('hello'.encode('gbk'))
print('hello'.encode('gb18030'))
print('hello'.encode('utf8'))
print('hello'.encode('utf16'))

输出:

b'hello'
b'hello'
b'hello'
b'hello'
b'\xff\xfeh\x00e\x00l\x00l\x00o\x00'

仔细观察返回结果就会发现,字符串前面都加了个b,接下来我们了解一下这是什么含义。

2、返回的是Bytes类型

encode() 编码后会返回一个「Bytes类型」的结果,而不是「str类型」

str1 = 'hello'
print(type(str1))
print(type(str1.encode()))

输出:

<class 'str'>
<class 'bytes'>

bytes 和 str 都属于字符串类型:

  • str 以Unicode code points形式存储(人认识的形式)
  • bytes 以byte形式存储(机器认识的形式)

bytes 是一个「二进制」序列对象,定义时在字符串前面加上b(英文可以,中文需要先encode)

str1 = b'hello'
print(type(str1))

输出:

<class 'bytes'>

3、错误处理方式

encode() 在编码时,经常会遇到「无法编码」的字符,这时就可以用 errors 设置适当的处理方式:

  • strict:失败时引发错误
  • ignore:忽略无法编码的字符
  • backslashreplace:用反斜杠替换无法编码的字符
  • namereplace:用解释字符的文本替换无法编码的字符
  • replace:用问号替换无法编码的字符
  • xmlcharrefreplace:用xml字符替换字符

如果给「两个参数」,可以自动按顺序复制给参数;如果只给「一个参数」,需要用参数名指定。

print('hello'.encode('gbk', 'strict'))
print('hello'.encode(errors='ignore'))
print('hello'.encode(errors='backslashreplace'))
print('hello'.encode(errors='namereplace'))
print('hello'.encode(errors='replace'))
print('hello'.encode(errors='xmlcharrefreplace'))

4、解码

decode() 会将「bytes类型」转成「str类型」,这意味着它只能解码bytes类型的字符串,解码str类型的字符串会报错 AttributeError: ‘str’ object has no attribute ‘decode’

bytes类型格式是 b'xxx',如果只有str形式的字符串(比如 '\xe5\xbc\xa0\xe4\xb8\x89'),可以在前面加上b,变成bytes类型,再进行解码

print(b'\xe5\xbc\xa0\xe4\xb8\x89'.decode())

输出:

张三

总结

到此这篇关于Python编码解码之encode()函数的文章就介绍到这了,更多相关Python encode()函数内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Python一次为多个变量赋值的简便方法

    Python一次为多个变量赋值的简便方法

    在Python的世界里,简洁与优雅是永恒的追求,当面对需要同时处理多个变量的场景时,如何避免冗长的代码和临时变量的困扰?答案就藏在Python强大的多重赋值机制中,本文将系统性地探讨Python中为多个变量赋值的多种方法,需要的朋友可以参考下
    2026-03-03
  • Python重试库 Tenacity详解(推荐)

    Python重试库 Tenacity详解(推荐)

    这篇文章主要介绍了Python重试库Tenacity详解,文章围绕主题展开详细的内容介绍,具有一定的参考价值,需要的小伙伴可以参考一下
    2022-09-09
  • python opencv 读取图片 返回图片某像素点的b,g,r值的实现方法

    python opencv 读取图片 返回图片某像素点的b,g,r值的实现方法

    今天小编就为大家分享一篇python opencv 读取图片 返回图片某像素点的b,g,r值的实现方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-07-07
  • Django如何将URL映射到视图

    Django如何将URL映射到视图

    这篇文章主要介绍了Django如何将URL映射到视图,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-07-07
  • Python基础教程之元组的定义与不可变特性(对比列表)

    Python基础教程之元组的定义与不可变特性(对比列表)

    元组的魅力在于它的简单性和明确性,它不追求成为全能数据结构,而是专注于做好一件事,就是提供不可变的有序集合,这篇文章主要介绍了Python基础教程之元组的定义与不可变特性(对比列表)的相关资料,需要的朋友可以参考下
    2026-05-05
  • 如何将yolov5中的PANet层改为BiFPN详析

    如何将yolov5中的PANet层改为BiFPN详析

    现在yolov5的neck用的是PANet,在efficient论文中提出了BiFPN结构,还有更加不错的性能,下面这篇文章主要给大家介绍了关于如何将yolov5中的PANet层改为BiFPN的相关资料,需要的朋友可以参考下
    2022-06-06
  • python 在指定范围内随机生成不重复的n个数实例

    python 在指定范围内随机生成不重复的n个数实例

    今天小编就为大家分享一篇python 在指定范围内随机生成不重复的n个数实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-01-01
  • python调用函数、类和文件操作简单实例总结

    python调用函数、类和文件操作简单实例总结

    这篇文章主要介绍了python调用函数、类和文件操作,结合简单实例形式总结分析了Python调用函数、类和文件操作的各种常见操作技巧,需要的朋友可以参考下
    2019-11-11
  • Python小程序爬取今日新闻拿走就能用

    Python小程序爬取今日新闻拿走就能用

    这篇文章主要教大家怎样实现一个Python小程序,爬取今日新闻,文中给出了详细的示例代码,拿走就能用,有需要的朋友可以借鉴参考下,希望能够有所帮助
    2021-09-09
  • Python 字典(Dictionary)详细介绍

    Python 字典(Dictionary)详细介绍

    这篇文章主要介绍了Python 字典(Dictionary)详细,字典是另一种可变容器模型,且可存储任意类型对象。下面和小编一起进入文章学习新内容吧,需要的朋友可以参考一下
    2022-02-02

最新评论