Python JSON编码/解码库orjson的用法详解

 更新时间:2025年07月08日 10:34:47   作者:老胖闲聊  
orjson是一个高性能的JSON编码/解码库,专为Python设计,使用Rust实现,相比标准库的json模块和其他第三方库(如 ujson、simplejson),orjson在速度上有显著优势,同时支持更丰富的原生数据类型,本文通过代码示例给大家介绍的非常详细,需要的朋友可以参考下

核心优势

  1. 极高性能
    • 比标准库 json10~100 倍(尤其在大数据量时)。
    • 反序列化速度超过 ujson,序列化速度接近 Rust/C 原生水平。
  2. 内存高效
    • 直接处理 bytes 而非 str,减少内存分配。
  3. 严格符合标准
    • 符合 RFC 8259 和 ECMA-404 标准。
  4. 无 GIL 阻塞
    • 在序列化/反序列化时释放 GIL,支持并发。

安装

pip install orjson

要求:Python ≥ 3.7(支持 Linux/macOS/Windows)。

基本用法

1. 序列化(Python 对象 → JSON)

import orjson

data = {
    "name": "Alice",
    "age": 30,
    "hobbies": ["coding", "hiking"],
    "is_active": True
}

# 序列化为 bytes
json_bytes = orjson.dumps(data)
print(json_bytes)  # b'{"name":"Alice","age":30,...}'

# 可选:转为字符串
json_str = json_bytes.decode("utf-8")

2. 反序列化(JSON → Python 对象)

json_data = b'{"name": "Bob", "score": 95.5}'

# 直接解析 bytes
parsed = orjson.loads(json_data)
print(parsed["name"])  # "Bob"

高级特性

1. 处理复杂数据类型

orjson 原生支持更多类型:

from datetime import datetime, timezone
from uuid import uuid4

data = {
    "id": uuid4(),  # UUID 对象
    "created_at": datetime.now(timezone.utc)  # 时区-aware datetime
}

# 直接序列化(无需自定义转换)
json_bytes = orjson.dumps(data)

2. 自定义选项

通过 option 参数启用扩展功能:

json_bytes = orjson.dumps(
    data,
    option=orjson.OPT_NAIVE_UTC |   # 将无时区 datetime 视为 UTC
           orjson.OPT_SERIALIZE_NUMPY |  # 支持 numpy 数组
           orjson.OPT_SORT_KEYS     # 按键排序输出
)

3. 处理非 UTF-8 数据

# 序列化非 UTF-8 字符串(如 latin-1)
data = {"text": "café".encode("latin-1")}
json_bytes = orjson.dumps(data)  # 自动处理

性能对比示例

import timeit
import orjson
import json

data = {"value": [i for i in range(10000)]}

# orjson 速度测试
t_orjson = timeit.timeit(lambda: orjson.dumps(data), number=1000)

# 标准库速度测试
t_stdlib = timeit.timeit(lambda: json.dumps(data), number=1000)

print(f"orjson: {t_orjson:.4f} sec")
print(f"json:   {t_stdlib:.4f} sec")

典型结果

orjson: 0.02 sec
json:   0.25 sec  # 慢 10 倍以上

使用场景推荐

  1. 高吞吐量服务:API 服务器、微服务。
  2. 大数据处理:快速解析大型 JSON 文件。
  3. 科学计算:无缝集成 NumPy/Pandas。
  4. 替代 json:追求极致性能的通用场景。

注意事项

  1. 输出类型
    • dumps() 返回 bytes(非字符串),需手动解码为 str
  2. 键排序
    • 默认不排序键,需用 option=orjson.OPT_SORT_KEYS
  3. 错误处理
    • 无效输入直接抛出 orjson.JSONDecodeError

总结

orjson 是 Python 生态中性能最强的 JSON 库,适用于对速度要求严苛的场景。其特点包括:

  • 极速的序列化/反序列化
  • 原生支持日期、UUID、NumPy 等类型
  • 内存高效且线程安全

到此这篇关于Python JSON编码/解码库orjson的用法详解的文章就介绍到这了,更多相关Python orjson库用法内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • 详解python的运算符与表达式

    详解python的运算符与表达式

    这篇文章主要为大家介绍了python的运算符与表达式,具有一定的参考价值,感兴趣的小伙伴们可以参考一下,希望能够给你带来帮助
    2022-01-01
  • python如何保证输入键入数字的方法

    python如何保证输入键入数字的方法

    今天小编就为大家分享一篇python如何保证输入键入数字的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-08-08
  • 详解python如何提取浏览器中保存的网站登录用户名密码

    详解python如何提取浏览器中保存的网站登录用户名密码

    很多浏览器都贴心地提供了保存用户密码功能,用户一旦开启,就不需要每次都输入用户名、密码,非常方便,作为python脚本,能否拿到用户提前保存在浏览器中的用户名密码,用以自动登录呢,下面我们就来看看吧
    2023-08-08
  • 如何获取numpy的第一个非0元素索引

    如何获取numpy的第一个非0元素索引

    这篇文章主要介绍了如何获取numpy的第一个非0元素索引,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2021-05-05
  • Python中处理Excel数据的方法对比(pandas和openpyxl)

    Python中处理Excel数据的方法对比(pandas和openpyxl)

    openpyxl 和 pandas在处理Excel数据时各有优势,选择需结合具体场景,本文将从核心功能,性能,适用场景展等几个不同的维度做个对比,感兴趣的可以了解下
    2025-07-07
  • PyCharm安装Markdown插件的两种方法

    PyCharm安装Markdown插件的两种方法

    Markdown是一种可以使用普通文本编辑器编写的标记语言,通过简单的标记语法,它可以使普通文本内容具有一定的格式。这篇文章主要介绍了PyCharm安装Markdown插件的两种方法,需要的朋友可以参考下
    2019-06-06
  • 把项目从Python2.x移植到Python3.x的经验总结

    把项目从Python2.x移植到Python3.x的经验总结

    这篇文章主要介绍了把项目从Python2.x移植到Python3.x的经验总结,包括作者所使用的Jinja2框架中一些需要注意的地方,需要的朋友可以参考下
    2015-04-04
  • python使用MkDocs自动生成文档的操作方法

    python使用MkDocs自动生成文档的操作方法

    python代码注释风格有很多,比较主流的有 reStructuredText风格、numpy风格、Google风格,自动生成文档的工具也有很多,常见的有:Pydocs,Sphinx和MkDocs,本文给大家介绍了python使用MkDocs自动生成文档的操作方法,需要的朋友可以参考下
    2024-06-06
  • Tortoise-orm信号实现及使用场景源码详解

    Tortoise-orm信号实现及使用场景源码详解

    这篇文章主要为大家介绍了Tortoise-orm信号实现及使用场景源码详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-03-03
  • python模式 工厂模式原理及实例详解

    python模式 工厂模式原理及实例详解

    这篇文章主要介绍了python模式 工厂模式原理及实例详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-02-02

最新评论