使用Python处理非标准JSON的实用方案

 更新时间:2025年09月03日 09:08:27   作者:detayun  
JSON(JavaScript Object Notation)作为轻量级数据交换格式被广泛使用,但实际开发中常遇到不符合标准规范的JSON数据,本文将探讨如何用Python处理这些特殊情况,并提供实用解决方案,需要的朋友可以参考下

引言

JSON(JavaScript Object Notation)作为轻量级数据交换格式被广泛使用,但实际开发中常遇到不符合标准规范的JSON数据。本文将探讨如何用Python处理这些特殊情况,并提供实用解决方案。

常见非标准JSON类型

单引号包裹键值
{ 'name': '张三', 'age': 25 }

包含注释

{
  "version": 1.1 // 版本说明
}

尾随逗号
{ "features": ["a", "b", ] }

特殊数据类型
{ "timestamp": datetime.datetime.now() }

解决方案对比

方案优点缺点
手动清洗无需额外依赖维护成本高
json5库支持现代语法性能较低
demjson3兼容性强社区支持较弱
正则表达式灵活高效容易出错

推荐处理流程

import json
from demjson3 import decode

def process_nonstandard_json(json_str):
    try:
        # 尝试标准解析
        return json.loads(json_str)
    except json.JSONDecodeError:
        try:
            # 使用demjson3解析
            return decode(json_str)
        except Exception as e:
            # 自定义清洗逻辑
            cleaned = json_str.replace("'", '"').replace("//", "")
            return json.loads(cleaned)

高级处理技巧

类型转换处理

def custom_decoder(obj):
    if 'datetime' in obj:
        return datetime.fromisoformat(obj['$datetime'])
    return obj

正则表达式清洗

import re
pattern = re.compile(r'//.*$|/\*.*?\*/', re.DOTALL)
cleaned = pattern.sub('', json_str)

性能优化建议

  • 批量处理时建议使用json5库
  • 预处理阶段进行字符串规范化
  • 对超大文件采用流式解析

工具推荐

在线验证工具

JSONLint 支持非标准格式检测

VSCode插件

“JSON Tools” 提供格式化/修复功能

总结

选择方案时应遵循:

  1. 优先修正数据源
  2. 生产环境推荐demjson3
  3. 临时处理使用json5
  4. 复杂场景结合正则表达式

通过灵活运用多种工具组合,可以有效应对各类非标准JSON处理场景。

到此这篇关于使用Python处理非标准JSON的实用方案的文章就介绍到这了,更多相关Python处理非标准JSON内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Python入门教程(二十)Python的Lambda表达式

    Python入门教程(二十)Python的Lambda表达式

    这篇文章主要介绍了Python入门教程(二十)Python的Lambda表达式,lambda表达式是一行的函数。它们在其他语言中也被称为匿名函数,lambda表达式非常有用,可以让代码简单,简洁,需要的朋友可以参考下
    2023-04-04
  • Python Process创建进程的2种方法详解

    Python Process创建进程的2种方法详解

    这篇文章主要介绍了Python Process创建进程的2种方法详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-01-01
  • 关于Python 中IndexError:list assignment index out of range 错误解决

    关于Python 中IndexError:list assignment index out of rang

    这篇文章主要介绍了Python 中IndexError:list assignment index out of range 错误解决,概述了两个常见的列表函数,它们可以帮助我们在替换两个列表时帮助我们处理 Python 中的索引错误,需要的朋友可以参考下
    2023-05-05
  • django rest framework 过滤时间操作

    django rest framework 过滤时间操作

    这篇文章主要介绍了django rest framework 过滤时间操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-07-07
  • PyQt5实现tableWidget 居中显示

    PyQt5实现tableWidget 居中显示

    这篇文章主要介绍了PyQt5实现tableWidget 居中显示方式,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2022-07-07
  • 使用Pytorch如何完成多分类问题

    使用Pytorch如何完成多分类问题

    这篇文章主要介绍了使用Pytorch如何完成多分类问题,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2023-02-02
  • Django 导出项目依赖库到 requirements.txt过程解析

    Django 导出项目依赖库到 requirements.txt过程解析

    这篇文章主要介绍了Django 导出项目依赖库到 requirements.txt过程解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-08-08
  • python递归删除指定目录及其所有内容的方法

    python递归删除指定目录及其所有内容的方法

    下面小编就为大家带来一篇python递归删除指定目录及其所有内容的方法。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2017-01-01
  • Python中字符串类型代码的执行函数——eval()、exec()和compile()详解

    Python中字符串类型代码的执行函数——eval()、exec()和compile()详解

    这篇文章主要介绍了Python中字符串类型代码的执行函数——eval()、exec()和compile(),字符串类型代码的执行函数有三个,都是Python的内置函数,下面逐一对这三个函数详细讲解,需要的朋友可以参考下
    2023-02-02
  • 利用Django-environ如何区分不同环境

    利用Django-environ如何区分不同环境

    这篇文章主要给大家介绍了关于利用Django-environ如何区分不同环境的相关资料,文中通过示例代码介绍的非常详细,对大家学习或者使用django具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2018-08-08

最新评论