Python处理列表套字典结构JSON数据的三种方式对比

更新时间：2026年02月28日 09:31:40 作者：大游小游之老游

这篇文章主要为大家详细介绍了Python处理JSON文件中列表套字典结构的三种优化方法,文中的示例代码讲解详细,感兴趣的小伙伴可以了解一下

前言

对于 “列表套字典”（JSON 数组包含对象）类型的 JSON 文件，查找并修改特定键值的思路是：先遍历列表中的每个字典，找到符合条件的目标字典，再修改该字典中指定键的值，最后写回文件。

示例场景

假设 users.json 文件内容如下（列表套字典结构）：

[
  {"id": 1, "name": "Alice", "age": 25, "active": true},
  {"id": 2, "name": "Bob", "age": 30, "active": false},
  {"id": 3, "name": "Charlie", "age": 28, "active": true}
]

需求

找到 id=2 的字典，将其 age 修改为 31，同时将 active 改为 true。

import json

# 1. 读取 JSON 文件（列表套字典结构，解析后是 Python 列表）
with open("users.json", "r", encoding="utf-8") as f:
    data_list = json.load(f)  # data_list 是一个包含字典的列表

# 2. 遍历列表，查找目标字典并修改值
for item in data_list:
    # 假设通过 "id" 定位目标字典（可根据实际条件调整）
    if item.get("id") == 2:  # 找到 id=2 的字典
        item["age"] = 31  # 修改 age 的值
        item["active"] = True  # 修改 active 的值
        break  # 找到后退出循环，提高效率

# 3. 将修改后的列表写回 JSON 文件
with open("users.json", "w", encoding="utf-8") as f:
    json.dump(data_list, f, indent=2, ensure_ascii=False)

潜在问题及优化方案

在处理 “列表套字典” 结构的 JSON 数据时，遍历列表是最直接的方式，但对于数据量极大的场景（如几万 / 几十万条数据），遍历的效率确实可能偏低。此时可以通过优化查找逻辑或借助第三方库提升效率，具体方法如下：

方法 1：用 “字典映射” 预处理，将列表转为索引字典（推荐）

如果列表中的字典有唯一标识键（如id），可以先将列表转换为以该标识为键的字典（相当于建立 “索引”），后续查找时直接通过键获取目标字典，时间复杂度从遍历的O(n)降至O(1)。

示例（基于之前的users.json）：

import json

# 1. 读取数据并构建索引字典（以id为键）
with open("users.json", "r", encoding="utf-8") as f:
    data_list = json.load(f)

# 构建映射：{id: 对应的字典}
id_to_item = {item["id"]: item for item in data_list}

# 2. 直接通过id查找并修改（无需遍历）
target_id = 2
if target_id in id_to_item:
    id_to_item[target_id]["age"] = 31
    id_to_item[target_id]["active"] = True

# 3. 写回文件（原列表已被修改，因为字典是引用类型）
with open("users.json", "w", encoding="utf-8") as f:
    json.dump(data_list, f, indent=2, ensure_ascii=False)

优势：

预处理一次后，后续多次查找 / 修改均为O(1)，适合频繁操作的场景。
不改变原列表结构，写回文件时直接用原列表即可（因为字典是引用类型，修改映射中的字典会同步影响原列表）。

方法 2：用列表推导式 / 生成器表达式简化查找（适合单次查找）

如果只需单次查找，可通过列表推导式或生成器表达式快速定位目标，代码更简洁（本质仍是遍历，但写法更高效）。

示例：

import json

with open("users.json", "r", encoding="utf-8") as f:
    data_list = json.load(f)

# 用生成器表达式查找第一个符合条件的字典（找到即停止）
target = next((item for item in data_list if item["id"] == 2), None)
if target:
    target["age"] = 31
    target["active"] = True

with open("users.json", "w", encoding="utf-8") as f:
    json.dump(data_list, f, indent=2, ensure_ascii=False)

优势：

借助next()和生成器表达式，找到目标后会立即停止遍历（类似带break的循环），避免多余操作。
代码更简洁，适合一次性查询修改。

方法 3：借助第三方库（如pandas）处理结构化数据

如果 JSON 数据是结构化的（如每个字典的键相同，类似表格），可以用pandas将其转为 DataFrame，通过类似 SQL 的查询语法快速定位和修改，适合大数据量场景。

示例：

import json
import pandas as pd

# 1. 读取JSON并转为DataFrame
with open("users.json", "r", encoding="utf-8") as f:
    data_list = json.load(f)
df = pd.DataFrame(data_list)

# 2. 定位并修改（通过条件筛选）
df.loc[df["id"] == 2, ["age", "active"]] = [31, True]

# 3. 转回列表并写回文件
updated_list = df.to_dict("records")  # 转为列表套字典
with open("users.json", "w", encoding="utf-8") as f:
    json.dump(updated_list, f, indent=2, ensure_ascii=False)

优势：

pandas底层用 C 实现，处理大数据量（如 10 万 + 条）时效率远高于纯 Python 遍历。
支持复杂条件查询（如多键组合筛选），语法更直观。

注意：需要安装pandas（pip install pandas），适合数据结构化程度高的场景。

总结：如何选择

小数据量（几百条以内）：直接遍历或生成器表达式即可，代码简单，效率差异可忽略。
大数据量 + 有唯一标识：优先用 “字典映射” 预处理，单次预处理O(n)，后续操作O(1)，性价比最高。
大数据量 + 结构化数据：用pandas，适合需要频繁进行复杂查询和修改的场景。

本质上，除了建立索引（方法 1）和借助底层优化的库（方法 3），其他方式仍依赖遍历，但通过 “提前终止”（如break、next()）可减少无效操作，效率差异主要体现在数据量极大的场景中。

到此这篇关于Python处理列表套字典结构JSON数据的三种方式对比的文章就介绍到这了,更多相关Python处理JSON数据内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

您可能感兴趣的文章:

Django中传递参数到URLconf的视图函数中的方法
这篇文章主要介绍了Django中传递参数到URLconf的视图函数中的方法,Django是最具人气的Python开发框架,需要的朋友可以参考下
2015-07-07
python opencv背景减去法抠图实现示例
这篇文章主要为大家介绍了python opencv背景减去法抠图实现示例，有需要的朋友可以借鉴参考下，希望能够有所帮助，祝大家多多进步，早日升职加薪
2022-05-05
Python classmethod装饰器原理及用法解析
这篇文章主要介绍了Python classmethod装饰器原理及用法解析,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
2020-10-10
使用python获取邮箱邮件的设置方法
这篇文章主要介绍了使用python获取邮箱邮件的设置方法，本文给大家介绍的非常详细，具有一定的参考借鉴价值,需要的朋友可以参考下
2019-09-09
Python之爬虫的头部伪装详解
这篇文章主要介绍了Python之爬虫的头部伪装方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
2025-06-06
python实现删除文件与目录的方法
这篇文章主要介绍了python实现删除文件与目录的方法,详细的分析了涉及Python文件操作的各种方法,需要的朋友可以参考下
2014-11-11
python3.7中安装paddleocr及paddlepaddle包的多种方法
这篇文章主要介绍了python3.7中安装paddleocr及paddlepaddle包,本文通过多种方法给大家介绍的非常详细，对大家的学习或工作具有一定的参考借鉴价值，需要的朋友可以参考下
2020-11-11
Python实现仿射密码的思路详解
这篇文章主要介绍了Python实现仿射密码的思路详解,本文通过实例代码给大家介绍的非常详细，对大家的学习或工作具有一定的参考借鉴价值，需要的朋友可以参考下
2020-04-04
python常用模块(math itertools functools sys
这篇文章主要介绍了python常用模块之math itertools functools sys shutil的使用示例讲解，有需要的朋友可以借鉴参考下，希望能够有所帮助，祝大家多多进步，早日升职加薪
2023-06-06
Python numpy有哪些常用数据类型
Numpy提供了两种基本的对象：ndarray(N-dimensional Array Object)和 ufunc(Universal Function Object)。ndarray是存储单一数据类型的多维数组，而ufunc则是能够对数组进行处理的函数
2023-02-02