对pandas处理json数据的方法详解

更新时间：2019年02月08日 17:00:58 作者：qq_24499417

今天小编就为大家分享一篇对pandas处理json数据的方法详解，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

今天展示一个利用pandas将json数据导入excel例子,主要利用的是pandas里的read_json函数将json数据转化为dataframe。

先拿出我要处理的json字符串：

strtext='[{"ttery":"min","issue":"20130801-3391","code":"8,4,5,2,9","code1":"297734529","code2":null,"time":1013395466000},\
{"ttery":"min","issue":"20130801-3390","code":"7,8,2,1,2","code1":"298058212","code2":null,"time":1013395406000},\
{"ttery":"min","issue":"20130801-3389","code":"5,9,1,2,9","code1":"298329129","code2":null,"time":1013395346000},\
{"ttery":"min","issue":"20130801-3388","code":"3,8,7,3,3","code1":"298588733","code2":null,"time":1013395286000},\
{"ttery":"min","issue":"20130801-3387","code":"0,8,5,2,7","code1":"298818527","code2":null,"time":1013395226000}]'

pandas.read_json的语法如下：

pandas.read_json(path_or_buf=None, orient=None, typ='frame', dtype=True, 
convert_axes=True, convert_dates=True, keep_default_dates=True, 
numpy=False, precise_float=False, date_unit=None, encoding=None, 
lines=False, chunksize=None, compression='infer')

第一参数就是json文件路径或者json格式的字符串。

第二参数orient是表明预期的json字符串格式。orient的设置有以下几个值：

(1).'split' : dict like {index -> [index], columns -> [columns], data -> [values]}

这种就是有索引，有列字段,和数据矩阵构成的json格式。key名称只能是index,columns和data。

pandas处理json数据

'records' : list like [{column -> value}, ... , {column -> value}]

这种就是成员为字典的列表。如我今天要处理的json数据示例所见。构成是列字段为键,值为键值,每一个字典成员就构成了dataframe的一行数据。

'index' : dict like {index -> {column -> value}}

以索引为key,以列字段构成的字典为键值。如：

pandas处理json数据

'columns' : dict like {column -> {index -> value}}

这种处理的就是以列为键，对应一个值字典的对象。这个字典对象以索引为键,以值为键值构成的json字符串。如下图所示:

pandas处理json数据

'values' : just the values array。

values这种我们就很常见了。就是一个嵌套的列表。里面的成员也是列表，2层的。

pandas处理json数据

主要就说下这两个参数吧。下面我们回到示例中来。我们看前面可以发现示例是一个orient为records的json字符串。

这样就好处理了。看代码：

# -*- coding: utf-8 -*-
"""
Created on Sun Aug 5 09:01:38 2018
@author: FanXiaoLei
"""
import pandas as pd
strtext='[{"ttery":"min","issue":"20130801-3391","code":"8,4,5,2,9","code1":"297734529","code2":null,"time":1013395466000},\
{"ttery":"min","issue":"20130801-3390","code":"7,8,2,1,2","code1":"298058212","code2":null,"time":1013395406000},\
{"ttery":"min","issue":"20130801-3389","code":"5,9,1,2,9","code1":"298329129","code2":null,"time":1013395346000},\
{"ttery":"min","issue":"20130801-3388","code":"3,8,7,3,3","code1":"298588733","code2":null,"time":1013395286000},\
{"ttery":"min","issue":"20130801-3387","code":"0,8,5,2,7","code1":"298818527","code2":null,"time":1013395226000}]'
 
df=pd.read_json(strtext,orient='records')
df.to_excel('pandas处理json.xlsx',index=False,columns=["ttery","issue","code","code1","code2","time"])

最终写入excel如下图：

pandas处理json数据

以上这篇pandas处理json数据就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持脚本之家。

您可能感兴趣的文章:

pandas
json

python 用opencv实现图像修复和图像金字塔
这篇文章主要介绍了python 如何用opencv实现图像修复和图像金字塔，帮助大家更好的理解和使用python处理图片，感兴趣的朋友可以了解下
2020-11-11
python实现while循环打印星星的四种形状
今天小编就为大家分享一篇python实现while循环打印星星的四种形状，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2019-11-11
pytorch torch.expand和torch.repeat的区别详解
这篇文章主要介绍了pytorch torch.expand和torch.repeat的区别详解，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2019-11-11
详解如何使用Python实现删除重复文件
这篇文章主要为大家详细介绍了如何利用Python实现删除重复文件功能，文中的示例代码讲解详细，对我们学习Python有一定帮助，需要的可以参考一下
2022-10-10
聊聊Pytorch torch.cat与torch.stack的区别
这篇文章主要介绍了Pytorch torch.cat与torch.stack的区别说明，具有很好的参考价值，希望对大家有所帮助。如有错误或未考虑完全的地方，望不吝赐教
2021-05-05
使用Flask-Login模块实现用户身份验证和安全性
当你想要在你的Flask应用中实现用户身份验证和安全性时，Flask-Login这个扩展将会是你的最佳伙伴，它提供了一组简单而强大的工具来处理，下面我们就来看看具体的操作方法吧
2023-08-08
基于Python+Pygame实现变异狗大战游戏
只有你想不到，没有我找不到写不了的好游戏！这篇文章就来和大家分享一下如何基于Python+Pygame实现变异狗大战游戏，感兴趣的可以了解一下
2023-03-03
Python数据结构与算法之常见的分配排序法示例【桶排序与基数排序】
这篇文章主要介绍了Python数据结构与算法之常见的分配排序法,结合实例形式分析了桶排序与基数排序的相关原理及实现技巧,需要的朋友可以参考下
2017-12-12
Python实现定时备份mysql数据库并把备份数据库邮件发送
这篇文章主要介绍了Python实现定时备份mysql数据库并把备份数据库邮件发送的相关资料,需要的朋友可以参考下
2018-03-03
Python制作简单的网页爬虫
自己写的一个爬虫，模仿了python核心编程书里的程序，有详细的注释。是我一个理解学习的过程吧。有需要的小伙伴可以参考下
2015-11-11