python实现xml转json文件的示例代码

 更新时间:2020年12月30日 10:20:48   作者:撒欢  
这篇文章主要介绍了python实现xml转json文件的示例代码,帮助大家更好的理解和使用python,感兴趣的朋友可以了解下

使用了Python的 xml.etree.ElementTree 库

xml.etree.ElementTree 库简介

xml.etree.ElementTree模块实现了一个简单而高效的API用于解析和创建XML数据。xml.etree.ElementTree模块对于恶意构造的数据是不安全的。如果您需要解析不受信任或未经验证的数据,请参阅XML漏洞。
参考文献:https://docs.python.org/3.6/library/xml.etree.elementtree.html

from xml.etree import ElementTree
import json

LISTTYPE = 1
DICTTYPE = 0

def getDictResults(res_dicts, iters):
  result_dicts = {}
  for iter in iters.getchildren():
    iterxml(iter, result_dicts)

  if result_dicts:
    res_dicts[iters.tag].update(result_dicts)

def getListResults(res_dicts, iters):
  result_lists = []
  for iter in iters.getchildren():
    result_dicts = {}
    iterxml(iter, result_dicts)
    result_lists.append(result_dicts.copy())
    del(result_dicts)
  
  if result_lists:
    if len(res_dicts[iters.tag].items()) == 0:
      res_dicts[iters.tag] = result_lists.copy()
    else:
      for resobj in result_lists:
        resobjkey = list(resobj.keys())[0]
        if res_dicts[iters.tag].get(resobjkey) == None:
          res_dicts[iters.tag].update(resobj)
        else:
          if type(res_dicts[iters.tag][resobjkey]) == list:
            res_dicts[iters.tag][resobjkey].append(resobj[resobjkey].copy())
          else:
            old_value = res_dicts[iters.tag][resobjkey]
            res_dicts[iters.tag][resobjkey] = []
            res_dicts[iters.tag][resobjkey].append(old_value)
            res_dicts[iters.tag][resobjkey].append(resobj[resobjkey].copy())

    del(result_lists)

def checkxmlchildrentype(iters):
  taglist = []
  for iter in iters.getchildren():
    taglist.append(iter.tag)

  if len(set(taglist)) == len(taglist):
    return DICTTYPE
  else:
    return LISTTYPE

def getResults(res_dicts, iters):
  if checkxmlchildrentype(iters):
    return getListResults(res_dicts, iters)
  else:
    return getDictResults(res_dicts, iters)

#@res_dicts  {}
def iterxml(iter, res_dicts):
  res_dicts[iter.tag] = {}

  if iter.attrib:
    for k,v in dict(iter.attrib).items():
      res_dicts[iter.tag].update({k : v})
  
  if iter.text is not None and iter.text.strip() != "":
    res_dicts[iter.tag].update({"__XmlTagText__" : iter.text.strip()})
  
  if iter.getchildren():
    getResults(res_dicts, iter)

def parserxmltojson(file_path):
  try:
    tree = ElementTree.parse(file_path)
  except Exception as e:
    #multi-byte encodings are not supported  把字符集改成utf-8就可以
    #encoding specified in XML declaration is incorrect  xml encoding标识和文件的字符集不同
    #syntax error  语法错误,乱码等
    #not well-formed (invalid token)  编辑器点击后字符集被修改成ASCII等,或者文件本身字符集和xml encoding不相同
    print("Parser {} Error, Errmsg: {}".format(file_path, e))
    return ""

  if tree is None:
    print("{} is None.".format(file_path))
    return ""

  root = tree.getroot()

  report = {}
  iterxml(root, report)
  #return getDictResults(root)

  return report

if __name__ == "__main__":
  jsonret = parserxmltojson("test.xml")
  with open("test.json", "w", encoding="utf-8") as fd:
    fd.write(json.dumps(jsonret, ensure_ascii=False, indent=4))
  print(json.dumps(jsonret, ensure_ascii=False, indent=4))

以上就是python实现xml转json文件的示例代码的详细内容,更多关于python实现xml转json文件的资料请关注脚本之家其它相关文章!

相关文章

  • 详解Python Flask API 示例演示(附cookies和session)

    详解Python Flask API 示例演示(附cookies和session)

    这篇文章主要为大家介绍了Python Flask API 示例演示(附cookies和session)详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-03-03
  • 安装Qbot并且用vscode进行配置的详细步骤

    安装Qbot并且用vscode进行配置的详细步骤

    文章介绍了如何在Python 3.8环境下使用conda创建虚拟环境并安装Qbot项目,本文分步骤结合图文给大家介绍的非常详细,感兴趣的朋友一起看看吧
    2025-01-01
  • 如何利用Python让Excel快速按条件筛选数据

    如何利用Python让Excel快速按条件筛选数据

    平时总是要对Excel进行操作,整理了一下平时经常会用到的操作,下面这篇文章主要给大家介绍了关于如何利用Python让Excel快速按条件筛选数据的相关资料,文中通过示例代码介绍的非常详细,需要的朋友可以参考下
    2022-12-12
  • python 自动化偷懒的四个实用操作

    python 自动化偷懒的四个实用操作

    这篇文章主要介绍了python 自动化偷懒的四个实用操作,帮助大家更好的理解和学习使用python,感兴趣的朋友可以了解下
    2021-04-04
  • python numpy中对ndarry按照index增删改查

    python numpy中对ndarry按照index增删改查

    这篇文章主要介绍了python numpy中对ndarry按照index增删改查,在numpy中的ndarry是一个数组,因此index就是位置下标,注意下标是从0开始,接下来一起进入下面文章了解详细内容吧
    2022-02-02
  • 用Pygal绘制直方图代码示例

    用Pygal绘制直方图代码示例

    这篇文章主要介绍了用Pygal绘制直方图代码示例,具有一定借鉴价值,需要的朋友可以了解下。
    2017-12-12
  • 如何在向量化NumPy数组上进行移动窗口

    如何在向量化NumPy数组上进行移动窗口

    这篇文章主要介绍了如何在向量化NumPy数组上进行移动窗口的操作,具有很好的参考价值,希望对大家有所帮助。
    2021-05-05
  • Python中的时序分析和可视化案例详解

    Python中的时序分析和可视化案例详解

    每个数据集都有自己的特征,我们使用它们的特征作为特征来深入了解数据,在本文中,我们将讨论一种重要的数据集,即时间序列数据,感兴趣的可以了解下
    2024-02-02
  • python语言变量和数据类型基础学习

    python语言变量和数据类型基础学习

    这篇文章主要为大家介绍了python语言变量和数据类型基础学习,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-10-10
  • Python3日期与时间戳转换的几种方法详解

    Python3日期与时间戳转换的几种方法详解

    我们可以利用内置模块 datetime 获取当前时间,然后将其转换为对应的时间戳。这篇文章主要介绍了Python3日期与时间戳转换的几种方法,需要的朋友可以参考下
    2019-06-06

最新评论