Python3使用xml.dom.minidom和xml.etree模块儿解析xml文件封装函数的方法

 更新时间:2019年09月23日 11:04:42   作者:撒欢  
这篇文章主要介绍了Python3使用xml.dom.minidom和xml.etree模块儿解析xml文件,封装函数的方法,代码简单易懂,非常不错,具有一定的参考借鉴价值,需要的朋友可以参考下

总结了一下使用Python对xml文件的解析,用到的模块儿如下:

分别从xml字符串和xml文件转换为xml对象,然后解析xml内容,查询指定信息字段。

from xml.dom.minidom import parse, parseString
from xml.etree import ElementTree
import xml.dom.minidom
"""
Get XML String info 查询属性值
  response:xml string
  tag:xml tag
  element:xml attribute
"""
def get_xml_info(response, element):
  DOMTree = xml.dom.minidom.parseString(response)
  return DOMTree.documentElement.getAttribute(element)
"""
Get XML String info 查询制定名称的特定标签id
  xmlstring:xml str
  return config id
"""
def get_config_id_from_xml(xmlstring, scan):
  root = ElementTree.fromstring(xmlstring)
  configs = root.findall('config')
  for config in configs:
    config_name = config.find('name').text
    if config_name == scan:
      return config.attrib['id']
"""
Get XML String info 查询指定id
  xmlstring:xml str
  return report id
"""
def get_report_id_from_xml(xmlstring):
  root = ElementTree.fromstring(xmlstring)
  report_id = root.find('report_id').text
  return report_id
"""
Get XML String info
  xmlstring:xml str
  return progress 
"""
def get_progress_from_xml(xmlstring):
  root = ElementTree.fromstring(xmlstring)
  task = root.find('task')
  progress = float(task.find('progress').text)
  if progress < 0:
    return 100.0
  else:
    return progress
"""
Get XML Report info 从xml文件查询
  file_path : report path
"""
def get_xml_report(file_path):
  report = {}
  result_dicts = {}
  resultsList = []
  try:
    root = ElementTree.parse(file_path)
  except:
    return {}
  if root is not None:
    creation_time = root.find("creation_time")
    if creation_time is not None:
      report[creation_time.tag] = creation_time.text
    if root.find("report") is not None:
      scan_start = root.find("report").find("scan_start")
      if scan_start is not None:
        if scan_start.text:
          report[scan_start.tag] = scan_start.text
    results = root.getiterator("result")
    if results is not None:
      for result in results:
        if result.find("threat") is not None:
          if result.find("threat").text != "Log":
            resultsList.append(getResults(result))
  report["Results"] = resultsList
  return report

总结

以上所述是小编给大家介绍的Python3使用xml.dom.minidom和xml.etree模块儿解析xml文件封装函数的方法,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对脚本之家网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

相关文章

  • 对python For 循环的三种遍历方式解析

    对python For 循环的三种遍历方式解析

    今天小编就为大家分享一篇对python For 循环的三种遍历方式解析,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-02-02
  • python实现基于信息增益的决策树归纳

    python实现基于信息增益的决策树归纳

    这篇文章主要为大家详细介绍了Python实现基于信息增益的决策树归纳,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-12-12
  • 一文学会使用OpenCV构建文档扫描仪

    一文学会使用OpenCV构建文档扫描仪

    本文将使用 OpenCV,创建一个简单的文档扫描仪,就像常用的摄像头扫描仪应用程序一样,这篇文章主要给大家介绍了关于使用OpenCV构建文档扫描仪的相关资料,需要的朋友可以参考下
    2022-11-11
  • Python中os.environ环境变量交互机制的使用

    Python中os.environ环境变量交互机制的使用

    os.environ是Python中读取和操作环境变量的字典,继承自系统环境变量,本文主要介绍了os.environ环境变量交互机制的使用,感兴趣的可以了解一下
    2025-08-08
  • Python自动化办公之文件整理脚本分享

    Python自动化办公之文件整理脚本分享

    这篇文章主要为大家分享了一个Python自动化办公脚本,可以实现文件整理,这是一个很有用的技能,可以帮助你管理你的电脑上的各种文件,需要的可以收藏一下
    2023-08-08
  • Python数据类型和常用操作

    Python数据类型和常用操作

    这篇文章主要介绍了Python数据类型和常用操作,数值数据类型用于存储数值,数据类型不可改变,改变会分配一个新的对象,下文更多相关内容介绍需要的小伙伴可以参考一下
    2022-04-04
  • python爬虫学习笔记之pyquery模块基本用法详解

    python爬虫学习笔记之pyquery模块基本用法详解

    这篇文章主要介绍了python爬虫学习笔记之pyquery模块基本用法,结合实例形式详细分析了python爬虫pyquery模块基本功能、用法及操作注意事项,需要的朋友可以参考下
    2020-04-04
  • python3 字符串知识点学习笔记

    python3 字符串知识点学习笔记

    字符串是 Python 中最常用的数据类型。我们可以使用引号('或")来创建字符串
    2020-02-02
  • python常用运维脚本实例小结

    python常用运维脚本实例小结

    这篇文章主要介绍了python常用运维脚本实例小结,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-02-02
  • Python基于正则表达式实现计算器功能

    Python基于正则表达式实现计算器功能

    这篇文章主要介绍了Python基于正则表达式实现计算器功能,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-07-07

最新评论