python与xml数据的交互详解

 更新时间:2022年07月21日 10:50:49   作者:搬砖,赞路费  
这篇文章主要介绍了python与xml数据的交互详解,文章围绕主题站卡详细的内容介绍,具有一定的参考价值,需要的朋友可以参考一下

一 什么是XML?

python与json数据的交互详情 在这篇文章中我们介绍了json是一种独立于编程语言和平台的数据存储和交换方式(格式),其实xml和json基本一样,也是一种用于进行数据存储和交换的方式,并且也独立于编程语言和平台。
XML可扩展标记语言(英语:Extensible Markup Language,简称:XML)是一种标记语言,是从标准通用标记语言(SGML)中简化修改出来的。XML设计的宗旨就是用来传输数据的。

二 XML语法规则

1. xml语法规则

xml的语法规则和html的语法规则很像,但却有着明显的差别。相同的是它们都用标签对来存储数据,但是html的标签都是预定义的,而xml的标签则完全是由编辑者自己定义的。

xml的语法规则如下:

<?xml version="1.0" encoding="utf-8"?>
<CFX>
    <Head>
        <TxCode>CHL2108</TxCode>
        <WorkDate>20220629</WorkDate>
        <WorkTime>164506</WorkTime>
    </Head>
    <WDWMSG>
        <login username="张三" password="123456">张三</login>>
        <PayAcct>1</PayAcct>
        <TrnPwd></TrnPwd>
        <TsmNbr>SSM1050000000001</TsmNbr>
        <PwdKeySeq>001</PwdKeySeq>
        <PwdChkVal>6391E8421C007ED5</PwdChkVal>
        <Reverse>D0E8C46A0B765B</Reverse>
    </WDWMSG>
    <PSBMSG>
        <PayAcct>2</PayAcct>
    </PSBMSG>
    <CHL2108>
        <TrnSerial>2207081541590398</TrnSerial>
        <CHLSerial>STM202206291645060000000000</CHLSerial>
        <PayAcct>6232621151792579</PayAcct>
        <HandOrgName>达拉崩吧班德贝蒂卜多比鲁翁·昆图库塔卡提考特苏瓦西拉松·木大</HandOrgName>
        <PrintAcct>755933363410722</PrintAcct>
        <TrnAmt>70000</TrnAmt>
        <TaxVouNo>010021102121600095</TaxVouNo>
        <TaxOrgCode>23301900000</TaxOrgCode>
        <TrnPlace>0075</TrnPlace>
        <TaxPayCode>1456151561650569</TaxPayCode>
        <TrnSrc>STM</TrnSrc>
    </CHL2108>
</CFX>

xml 必须包含根元素,它是所有其它元素的父元素,如上文中的CFXxml 标签必须是成对出现的,即必须有关关闭标签

<?xml version="1.0" encoding="utf-8"?>

上面这部分是xml的文档声明部分,包含了版本信息和编码方式,是可选的。其他

更多的规则请参考:

2. xml与html的区别

xml和html很像,但区别也很大,具体不同如下:

  • html标签是预定义的,而xml则是由使用者自己定义
  • xml被设计用来传输和存储数据,其焦点是数据的内容
  • html被设计用来显示数据,其焦点是数据的外观

三 python与xml的交互

python获取xml的数据信息一般用xml.dom 来解析,具体如下

1. 获取标签对内的数据

比如提取上面xml文件中PayAcct 标签内的数据

from xml.dom import minidom

#mimidom.parse将xml文件解析成DOM文档
data = minidom.parse('../练习文件/XML练习.XML')
print(type(data))
print('*'*50)

#首先利用data.getElementsByTagName('标签名')提取出标签
payacct = data.getElementsByTagName('PayAcct')
print(type(payacct))
for i in range(len(payacct)):
    print(payacct[i].toxml())#toxml还原xml格式
print('*'*50)

print('PayAcct标签内容如下:')
#再用 firstChild.data 获取标签数据值
for i in range(len(payacct)):
    print(payacct[i].firstChild.data)

如上,minidom.parse()的作用是将xml文档解析成DOM文档,然后通过getElementsTagName()方法提取出标签对,最后通过firstChild.data获取标签内的数据,过程中需要注意的是getElementsTagName()方法提取出标签对返回的结果是一个列表,

结果如下:

>>>
<class 'xml.dom.minidom.Document'>
**************************************************
<class 'xml.dom.minicompat.NodeList'>
<PayAcct>1</PayAcct>
<PayAcct>2</PayAcct>
<PayAcct>6232621151792579</PayAcct>
**************************************************
PayAcct标签内容如下:
1
2
6232621151792579

2. 获取标签属性值

通过getAttribute 获取标签的属性值。如下获取login标签的属性值

<login username="张三" password="123456">张三</login>
from xml.dom import minidom

#mimidom.parse将xml文件解析成DOM文档
data = minidom.parse('../练习文件/XML练习.XML')

#首先利用data.getElementsByTagName('标签名')提取出标签
login = data.getElementsByTagName('login')
print(type(login))
print(login)
for i in range(len(login)):
    print(login[i].toxml())
print('*'*50)

#再用 getAttribute('属性值') 获取标签属性值
print('login的属性值如下:')
print(login[0].getAttribute('username'))
print(login[0].getAttribute('password'))

结果如下:

>>>
<class 'xml.dom.minicompat.NodeList'>
[<DOM Element: login at 0x188b60ec048>]
<login password="123456" username="张三">张三</login>
**************************************************
login的属性值如下:
张三
123456

到此这篇关于python与xml数据的交互详解的文章就介绍到这了,更多相关python与xml数据交互内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Python fileinput模块如何逐行读取多个文件

    Python fileinput模块如何逐行读取多个文件

    这篇文章主要介绍了Python fileinput模块如何逐行读取多个文件,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-10-10
  • jupyter notebook中新建cell的方法与快捷键操作

    jupyter notebook中新建cell的方法与快捷键操作

    这篇文章主要介绍了jupyter notebook中新建cell的方法与快捷键操作,具有很好的参考价值,希望对有所帮助。一起跟随小编过来看看吧
    2020-04-04
  • Pycharm添加虚拟解释器报错问题解决方案

    Pycharm添加虚拟解释器报错问题解决方案

    这篇文章主要介绍了Pycharm添加虚拟解释器报错问题解决方案,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-10-10
  • python自定义函数中的return和print使用及说明

    python自定义函数中的return和print使用及说明

    这篇文章主要介绍了python自定义函数中的return和print使用及说明,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2023-01-01
  • python Celery定时任务的示例

    python Celery定时任务的示例

    这篇文章主要介绍了python Celery定时任务的示例,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2018-03-03
  • 详解python中*号的用法

    详解python中*号的用法

    这篇文章主要介绍了python中*号的用法,文中通过代码给大家介绍了双星号(**)的用法,非常不错,具有一定的参考借鉴价值,需要的朋友可以参考下
    2019-10-10
  • Python 权限控制模块 Casbin

    Python 权限控制模块 Casbin

    这篇文章主要介绍了Python 权限控制模块 Casbin,Casbin是一个强大的、高效的开源访问控制框架,其权限管理机制支持多种访问控制模型,更多相关内容感兴趣的朋友可以参考下面文章内容
    2022-06-06
  • python3:excel操作之读取数据并返回字典 + 写入的案例

    python3:excel操作之读取数据并返回字典 + 写入的案例

    这篇文章主要介绍了python3:excel操作之读取数据并返回字典 + 写入的案例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-09-09
  • python Django 反向访问器的外键冲突解决

    python Django 反向访问器的外键冲突解决

    这篇文章主要介绍了python Django 反向访问器的外键冲突解决,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-05-05
  • Django csrf校验的实现

    Django csrf校验的实现

    这篇文章主要介绍了Django csrf校验的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-05-05

最新评论