java正则表达式如何获取xml文件中指定节点的值

 更新时间:2023年06月17日 16:42:07   作者:FinelyYang  
这篇文章主要介绍了java正则表达式如何获取xml文件中指定节点的值问题,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教

正则表达式获取xml文件中指定节点的值

/**
     * 获取指定标签中的内容
     *
     * @param xml   传入的xml字符串
     * @param label 指定的标签
     */
    public static List<String> getFieldListByRegex(String xml, String label) {
        //正则表达式
        String regex = "<" + label + ">(.*?)</" + label + ">";
        Pattern pattern = Pattern.compile(regex);
        Matcher m = pattern.matcher(xml);
        //匹配的有多个
        List<String> fieldList = new ArrayList<>();
        while (m.find()) {
            if (StringUtils.isNotEmpty(m.group(1).trim())) {
                fieldList.add(m.group(1).trim());
            }
        }
        return fieldList;
    }

正则表达式的使用以及解析XML

在日常使用正则表达式的时候,常常就是直接百度匹配这个字符串的正则表达式。正则表达式的规则还是比较多的,一段时间不用就容易忘了。

这里就不得不提及两个非常通用的匹配方法 贪婪匹配惰性匹配,在做爬虫或者提取字符串中的数据时,基本使用这两个都能搞定。

正则部分

定义

  • 贪婪匹配: .*
  • 惰性匹配:.*?
表达式含义
.是任意字符 可以匹配任何单个字符。
*匹配0个或多个正好在它之前的那个字符。
?匹配0个或1个正好在它之前的那个字符。
.*匹配0个或多个任意字符
.?匹配0个或1个任意字符
  • .* 具有贪婪模式匹配到不能匹配为止
  • .*? 则相反匹配到匹配到一个后,就继续往下匹配不会回溯,具有最小匹配原则性质。

举例

直接上栗子

网上的正则测试也挺多的

如字符串:{123}}}}

  • 使用{.*}匹配的结果是{123}}}}
  • 使用{.*?}匹配的结果是{123}

这个应该就能很明显看出贪婪与惰性匹配的区别所在了。

在爬虫中,我们常常使用.*去匹配我们不需要的字符串,使用.*?来匹配我们需要提取的。

Java正则部分

正则表达式的匹配是不区分编程语言的,但是在语言的使用中也会有一些疑问如:

已经匹配上子字符串了如何提取自己想要的内容?

匹配到了多个子字符串,如何获取到所有匹配到的子字符串中的数据?

find()和matches()的区别是什么?

直接上代码

单子字符串提取数据

现在有这么个需要匹配的字符串,该如何将所有人的名字都提取出来呢

<areas><area>璃月</area></areas>
import org.junit.jupiter.api.Test;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class ReTest {
    @Test
    public void t1(){
        String xml = "<areas><area>璃月</area></areas>";
        Pattern compile = Pattern.compile("<area>(.*?)</area>");
        Matcher m = compile.matcher(xml);
        if (m.find()){
            System.out.println(m.group(0));
            System.out.println(m.group(1));
        }
    }
}
<area>璃月</area>
璃月

<area>(.*?)</area>中的()是给我们的匹配到的子字符串定义分组,group(0)是匹配到的字符串的全部,而group(1)则是我们定义的匿名分组。

既然有匿名分组,自然有命名分组代码如下

@Test
	public void t2(){
	    String xml = "<areas><area>璃月</area></areas>";
	    Pattern compile = Pattern.compile("<area>(?<area>.*?)</area>");
	    Matcher m = compile.matcher(xml);
	    if (m.find()){
	        System.out.println(m.group(0));
	        System.out.println("匿名分组:"+m.group(1));
	        System.out.println("命名分组:"+m.group("area"));
	    }
	}
<area>璃月</area>
匿名分组:璃月
命名分组:璃月

代码中还有一个方法m.find(),该方法如果找到满足条件的正则表达式就会返回ture。也可以传入一个int,如

m.find(5)表示从字符串的第5位开始匹配。

其实还有一个方法也是匹配字符串m.matches():该方法是整个原始字符串满足正则才返回true,因此该方法适合于匹配字符串是否满足某个格式时使用,如手机号,身份证,邮箱等。

多子字符串提取数据

如下字符串,如何将所有的area都提取出来?

<areas><area>蒙德</area><area>璃月</area><area>稻妻</area><area>须弥</area></areas>

匹配这个字符串与上面的相同,正则表达式都不需要改变但提取的时候,需要进行循环提取。

代码如下

@Test
    public void t3(){
        String xml = "<areas><area>蒙德</area><area>璃月</area><area>稻妻</area><area>须弥</area></areas>";
        Pattern compile = Pattern.compile("<area>(?<area>.*?)</area>");
        Matcher m = compile.matcher(xml);
        int start = 0;
        while (m.find(start)){
            System.out.println(m.group(1));
            start = m.end(); // m.end() 返回当前到了哪个位置
        }
    }

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • 在mybatis中使用mapper进行if条件判断

    在mybatis中使用mapper进行if条件判断

    这篇文章主要介绍了在mybatis中使用mapper进行if条件判断,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-01-01
  • Java8新日期时间API的20个使用示例

    Java8新日期时间API的20个使用示例

    这篇文章主要介绍了Java8新日期时间API的20个使用示例,为了学习Java 8的这个新库,这里我创建了20个以任务为导向的例子,需要的朋友可以参考下
    2015-03-03
  • Java由浅入深全面讲解方法的使用

    Java由浅入深全面讲解方法的使用

    方法,也称函数,如果想要重复一段或者多段代码块的使用,可以将这些代码封装成一个方法,方法具体表现为某种行为,使用方法可以提高代码的复用性
    2022-04-04
  • Java构造方法实例详解(动力节点java学院整理)

    Java构造方法实例详解(动力节点java学院整理)

    其实java构造方法很简单,下面通过示例给大家分享java构造方法,非常不错,具有参考借鉴价值,需要的朋友参考下
    2017-04-04
  • JavaAPI中BigInteger、BigDecimal的使用方法及应用

    JavaAPI中BigInteger、BigDecimal的使用方法及应用

    这篇文章主要给大家介绍了关于JavaAPI中BigInteger、BigDecimal的使用方法及应用,BigInteger是Java中用于表示任意大小整数的类,它提供了加、减、乘、除等多种运算方法,适用于大整数处理和高精度计算场景,需要的朋友可以参考下
    2024-11-11
  • SpringMVC响应视图和结果视图详解

    SpringMVC响应视图和结果视图详解

    这篇文章主要介绍了SpringMVC响应视图和结果视图,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2021-09-09
  • Java单例模式实例简述

    Java单例模式实例简述

    这篇文章主要介绍了Java单例模式,在Java应用程序设计中有着非常重要的作用,本文以实例形式对此加以简单分析,需要的朋友可以参考下
    2014-09-09
  • Java之Scanner.nextLine()读取回车的问题及解决

    Java之Scanner.nextLine()读取回车的问题及解决

    这篇文章主要介绍了Java之Scanner.nextLine()读取回车的问题及解决,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2023-04-04
  • 解读Spring配置与服务组件的关系和注入机制

    解读Spring配置与服务组件的关系和注入机制

    这篇文章主要介绍了解读Spring配置与服务组件的关系和注入机制,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2024-09-09
  • Java面向对象之内部类案例讲解

    Java面向对象之内部类案例讲解

    这篇文章主要介绍了Java面向对象之内部类案例讲解,本篇文章通过简要的案例,讲解了该项技术的了解与使用,以下就是详细内容,需要的朋友可以参考下
    2021-08-08

最新评论