JAVA 使用正则提取A标签以及href链接

 更新时间:2021年07月06日 15:08:38   作者:码农致富  
这篇文章主要介绍了JAVA 使用正则提取A标签以及href链接的操作,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教

正则提取A标签以及href链接

代码如下:

String content = "<p>下载地址:<a title=\"持续更新补丁下载地址\" target=\"_blank\" href=\"http://pan.baidu.com/s/xxxx\">持续更新补丁下载地址</a></p><p>";
Pattern pattern_a = compile("<a[^>]*href=(\\\"([^\\\"]*)\\\"|\\'([^\\']*)\\'|([^\\\\s>]*))[^>]*>(.*?)</a>");
Matcher matcher_a = pattern_a.matcher(content);
System.out.println("网站连接");
while (matcher_a.find()) {
    for (int i = 0; i < matcher_a.groupCount(); i++) {
System.out.println(matcher_a.group(i));
    }
}

输出结果如下:

<a title="持续更新补丁下载地址" target="_blank" href="http://pan.baidu.com/s/xxxx">持续更新补丁下载地址</a>
"http://pan.baidu.com/s/xxxx"
http://pan.baidu.com/s/xxxx
null
null

JAVA 匹配正则表达式大全

java匹配字符串表达式在我们数据处理方面是及其重要的,现在就把我这几天数据处理比较常用的向大家介绍一下,常规的一些匹配方式就不介绍了,我们来学习一些特殊的

一.我们先举个例子来看看Java匹配正则表达式

Pattern pattern = Pattern.compile("采购(人名称|人单位|名称).*");
        Matcher matcher = pattern.matcher("采购名称乒位");
        String dateStr = null;
        if (matcher.find()) {
            dateStr = matcher.group(0);
            System.out.println(dateStr);
        }

运行结果如下:

二.匹配表达式的特殊情况

(1)匹配中文字符

Pattern pattern = Pattern.compile("[\\u4e00-\\u9fa5]");
        Matcher matcher = pattern.matcher("2322购购购购232323");
        String dateStr = null;
        if (matcher.find()) {
            dateStr = matcher.group(0);
            System.out.println(dateStr);
        }

运行结果如下:

(2).匹配从规定字符开始所有非换行字符

Pattern pattern = Pattern.compile("1.*");
        Matcher matcher = pattern.matcher("2312购购购购232323");
        String dateStr = null;
        if (matcher.find()) {
            dateStr = matcher.group(0);
            System.out.println(dateStr);
        }

运行结果如图:

(3)使用字符串数组匹配多个条件匹配字符串,这是我在实习进行处理数据的一个例子,希望有助于大家理解:

(4).对于字符串匹配查找多个符合条件的字符字串,我们用到group(),

group(num=0): 匹配的整个表达式的字符串,group() 可以一次输入多个组号,在这种情况下它将返回一个包含那些组所对应值的元组。

groups() : 返回一个包含所有小组字符串的元组,从 1 到 所含的小组号。

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • 解决spring项目找不到Aspect依赖注解的问题

    解决spring项目找不到Aspect依赖注解的问题

    这篇文章主要介绍了解决spring项目找不到Aspect依赖注解的问题,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2021-06-06
  • Spring Boot项目Jar包加密实战教程

    Spring Boot项目Jar包加密实战教程

    本文详细介绍了如何在Spring Boot项目中实现Jar包加密,我们首先了解了Jar包加密的基本概念和作用,然后学习了如何使用Spring Boot的Jar工具和第三方库来实现Jar包的加密和解密,感兴趣的朋友一起看看吧
    2024-02-02
  • IDEA 包转模块的解决步骤

    IDEA 包转模块的解决步骤

    很多朋友遇到这样一个问题,直接在idea拉取代码,发现创建的模块包类型不一样了,类似这样的问题该如何处理呢?很多朋友向小编求助,在这统一回答大家,需要的朋友参考下本文吧
    2021-06-06
  • Spring中的refreshContext源码分析

    Spring中的refreshContext源码分析

    这篇文章主要介绍了Spring中的refreshContext源码分析,在SpringBoot启动流程中,主要的两个阶段是初始化SpringApplication对象以及SpringApplication.run方法执行的内容,今天主要细讲的是SpringApplication.run中的刷新容器refreshContext方法,需要的朋友可以参考下
    2023-12-12
  • Springboot整合hutool验证码的实例代码

    Springboot整合hutool验证码的实例代码

    在 Spring Boot 中,你可以将 Hutool 生成验证码的功能集成到 RESTful API 接口中,这篇文章主要介绍了Springboot整合hutool验证码,需要的朋友可以参考下
    2024-08-08
  • Spring Cloud Gateway编码实现任意地址跳转的示例

    Spring Cloud Gateway编码实现任意地址跳转的示例

    本文主要介绍了Spring Cloud Gateway编码实现任意地址跳转的示例,文中通过示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2021-12-12
  • Spring ComponentScan的扫描过程解析

    Spring ComponentScan的扫描过程解析

    这篇文章主要介绍了spring ComponentScan的扫描过程解析,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2022-03-03
  • SpringBoot之bootstrap和application的区别解读

    SpringBoot之bootstrap和application的区别解读

    这篇文章主要介绍了SpringBoot之bootstrap和application的区别及说明,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2023-03-03
  • Java synchronized与CAS使用方式详解

    Java synchronized与CAS使用方式详解

    提到Java的知识点一定会有多线程,JDK版本不断的更迭很多新的概念和方法也都响应提出,但是多线程和线程安全一直是一个重要的关注点。比如说我们一入门就学习的synchronized怎么个实现和原理,还有总是被提到的CAS是啥,他和synchronized关系是啥?请往下看
    2023-01-01
  • Java Agents代理是什么

    Java Agents代理是什么

    Java代理Agents通过提供使我们能够侵入JVM中正在运行的Java程序的服务,在最底层工作。Java的这一强大但不可思议的部分具有在错误操作时使JVM崩溃的能力。本文简要介绍了这个概念,并介绍了它的工作原理。需要的朋友可以参考下面文章的具体内容
    2021-09-09

最新评论