Java 正则表达式URL 匹配与源码全解析

 更新时间:2025年04月18日 14:44:06   作者:XU磊260  
在Web应用开发中,我们经常需要对URL进行格式验证,今天我们结合 Java 的 Pattern 和 Matcher 类,深入理解正则表达式在实际应用中的强大功能,并剖析一段实际的 Java 示例源码,感兴趣的朋友一起看看吧

在 Web 应用开发中,我们经常需要对 URL 进行格式验证。今天我们结合 Java 的 PatternMatcher 类,深入理解正则表达式在实际应用中的强大功能,并剖析一段实际的 Java 示例源码。

package com.RegExpInfo;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class Exercise02 {
    public static void main(String[] args) {
//        String content="https://";
//        String content="http://";
//        String content="https://" +
//                "www.bilibili.com/";
//        String content="https://" +
//                "www.bilibili.com/" +
//                "video/" +
//                "BV1fh411y7R8?spm_id_from=333.788.player.switch&vd_" +
//                "source=6fe96db28441a84c79edc35a022cf1c5&p=895" ;
//        String content="https://" +
//                "www.bilibili.com" ;
        String content="https://blog.csdn.net/keshi12354?spm=1000.2115.3001.5343";
//        String regExp="^((https|http)://)";
//        (2)
//        String regExp="^((https|http)://)([\\w-]+\\.)+[\\w-]+\\/";
//        (3)
        String regExp="^((https|http)://)([\\w-]+\\.)+[\\w-]+(\\/([\\w-_?=&./]*))?$";
//        String regExp="^((https|http)://)([\\w-]+\\.)+[\\w-]+(\\/([\\w-_?=&./]*))?$";
        Pattern pattern = Pattern.compile(regExp);
        Matcher matcher = pattern.matcher(content);
        while (matcher.find()) {
            System.out.println(matcher.group(0));
        }
    }
}

1.正则表达式分解:

分布实现:
1. 基础协议匹配 (1)

 String regExp="^((https|http)://)";

功能:只匹配URL开头的协议部分

匹配内容http:// 或 https://

结构

^ 表示字符串开始

(https|http) 匹配"https"或"http"

:// 匹配协议分隔符

目的:先确保能正确识别URL的协议部分

2. 添加域名匹配 (2)

 String regExp="^((https|http)://)([\\w-]+\\.)+[\\w-]+\\/";

新增功能:在协议后添加域名和路径的基本匹配

匹配内容:如 http://example.com/

新增结构

([\\w-]+\\.)+ 匹配一个或多个域名部分(如"www."或"sub.")

\\w 匹配单词字符(字母、数字、下划线)

- 匹配连字符

+ 表示一次或多次

\\. 匹配点号

[\\w-]+ 匹配顶级域名(如"com")

\\/ 匹配结尾的斜杠

目的:扩展匹配完整的域名结构

3. 添加路径和查询参数匹配 (3)

 String regExp="^((https|http)://)([\\w-]+\\.)+[\\w-]+(\\/([\\w-_?=&./]*))?$";

新增功能:支持可选的路径和查询参数

匹配内容:如 http://example.com/path?param=value

新增结构

(\\/([\\w-_?=&./]*))?

\\/ 匹配路径开始的斜杠

[\\w-_?=&./]* 匹配路径和查询参数

包含字母、数字、下划线、连字符、问号、等号、&、点和斜杠

? 表示整个路径部分是可选的

$ 表示字符串结束

目的:使正则表达式能够匹配带路径和参数的完整URL

 4. 最终优化版本

String regExp="^((https|http)://)?([\\w-]+\\.)+[\\w-]+(\\/([\\w-_?=&./]*))?$";

关键改进:使协议部分变为可选

匹配内容:现在可以匹配:

带协议的URL:http://example.com/path

不带协议的URL:example.com/path

修改点

在协议部分 ((https|http)://) 后添加了 ? 使其变为可选

目的:提高正则表达式的灵活性,适应更多使用场景

5.设计思想总结

渐进式开发:从简单到复杂逐步构建正则表达式

模块化设计:每个部分都有明确的功能划分(协议、域名、路径)

灵活性增强:通过添加可选标记(?)使表达式更通用

边界明确:始终使用^$确保匹配整个字符串

字符集合理定义:使用[\w-]等字符集准确描述允许的字符

这种分步构建的方法不仅使正则表达式更易于理解和维护,也方便在开发过程中逐步测试每个部分的匹配效果。

到此这篇关于Java 正则表达式综合实战:URL 匹配与源码解析的文章就介绍到这了,更多相关java正则表达式URL 匹配内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • 如何修改JSON字符串中的敏感信息

    如何修改JSON字符串中的敏感信息

    这篇文章主要介绍了如何修改JSON字符串中的敏感信息,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2021-12-12
  • 下载远程maven仓库的jar 手动放到本地仓库详细操作

    下载远程maven仓库的jar 手动放到本地仓库详细操作

    这篇文章主要介绍了如何下载远程maven仓库的jar 手动放到本地仓库,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2023-03-03
  • Java中6种单例模式写法代码实例

    Java中6种单例模式写法代码实例

    这篇文章主要介绍了Java中6种单例模式写法代码实例,某个类任何情况下只有一个实例,并提供一个全局访问点来获取该实例,Java6种单例模式有2种懒汉式,2种饿汉式,静态内部类 ,枚举类,需要的朋友可以参考下
    2024-01-01
  • MyBatis 原生二级缓存"难以修复"的原因解析及解决方案

    MyBatis 原生二级缓存"难以修复"的原因解析及解决方案

    文章主要讨论了MyBatis原生二级缓存存在的问题,包括结构性缺陷、难以修复等,社区提供了多种增强插件方案,但这些方案也有各自的优缺点,本文结合实例代码介绍的非常详细,感兴趣的朋友跟随小编一起看看吧
    2025-12-12
  • 深入理解java1.8之supplier

    深入理解java1.8之supplier

    这篇文章主要介绍了深入理解java1.8之supplier,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-12-12
  • 用Spring将Service注入到Servlet中的流程步骤

    用Spring将Service注入到Servlet中的流程步骤

    在Java Web开发中,​​Servlet​​是一个非常重要的组件,它用于处理客户端的请求并生成响应,而​Spring​​框架则是一个广泛使用的依赖注入框架,可以帮助开发者管理应用中的对象及其依赖关系,本文将介绍如何使用Spring框架将Service层的对象注入到Servlet中
    2025-01-01
  • Java实现将容器 Map中的内容保存到数组

    Java实现将容器 Map中的内容保存到数组

    这篇文章主要介绍了Java实现将容器 Map中的内容保存到数组,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-09-09
  • 浅谈关于spring profile的误解

    浅谈关于spring profile的误解

    这篇文章主要介绍了浅谈关于spring profile的误解,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2018-08-08
  • SpringBoot+Vue跨域配置(CORS)问题得解决过程

    SpringBoot+Vue跨域配置(CORS)问题得解决过程

    在使用 Spring Boot 和 Vue 开发前后端分离的项目时,跨域资源共享(CORS)问题是一个常见的挑战,接下来,我将分享我是如何一步步解决这个问题的,包括中间的一些试错过程,希望能够帮助到正在经历类似问题的你
    2024-08-08
  • Java中的Semaphore信号量详解

    Java中的Semaphore信号量详解

    这篇文章主要介绍了Java中的Semaphore信号量详解,Semaphore(信号量)是用来控制同时访问特定资源的线程数量,通过协调各个线程以保证合理地使用公共资源,需要的朋友可以参考下
    2023-12-12

最新评论