通过Java正则表达式去掉SQL代码中回车换行和多余空格

 更新时间:2012年09月13日 15:21:18   作者:  
刚才在写一个代码工具,遇到SQL换行和多余空格的问题,导致处理很困难,于是写了一个正则式,搞定了,特分享下方便需要的朋友
复制代码 代码如下:

public static void main(String[] args) {
String sql = "SELECT * FROM \n" +
" `testdb`.`foo` LIMIT 0, 100";
String s = "SELECT * FROM `testdb`.`foo` LIMIT 0, 100";
String sql2 = Pattern.compile(" {2,}").matcher(s).replaceAll(" ");
String sql3 = s.replaceAll(" {2,}"," ");
String sql4 = sql.replace('\r', ' ').replace('\n', ' ').replaceAll(" {2,}"," ");;
String sql5 = sql.replace('\r', ' ').replace('\n', ' ').replaceAll(" {2,}?"," ");;
String sql6 = sql.replace('\r', ' ').replace('\n', ' ').replaceAll(" {2,}+"," ");;
System.out.println(sql2);
System.out.println(sql3);
System.out.println(sql4);
System.out.println(sql5);
System.out.println(sql6);
}

输出结果:
复制代码 代码如下:

SELECT * FROM `testdb`.`foo` LIMIT 0, 100
SELECT * FROM `testdb`.`foo` LIMIT 0, 100
SELECT * FROM `testdb`.`foo` LIMIT 0, 100
SELECT * FROM `testdb`.`foo` LIMIT 0, 100
SELECT * FROM `testdb`.`foo` LIMIT 0, 100
[code]
Process finished with exit code 0
结果可以看出,有一个是没有去掉多余空格的。

可见java中的正则式,同样含义的还有多重写法,呵呵!其实主要是不同数量词匹配模式在作怪:

原版API文档中写道:

Greedy 数量词

X? X,一次或一次也没有
X* X,零次或多次
X+ X,一次或多次
X{n} X,恰好 n 次
X{n,} X,至少 n 次
X{n,m} X,至少 n 次,但是不超过 m 次

Reluctant 数量词

X?? X,一次或一次也没有
X*? X,零次或多次
X+? X,一次或多次
X{n}? X,恰好 n 次
X{n,}? X,至少 n 次
X{n,m}? X,至少 n 次,但是不超过 m 次

Possessive 数量词

X?+ X,一次或一次也没有
X*+ X,零次或多次
X++ X,一次或多次
X{n}+ X,恰好 n 次
X{n,}+ X,至少 n 次
X{n,m}+ X,至少 n 次,但是不超过 m 次


但是,没有对三种方式进行更详细的说明,其实三种模式的区别如下:

Greedy :尝试找到最长的匹配。
Reluctant :尝试找到最短的匹配。
Possessive :也尝试找到最长的匹配。

尽管greedy和possessive迫使一个matcher在进行第一次匹配之前读取整个的text,greedy常常导致为了找到一个match进行多次尝试,然而possessive让一个matcher仅尝试一个match一次。

下面是一个我工具中的方法:
[code]
/**
* 判断一条SQL语句是否已经是分页的SQL
*
* @param sql 源SQL
* @return 是已经分页的SQL时返回ture,否则返回False;
*/
public boolean isAlreadySegmentSQL(String sql) {
return sql.replace('\r', ' ').replace('\n', ' ').replaceAll(" {2,}", " ").matches("(?i).+LIMIT [\\d+ *|\\d *, *\\d+].+");
}

还是正则功能强悍啊!

补充:
下面这个两个注视的正则式,和第三个语意一样的:
复制代码 代码如下:

// regList.put("(?i)bit\\([2-9]\\)\\z", "byte[]");
// regList.put("(?i)bit\\(\\d{2,}\\)\\z", "byte[]");
regList.put("(?i)bit\\((\\d{2,}|[2-9])\\)\\z", "byte[]");

本文出自 “熔 岩” 博客

相关文章

  • 日常收集整理php正则表达式(超常用)

    日常收集整理php正则表达式(超常用)

    正则表达式用于字符串处理、表单验证等场合,实用效率非常高,本文给大家收集整理了些php常用正则表达式,对php常用正则表达式感兴趣的朋友可以参考下本篇文章
    2015-10-10
  • PHP匹配多行的正则表达式分析

    PHP匹配多行的正则表达式分析

    PHP匹配多行的正则表达式分析,需要的朋友可以参考下,多用于采集替换等。
    2011-07-07
  • 前端常用正则表达式汇总

    前端常用正则表达式汇总

    对于正则表达式,我们或许会经常使用,但是又很难记住。这篇文章,我将介绍下简单的正则表达式知识,然后总结前端开发中常用的正则表达式大全,需要的的朋友参考下
    2017-07-07
  • 浅谈正则表达式(Regular Expression)

    浅谈正则表达式(Regular Expression)

    本文介绍了正则表达式的一些学习内容,以及在Javascript、PHP下如何使用正则表达式
    2014-08-08
  • 详解正则表达式及Linux三大文本处理工具

    详解正则表达式及Linux三大文本处理工具

    grep、sed和awk都是文本处理工具。这篇文章主要介绍了正则表达式及Linux三大文本处理工具,需要的朋友可以参考下
    2017-07-07
  • PHP中基于perl的正则表达式处理函数

    PHP中基于perl的正则表达式处理函数

    和正则表达式一样,正则表达式处理函数不能够独立使用,而这必须相结合,才能够完成特定的功能。我们只介绍以preg开头的基于perl的正则表达式。
    2015-10-10
  • asp匹配网址的正则

    asp匹配网址的正则

    这篇文章主要介绍了asp匹配网址的正则,需要的朋友可以参考下
    2007-09-09
  • 去掉字符串前后所有空格的正则表达式

    去掉字符串前后所有空格的正则表达式

    正则表达式,又称正规表示法、常规表示法(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念,接下来通过本文给大家介绍去掉字符串前后所有空格的正则表达式,需要的朋友参考下吧
    2016-03-03
  • javascript正则表达式处理中文和中文标点符号的过程

    javascript正则表达式处理中文和中文标点符号的过程

    在写项目时遇到需要匹配字符串中所有的汉字并且包括简单的中文标点符号,下面这篇文章主要给大家介绍了关于javascript正则表达式处理中文和中文标点符号的相关资料,需要的朋友可以参考下
    2024-02-02
  • ASP正则函数替换分页后的参数

    ASP正则函数替换分页后的参数

    在分页系统里面用到的把page后面得东西都给丢掉
    2008-07-07

最新评论