正则表达式regexp_replace的使用方法

 更新时间:2022年07月27日 09:55:42   作者:_JohnnyChu  
近日由于工作原因使用了regexp_replace函数进行数据处理,下面这篇文章主要给大家介绍了关于正则表达式regexp_replace的使用方法,文中通过实例代码介绍的非常详细,需要的朋友可以参考下

前言

regexp_replace的使用非常灵活,且容易忘记,故做此笔记。 没有过多的介绍使用说明,只是根据个人理解列出很多相似案例,个人觉得通过对比,更容易理解几个参数的使用技巧。

所有案例均是实跑出来的结果。

带颜色的部分是需要留意的地方。

命令格式:

 regexp_replace(source, pattern, replace_string, occurrence)

参数说明:

● source: string类型,要替换的原始字符串。

● pattern: string类型常量,要匹配的正则模式,pattern为空串时抛异常。

● replace_string:string,将匹配的pattern替换成的字符串。

● occurrence: bigint类型常量,必须大于等于0,

大于0:表示将第几次匹配替换成replace_string,

等于0:表示替换掉所有的匹配子串。

其它类型或小于0抛异常。

返回值:

将source字符串中匹配pattern的子串替换成指定字符串后返回,当输入source, pattern, occurrence参数为NULL时返回NULL,若replace_string为NULL且pattern有匹配,返回NULL,replace_string为NULL但pattern不匹配,则返回原串。

常用案例

1、用’#‘替换字符串中的所有数字

SELECT regexp_replace('01234abcde56789','[0-9]','#') AS new_str FROM dual;

结果:#####abcde#####

用’#‘替换字符串中的数字0、9

SELECT regexp_replace(‘01234abcde56789','[09]','#') AS new_str FROM dual;

结果:#1234abcde5678#

2、遇到小写字母或者数字跳过,从匹配到的第4个值开始替换,替换为''

SELECT regexp_replace('abcdefg123456ABC','[a-z0-9]','',4)

结果:abcefg123456ABC

SELECT regexp_replace('abcDEfg123456ABC','[a-z0-9]','',4)

结果:abcDEg123456ABC

SELECT regexp_replace('abcDEfg123456ABC','[a-z0-9]','',7);

结果:abcDEfg13456ABC

遇到非小写字母或者数字跳过,将所有匹配到的值替换为''

SELECT regexp_replace('abcDefg123456ABC','[a-z0-9]','',0);

结果:DABC

3、格式化手机号,将+86 13811112222转换为(+86) 138-1111-2222,’+‘在正则表达式中有定义,需要转义。\\1表示引用的第一个组
SELECT regexp_replace('+86 13811112222','(\\+[0-9]{2})( )([0-9]{3})([0-9]{4})([0-9]{4})','(\\1)\\3-\\4-\\5',0);

结果:(+86)138-1111-2222

SELECT regexp_replace("123.456.7890","([[:digit:]]{3})\\.([[:digit:]]{3})\\.([[:digit:]]{4})","(\\1)\\2-\\3",0) ;
SELECT regexp_replace("123.456.7890","([0-9]{3})\\.([0-9]{3})\\.([0-9]{4})","(\\1)\\2-\\3",0) ;

结果:(123)456-7890

4、将字符用空格分隔开,0表示替换掉所有的匹配子串。

      SELECT regexp_replace('abcdefg123456ABC','(.)','\\1 ',0) AS new_str FROM dual;

结果:a b c d e f g 1 2 3 4 5 6 A B C

      SELECT regexp_replace('abcdefg123456ABC','(.)','\\1 ',2) AS new_str FROM dual;

结果:ab cdefg123456ABC

5、

SELECT regexp_replace("abcd","(.*)(.)$","\\1",0) ;

结果:abc

SELECT regexp_replace("abcd","(.*)(.)$","\\2",0) ;

结果:d

SELECT regexp_replace("abcd","(.*)(.)$","\\1-\\2",0) ;

结果:abc-d

其他案例:

SELECT regexp_replace("abcd","(.)","\\2",1) 结果为"abcd",因为pattern中只定义了一个组,引用的第二个组不存在。
SELECT regexp_replace("abcd","(.*)(.)$","\\2",0) 结果为"d"
SELECT regexp_replace("abcd","(.*)(.)$","\\1",0) 结果为"abc"
SELECT regexp_replace("abcd","(.*)(.)$","\\1-\\2",0) 结果为"abc-d"
SELECT regexp_replace("abcd","a","\\1",0),结果为” \1bcd”,因为在pattern中没有组的定义,所以\1直接输出为字符。

正则符号释义:

总结

到此这篇关于正则表达式regexp_replace使用的文章就介绍到这了,更多相关regexp_replace使用方法内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

最新评论