Ruby程序中正则表达式的基本使用教程

更新时间：2016年05月19日 16:28:24 作者：kevinhua

和Python与Perl一样,Ruby对正则表达式的支持也是相当好的,这里送出整理的Ruby程序中正则表达式的基本使用教程,需要的朋友可以参考下

Ruby大部分的内置类型都和其它的编程语言很相似。主要有strings，integers，floats，arrays等等。然而，只有脚本语言，如Ruby，Perl，和awk等提供了内置表达式类型的支持。正则表达式尽管比较隐蔽，但却是一个很强大的文本处理工具。

正则表达式是使用指定的模式匹配字符串的一种简单的方法。在Ruby中，创建正则表达式的典型方式是把模式写在两个斜线之间/pattern/。

毕竟，Ruby就是Ruby，正则表达式也是对象，也能像对象般操作。

例如，你可以使用下面的正则表达式写一个模式，它匹配一个字符串中包含有Perl或Python。

<!--more-->

/Perl|Python/

在正斜线体内，是两个我们要匹配的字符串，它们使用"|"分隔。这个管道符的意思是"左边的或者右边的"，在这个模式中是Perl或者Python。

你还可以在模式中使用括号，就像是在算术表达式中使用的那样，因此这个模式还可以写成

/P(erl|ython)/

你还可以在模式中指定重复。例如加号，/ab+c/匹配字符串中一个a后面有一个或多个b然后跟着是一个c。把加号换成星号，/ab*c/创建的正则表达式是匹配一个a后面跟着0个或多个b然后跟着是一个c。

你还可以在模式中匹配一组字符。常用的字符类型例子有\s，它匹配一个空白字符(space，tab，换行符，等等)；\d匹配任意数字；\w匹配任意的典型单词字符。句号(.)匹配(基本上)任意字符。

我们把所有这些组合起来，做成实用的正则表达式。

/\d\d:\d\d:\d\d/ # a time such as 12:34:56
/Perl.*Python/  # Perl, zero or more other chars, then Python
/Perl Python/  # Perl, a space, and Python
/Perl *Python/  # Perl, zero or more spaces, and Python
/Perl +Python/  # Perl, one or more spaces, and Python
/Perl\s+Python/ # Perl, whitespace characters, then Python
/Ruby (Perl|Python)/ # Ruby, a space, and either Perl or Python

一但创建了一个模式，不能使用它是件很郁闷的事情。匹配操作符=~用来对一个字符串进行正则表达式匹配。如果匹配成功，=~返回第一次匹配成功的位置，否则它返回nil。也就是说，你可以在if和while的条件声明中使用正则表达式。例如下面的代码片段，

如果字符串中包含有文本Perl或Python时，输出一条信息。

puts "Scripting language mentioned: #{line}" if line =~ /Perl|Python/

你能使用Ruby替换所有出现有Perl和Python的地方。

line.gsub(/Perl|Python/, 'Ruby')

从iHower的Ruby on Rails实战圣经中摘一个示例，用正则表达式抓取手机号码：

phone = "139-1234-5678"
if phone =~ /(\d{3})-(\d{4})-(\d{4})/
 start_with = $1
 mid_num = $2
 end_as = $3
end

一般规则(为正常显示，都放在代码块内)

/a/匹配字符a。
/\?/匹配特殊字符?。特殊字符包括^, $, ? , ., /, \, [, ], {, }, (, ), +, *.
.匹配任意字符，例如/a./匹配ab和ac。
/[ab]c/匹配ac和bc,[]之间代表范围。例如：/[a-z]/ , /[a-zA-Z0-9]/。
/[^a-zA-Z0-9]/匹配不在该范围内的字符串。
/[\d]/代表任意数字
/[\w]/代表任意字母，数字或者_
/[\s]/代表空白字符，包括空格，TAB和换行。
/[\D]/，/[\W]/，/[\S]/均为上述的否定情况。

高级规则

?代表0或1个字符。/Mrs?\.?/匹配"Mr"，"Mrs"，"Mr."，"Mrs."。
*代表0或多个字符。/Hello*/匹配"Hello","HelloJack"。
+代表1或多个字符。/a+c/匹配："abc"，"abbdrec"等等。
/d{3}/匹配3个数字。
/d{1,10}/匹配1-10个数字。
/d{3,}/匹配3个数字以上。
/([A-Z]\d){5}/匹配首位是大写字母，后面4个是数字的字符串。

正则表达式操作

String和RegExp均支持=~和match两个查询匹配方法：

puts "I can say my name" =~ /name/ #-> 13

a = /name/.match("I can say my name, my name I can say") #-> a is MatchData
puts a[0] #-> name

可以看出，如果能够匹配，=~返回匹配的字符串位置，而match返回一个MatchData对象。如果不匹配，则返回nil。MatchData可以取出其中符合各个子匹配(或子模式)的内容，看下面的例子：

b1=/[A-Za-z]+,[A-Za-z]+,Mrs?\./.match("Jack,Wang,Mrs., nice person")
puts b1[0] #-> Jack,Wang,Mrs

b2=/(([A-Za-z]+),([A-Za-z]+)),Mrs?\./.match("Jack,Wang,Mrs., nice person:)
puts b2[0] #-> Jack,Wang,Mrs
puts b2[1] #-> Jack,Wang
puts b2[2] #-> Jack
puts b2[3] #-> Wang

m[0]返回匹配匹配主表达式的字符串，下面的方法是等同的：m[n]==m.captures[n]

Ruby也自动的为我们填写一些全局变量，它们以数字做名，$1, $2, 等等，$1包含的是正则表达式中从左侧开始的第一对小括号内的子模式所匹配的字符串，以此类推。我们看出匹配时，是从外到内，从左到右的顺序。

贪婪量词和不贪婪量词

量词*(表示零个或多个)和+(表示一个或多个)是贪婪的，它们会匹配尽可能多的字符,我们可以在*和+后面加一个?，使它成为非贪婪量词：

下面代码是： 1个或多个字符后接一个感叹号。

teststr="abcd!efg!"
match=/.+!/.match(teststr)
puts match[0] #-> abcd!efg!

limitmatch=/.+?!/.match(teststr)
puts limitmatch[0] #-> abcd!

锚

锚是指必须满座一定的条件，才能继续匹配：

^ 行首
$ 行尾
\A 字符串的开始
\z 字符串的结尾
\Z 字符串的结尾(不包括最后的换行符)
\b 单词边界

c=/\b\w+\b/.match("!!Stephen**")

puts c[0] #-> Stephen

前视断言

前视断言表示想要知道下一个指定的是什么，但并不匹配

肯定的前视断言 (？=)
假设我们想要匹配一个数的序列，该序列以一个圆点结束，但并不想把圆点作为模式匹配的一部分

teststr="123 456 789. 012"
m=/\d+(?=\.)/.match(teststr)
puts m[0] #-> 789

否定的前视断言 (?!)
上例，如果/\d+(?=\.)/改为/\d+(?!\.)/，则puts m[0]输出显示为 123 。

修饰语

修饰语位于正则表达式最结束正则表达式的正斜杠的后面

1.i使正则表达式对大小写不敏感
例如，/abc/i可以匹配Abc，abc，ABC等。

2.m使得正则表达式可以和任何字符匹配，包括换行符，通常情况下圆点通配符不匹配换行符。
字符串与正则表达式的相互转换

字符串内插进正则表达式

teststr="a.c"
re=/#{Regexp.escape(teststr)}/
puts re.match("a.c")[0] #-> a.c
test=re.match("abc")
puts test[0] #-> Nil

正则表达式转换成字符串

puts /abc/.inspect #-> /abc/

使用正则表达式的常见方法：

用于if和while等
用于gsub、grep等
用于find_all、scan等

例如，puts "test 1 2 and test 3 4".scan(/\d/)会输出［"1","2","3","4"]。

您可能感兴趣的文章:

ruby开发vim插件小结
作为一个Vimmer和Pythoner，之前折腾过用python编写vim插件。现在作为半个Rubist，又开始继续折腾。
2014-07-07
Ruby学习笔记之gem 命令详解
gem是一种文件组织的包，一般的ruby的很多插件都有由这种各种的包提供。我们来看看gem的用法
2014-06-06
Ruby 中一些百分号（%）的用法小结
这篇文章主要介绍了Ruby 中一些百分号（%）的用法小结,需要的朋友可以参考下
2014-05-05
浅析Ruby的源代码布局及其编程风格
这篇文章主要介绍了浅析Ruby的源代码布局及其编程风格,意为给大家推荐一种最为普通的Ruby代码编写风格,需要的朋友可以参考下
2015-08-08
Ruby元编程小结
这篇文章主要介绍了Ruby元编程小结,元编程是可以在运行时动态的操作语言结构（如类、模块、实例变量等）的技术,需要的朋友可以参考下
2015-01-01
ruby实现修改ubuntu下的hosts
本文给大家分享的是通过ruby获取github上的hosts文件内容，修改到本地Ubuntu中，十分的实用，具体你懂得，有需要的小伙伴可以参考下。
2015-06-06
CentOS7下安装Ruby3.2.4的实施路径详解
在CentOS 7系统上安装Ruby 3.2.4版本需要先安装RVM作为版本管理工具,安装过程涉及到安装GPG的key、RVM的最新稳定版本以及Ruby的前置依赖,下面给大家介绍CentOS7下安装Ruby3.2.4的实施路径,感兴趣的朋友跟随小编一起看看吧
2024-09-09
Ruby实现的矩阵连乘算法
这篇文章主要介绍了Ruby实现的矩阵连乘算法,本文直接给出实现代码,需要的朋友可以参考下
2015-05-05
Ruby解析处理YAML和json格式数据
这篇文章主要介绍了Ruby对YAML和json格式的数据处理方法,json序列化、json反序列化,json解析等操作，需要的朋友可以参考下
2022-04-04
Ruby是什么以及如何使用
这篇文章主要介绍了Ruby是什么以及如何使用,Ruby和Ruby on Rails 在早期就出现在Web开发领域了,然而,虽然现在JavaScript和Python都占据了主导地位,Ruby还是仍然占有一席之地
2017-04-04

Ruby程序中正则表达式的基本使用教程

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

常用在线小工具