Perl split字符串分割函数用法指南

 更新时间:2013年02月09日 17:45:49   作者:  
本文向大家简单介绍一下Perl split函数的用法,Perl中的一个非常有用的函数是Perl split函数-把字符串进行分割并把分割后的结果放入数组中

本文和大家重点讨论一下Perl split函数的用法,Perl中的一个非常有用的函数是Perl split函数-把字符串进行分割并把分割后的结果放入数组中。这个Perl split函数使用规则表达式(RE),如果未特定则工作在$_变量上。

Perl split函数

Perl中的一个非常有用的函数是Perl split函数-把字符串进行分割并把分割后的结果放入数组中。这个Perl split函数使用规则表达式(RE),如果未特定则工作在$_变量上。

Perl split函数可以这样使用: 

复制代码 代码如下:

$info="Caine:Michael:Actor:14,LeafyDrive"; 
@personal=split(/:/,$info); 


其结果是:@personal=("Caine","Michael","Actor","14,LeafyDrive");

◆如果我们已经把信息存放在$_变量中,那么可以这样:

复制代码 代码如下:

@personal=split(/:/);

如果各个域被任何数量的冒号分隔,可以用RE代码进行分割: 

复制代码 代码如下:

$_="Capes:Geoff::Shotputter:::BigAvenue"; 
@personal=split(/:+/); 

其结果是:@personal=("Capes","Geoff","Shotputter","BigAvenue");

但是下面的代码:

复制代码 代码如下:

$_="Capes:Geoff::Shotputter:::BigAvenue"; 
@personal=split(/:/);

的结果是:@personal=("Capes","Geoff","","Shotputter","","","BigAvenue");

◆这个Perl split函数中单词可以被分割成字符,句子可以被分割成单词,段落可以被分割成句子:

复制代码 代码如下:

@chars=split(//,$word);
@words=split(//,$sentence); 
@sentences=split(/\./,$paragraph); 

在第一句中,空字符串在每个字符间匹配,所以@chars数组是一个字符的数组。>>

//之间的部分表示split用到的正则表达式(或者说分隔法则)
\s是一种通配符,代表空格
+代表重复一次或者一次以上。
所以,\s+代表一个或者一个以上的空格。
split(/\s+/,$line)表示把字符串$line,按空格为界分开。
比如说,$line="你好朋友欢迎光临我的网站jb51.net";
split(/\s+/,$line)后得到:
你好朋友欢迎访问我的网站jb51.net

一般用法: @somearray = split(/:+/, $string ); #括号可以不要。  若不指定$string, 则对默认变量$_操作, 两斜线间为分割符,可以用正则表达式,强悍异常。

在perl手册里,有一个用法不多见。即: split /PATTERN/, EXPR, LIMIT;  关键就是这个LIMIT参数,可以节省不少事情。 如果使用了LIMIT,且是正数,表示分割成不多于LIMIT指定的数目的域。If LIMIT is unspecified or zero, trailing null fields are stripped (which potential users of pop would do well to remember). If LIMIT is negative, it is treated as if an arbitrarily large LIMIT had been specified. Note that splitting an EXPR that evaluates to the empty string always returns the empty list, regardless of the LIMIT specified.

通过制定LIMIT,可以在很长(分割产生几万个元素or域)的行分割操作中,只返回关键的前几列的域值,减少了内存使用及时间消耗。比如一般的基因型数据,第一列通常是材料命名,需要通过材料名的判断取舍,这时候就可以这样用。 my ($firstfield) = split /\t/, $someline, 1;  如果需要前面几列的值,这样的方式对大文件效率很好: my (undef, $var1, undef, undef, undef, $var2)=split /\t/, $someline, 6;

有网友对这种方式做了测试,显示较好。引用如下:
>>>
一个文件,每行都有18项,各项之间用\t分割,使用时用到了第6项,折腾了几种用法

复制代码 代码如下:

my @array = split("\t",$_); my $var = $array[6];   测试文件平均用时8.2s
 my($var) = (split("\t",$_))[6];  测试平均用时5.1s
 my(undef,undef,undef,undef,undef,undef,$var) = split("\t",$_); 平均用时3.53s
 my(undef,undef,undef,undef,undef,undef,$var) = split("\t",$_,7);平均用时3.52s
 my $var = (split("\t",$_,7))[6]; 平均用时3.53s

看来后3种才是王道,如果需要使用多项也可以进行进行适当的变动。不过两项如果跨度比较大,3,4应该是不错选择,5就只能用中间数组。

自己动手测试下吧。

相关文章

  • Perl哈希表用法解析

    Perl哈希表用法解析

    Perl语言有很多值得学习的地方,那么你对Perl哈希表的概念是否熟悉呢,这里和大家分享一下,希望本文的介绍能让你有所收获
    2013-02-02
  • Perl中chomp和chop的区别介绍

    Perl中chomp和chop的区别介绍

    chomp是用来删除换行符,chop是用来删除最后一个字符
    2013-02-02
  • perl面向对象实例

    perl面向对象实例

    这篇文章主要介绍了perl面向对象实例,本文讲解了一个类只是一个简单的包、对象仅仅只是引用、一个方法就是一个简单的子程序等内容,并给出了一个简单示例,需要的朋友可以参考下
    2014-11-11
  • perl的POD权限问题处理

    perl的POD权限问题处理

    今天我们继续查找mod_perl对req_header的处理,有需要的朋友建议参考学习之
    2013-02-02
  • Perl中捕获警告信息、异常信息并写入日志详解

    Perl中捕获警告信息、异常信息并写入日志详解

    这篇文章主要介绍了Perl中捕获警告信息、异常信息并写入日志详解,本文分别给出了捕获警告--不处理、捕获警告--并转换成异常、捕获警告--并写入日志、捕获并写日志的完整例子等实用实例,需要的朋友可以参考下
    2015-06-06
  • Perl函数(子程序)学习笔记

    Perl函数(子程序)学习笔记

    这篇文章主要介绍了Perl函数(子程序)学习笔记,本文讲解了函数定义、函数返回值、函数参数传递等内容,需要的朋友可以参考下
    2014-11-11
  • perl中chomp的使用介绍(chop和chomp函数区别)

    perl中chomp的使用介绍(chop和chomp函数区别)

    perl程序中,有时在输入过程中使用chomp才会得到正确的结果
    2013-02-02
  • Perl中的列表和数组学习笔记

    Perl中的列表和数组学习笔记

    这篇文章主要介绍了Perl中的列表和数组学习笔记,本文讲解了列表、数组--列表的存贮、数组的存取、字符串中的方括号和变量替换、列表范围、数组的输出等内容,需要的朋友可以参考下
    2015-02-02
  • Linux/Unix下安装Perl模块的两种方法分享

    Linux/Unix下安装Perl模块的两种方法分享

    Linux/Unix下安装Perl模块有两种方法:手工安装和自动安装。一是从CPAN上下载需要的模块,手工编译、安装。二是联上internet,使用一个叫做CPAN的模块自动完成下载、编译、安装的全过程
    2013-02-02
  • Perl中处理时间的几个函数

    Perl中处理时间的几个函数

    本文为大家介绍Perl中处理时间的几个函数,供大家学习参考
    2013-02-02

最新评论