trim原型函数看js正则表达式的性能

 更新时间:2008年12月10日 18:07:47   作者:  
如果你看到别人写trim函数是用循环而不用正则表达式来写,请不要取笑,也许,他们就是高手。如果你很自信你的trim函数效率很高,请看完本文再下结论。
一般情况下用正则写法为:

[Ctrl+A 全选 注:引入外部Js需再刷新一下页面才能执行]

如果遇到大数据的变长字符串的话就会发现这个是很耗资源的。效率并不高,有的时候甚至无法忍受。

[Ctrl+A 全选 注:引入外部Js需再刷新一下页面才能执行]

在解释这个原因的时候想起以前看到master regular expression里面有提到过。NFA和DFA的引擎是有区别的。js/perl/php/java/.net都是NFA引擎。
而DFA与NFA机制上的不同带来5个影响:
1. DFA对于文本串里的每一个字符只需扫描一次,比较快,但特性较少;NFA要翻来覆去吃字符、吐字符,速度慢,但是特性丰富,所以反而应用广泛,当今主要的正则表达式引擎,如Perl、Ruby、Python的re模块、Java和.NET的regex库,都是NFA的。
2. 只有NFA才支持lazy和backreference(后向引用)等特性;
3. NFA急于邀功请赏,所以最左子正则式优先匹配成功,因此偶尔会错过最佳匹配结果;DFA则是“最长的左子正则式优先匹配成功”。
4. NFA缺省采用greedy量词(就是对于/.*/、/\w+/这样的“重复n”次的模式,以贪婪方式进行,尽可能匹配更多字符,直到不得以罢手为止),NFA会优先匹配量词。
5. NFA可能会陷入递归调用的陷阱而表现得性能极差。

backtracking(回朔)
当NFA发现自己吃多了,一个一个往回吐,边吐边找匹配,这个过程叫做backtracking。由于存在这个过程,在NFA匹配过程中,特别是在编写不合理的正则式匹配过程中,文本被反复扫描,效率损失是不小的。明白这个道理,对于写出高效的正则表达式很有帮助。

定位/分析原因
在解释上面的trim原型方法的时候。经过测试,先不说结果是否正确,有几个方法是可以化解JS NFA引擎的回朔次数的
a. 去掉限定的量词,即改成
复制代码 代码如下:

String.prototype.trim = function () {
return this.replace(/^[\s\t ]+|[\s\t ]$/g, '');
}

b. 去掉字符串尾匹配。即改成:
复制代码 代码如下:

String.prototype.trim = function () {
return this.replace(/^[\s\t ]+/g, '');
}

c.加入多行匹配。即改成:
复制代码 代码如下:

String.prototype.trim = function () {
return this.replace(/^[\s\t ]+|[\s\t ]+$/mg, '');
}

从以上三种改法结合文中开头的NFA资料,我们可以大概的知道trim性能出现问题的原因
量词限定将优先匹配。
量词限定在结尾可能会使JS的正则引擎不停的回朔,出现递归的一个陷阱,这个递归的深度太深。如果字符串更大一点应该会出现栈溢出了。
多行既然能够匹配,而且性能消耗不大。性能上没有任何问题,从一个写这个正则程序的人角度上去看,多行明显比单行要替换的空串多得多。所以第二点的结论应该是对的
改良
首先确定匹配字符串的开始正则是没有任何效率问题的。而匹配结束的时候会出现性能问题,那可以采用正则与传统相结合来改善这个trim性能问题。
例如:

[Ctrl+A 全选 注:引入外部Js需再刷新一下页面才能执行]

相关文章

  • JavaScript计算字符串实际长度方法示例

    JavaScript计算字符串实际长度方法示例

    这篇文章主要为大家介绍了JavaScript计算字符串实际长度方法示例,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-08-08
  • layui table单元格事件修改值的方法

    layui table单元格事件修改值的方法

    今天小编就为大家分享一篇layui table单元格事件修改值的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-09-09
  • 小程序如何支持使用 async/await详解

    小程序如何支持使用 async/await详解

    这篇文章主要介绍了小程序如何支持使用 async/await详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-09-09
  • JS事件添加和移出的兼容写法示例

    JS事件添加和移出的兼容写法示例

    这篇文章主要介绍了JS事件添加和移出的兼容写法,结合实例形式分析了javascript针对不同浏览器实现实现添加与移除事件的相关技巧与使用方法,具有一定参考借鉴价值,需要的朋友可以参考下
    2016-06-06
  • javascript htmlencode函数(ff兼容版) 主要是编辑器中反转html代码

    javascript htmlencode函数(ff兼容版) 主要是编辑器中反转html代码

    非常不错的htmlencode 方法,比用正则实现的更好,而且效率高,推荐使用第一种方法。
    2009-06-06
  • js console.log打印对像与数组用法详解

    js console.log打印对像与数组用法详解

    这篇文章主要介绍了js console.log打印对像与数组用法,结合实例形式较为详细的分析了js使用console.log实现打印对象与数组的具体实现步骤与相关技巧,需要的朋友可以参考下
    2016-01-01
  • JavaScript让Textarea支持tab按键的方法

    JavaScript让Textarea支持tab按键的方法

    这篇文章主要介绍了JavaScript让Textarea支持tab按键的方法,涉及javascript针对textarea实现响应tab按键的方法,需要的朋友可以参考下
    2015-06-06
  • js实现QQ邮箱邮件拖拽删除功能

    js实现QQ邮箱邮件拖拽删除功能

    这篇文章主要为大家详细介绍了js实现QQ邮箱邮件拖拽删除功能,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2020-08-08
  • js中复选框的取值及赋值示例详解

    js中复选框的取值及赋值示例详解

    这篇文章主要给大家介绍了关于js中复选框的取值及赋值的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-10-10
  • JS获取页面窗口大小的代码解读

    JS获取页面窗口大小的代码解读

    本节实例给出一个获取浏览器当前窗口大小的方法。当浏览器窗口大小变化时,显示的值会随时变化
    2011-12-12

最新评论