浏览器中的正则表达式陷阱说明

 更新时间:2010年05月04日 16:53:04   作者:  
js 内置对象 RegExp 我们用的很习惯 也很舒服 但是里面却有 严重的隐患 或者陷阱...原因在于 有些浏览器 对正则表达式直接量的优化.

在本章开始前 我要引入一个例子 来说明这种不彻底的 变态的优化 到底合理还是不合理...

c# 中的 字符串直接量 做的优化 就非常彻底...这种优化我们应该是欢迎的...

 string str="franky";

string str2="franky";

在内存中 只有一份 字符串对象 而str和str2 具备相同的一份引用. 很明显 这非常合理.

string n = "franky",  n2 = "franky";
Response.Write((Object.ReferenceEquals(n,n2)).ToString());//True.

那么 一些特殊情况下  有些浏览器 为正则表达式直接量也做了类似的优化.

alert(/\d/==/\d/);//所有浏览器都是false 这很合理 因为正则表达式直接量 同 [] 数组直接量 {}对象直接量一样 都是引用类型 

我们再看看哪些情况下哪些浏览器做了优化

    function f2() {
        return /\d/;
    }

       alert(f2() == f2());

//这里的结果就有不同了

ie6 7 8  opear10 safari4 都返回false  (我虚拟机里safari3坏了没做测试.如果谁有 帮忙测下告诉我结果.谢谢 我估计safari3 会返回true.原因是 maxthon3用的引擎貌似就是safari3 的) 

但是

firefox 2.0 3.0+ 3.5 3.6  chrome 4 5 opear9  maxthon3 demo版  使用webkit引擎下 都返回true

有趣的地方在于 opera9 做了优化 而opera10 取消了这种优化. 看来至少opera团队认为这种优化时不恰当的...(变相支持了我的观点.)

 

看到这里 你也许会奇怪 是不是 bug而不是所谓优化啊? 也许是闭包对象 出了什么问题或者 是 函数对象上的某些bug引起的?

那么我们看看下面的例子:

for (var i = 0; i < 10; i++) document.writeln(/\d/g.test('' + i));

不同浏览器 输出结果的 差异 完全符合上面 是否做优化的分类.

即没有 做优化的浏览器 一律返回true 而作了优化的浏览器 则是 true false true false 交替的结果.

我们这里只是一个 循环 ..js中的循环没有独立的作用域 更不会产生闭包对象 那么可以肯定 引起这个怪异问题的 根本原因就是某些浏览器自作聪明的优化.

可能大家不太理解 test的结果 差异来自哪里...  答案是 test 同 exec 一样 如果 直接量后面有/g  .设置了 global全局查找参数 的话 那么 同一个test对象 会记录上次 匹配字符的索引位置.下次再 匹配时 会从这个位置开始..如果没有 则 匹配索引<0 下次在此匹配时 就仍然从0位置字符开始.

所以上面这个测试 使用 exec 也是可以的.

那么 这里 如何避免浏览器差异呢? 简单的办法 去掉/g即可

这里我们为了躲避陷阱 就要 记得一个约定.  请尽量不要使用 一个正则直接量 在函数体内 或 循环内. 如果一定要如此 请使用new RegExp('\d',g);这种.

对于exec 尽量用 string.match代替. 因为match 强制你依靠是否有 /g 来全局查找..不会产生歧义.

对于test 如果是循环内 也可以考虑  var reg=/\d/; //这里要吧/g去掉..请不要忘记哦

for (var i = 0; i < 10; i++) document.writeln(reg.test('' + i));

事实上这样用是最合理的办法 .原因是 这里我们只产生一个正则对象 并反复使用他.. 本质上也是为了优化。但是我们避开了 浏览器自己的优化差异 导致的不同结果.

最后我们发现 所谓陷阱 发生主要是 /g使用不当.无论是 exec 还是test都是如此  如果合理使用/g 无论浏览器是否存在变态的优化. 执行结果都将是正确的...唯一的区别 只在于 做了优化的浏览器 不需要反复产生一个 正则对象然后再垃圾回收 再产生一个正则对象....如此反复而已...

那么我们发现 遵守上面几个原则的话 这种问题 也都避免了...

相关文章

  • 正则表达式re.sub替换不完整的问题及完整解决方案

    正则表达式re.sub替换不完整的问题及完整解决方案

    re.sub是个正则表达式方面的函数,用来实现通过正则表达式,实现比普通字符串的replace更加强大的替换功能。这篇文章主要介绍了正则表达式re.sub替换不完整的问题及解决方案,需要的朋友可以参考下
    2018-08-08
  • asp.net中匹配URL网址的正则表达式

    asp.net中匹配URL网址的正则表达式

    最近在做一些关于URL匹配的项目,本来对正则表达式了解的不多,上网搜索了好多前辈写的正则表达式,发现很少能被我使用的,现将我自己写的正则表达式贴出来,供大家参考
    2016-10-10
  • 详解Python3中的正则表达式的基本用法

    详解Python3中的正则表达式的基本用法

    本文重点给大家介绍正则表达式的相关用法,正则表达式是处理字符串的强大的工具,它有自己特定的语法结构,有了它,实现字符串的检索、替换、匹配验证都不在话下
    2019-07-07
  • 最全最实用的正则表达式大全分享

    最全最实用的正则表达式大全分享

    正则式太难学,而且容易忘记 。很多不太懂正则的朋友,在遇到需要用正则校验数据时,往往是在网上去找很久,结果找来的还是不很符合要求。所以我最近把开发中常用的一些正则表达式整理了一下,在这里分享一下。给自己留个底,也给朋友们做个参考。
    2015-10-10
  • 分享一组开源的匹配中国大陆手机号码的正则表达式

    分享一组开源的匹配中国大陆手机号码的正则表达式

    这篇文章主要介绍了分享一组开源的匹配中国大陆手机号码的正则表达式。文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-06-06
  • JavaScript 正则表达式使用详细参数

    JavaScript 正则表达式使用详细参数

    正则表达式(regular expression)对象包含一个正则表达式模式(pattern)。它具有用正则表达式模式去匹 配或代替一个串(string)中特定字符(或字符集合)的属性(properties)和方法(methods)。
    2008-03-03
  • JS正则表达式一条龙讲解(从原理和语法到JS正则)

    JS正则表达式一条龙讲解(从原理和语法到JS正则)

    JS正则表达式一条龙讲解,从原理和语法到JS正则、ES6正则扩展,最后再到正则实践思路
    2017-04-04
  • ASP正则匹配替换函数代码

    ASP正则匹配替换函数代码

    这篇文章主要介绍了ASP正则匹配替换函数代码,需要的朋友可以参考下
    2023-06-06
  • JavaScript 使用正则表达式进行表单验证的示例代码

    JavaScript 使用正则表达式进行表单验证的示例代码

    上篇文章 JavaScript 表单验证正则表达式大全 说的是javascript中使用的正则表达式的例子,但是没有说这些正则表达式如何使用,现在给大家几个例子,大家可以看看。
    2009-08-08
  • PHP正则匹配图片并给图片加链接详解

    PHP正则匹配图片并给图片加链接详解

    给文章中的图片添加下一页链接或点击打开原图链接
    2009-08-08

最新评论