页面导航: 首页网络编程正则表达式 → 正文内容 asp采集文本的正则

asp只采集网站可见文本的正则

发布:dxy 字体:[增加 减小] 类型:转载
它可以过虑Js 可以过滤 CSS 过滤HTML标识,只采集页面的可见文本。

我写的是这样:
Function ClearHTMLCode(originCode)
Dim reg
set reg = new RegExp
reg.IgnoreCase = True
reg.Global = True
reg.Pattern = "(<s+cript(.+?)<\/s+cript>)"
originCode= reg.Replace(originCode, "")
reg.Pattern = "(<s+tyle(.+?)<\/s+tyle>)"
originCode= reg.Replace(originCode, "")
reg.Pattern = "<[^>]*>"
originCode= reg.Replace(originCode, "")
ClearHTMLCode = originCode
End Function
不过有一些过滤不了!而且速度太慢!
浏览次数:载入中... 打印本文关闭本文返回首页

文章评论

共有 位脚本之家网友发表了评论我来说两句

同 类 文 章
最 近 更 新
热 点 排 行