C#删除UL LI中指定标签里文字的方法

 更新时间:2017年05月31日 08:52:42   作者:蓝色水  
这篇文章主要介绍了C#删除UL LI中指定标签里文字的方法,涉及C#针对页面HTML元素进行正则匹配与替换的相关操作技巧,需要的朋友可以参考下

本文实例讲述了C#删除UL LI中指定标签里文字的方法。分享给大家供大家参考,具体如下:

现在需求越来越变态,但是做代码只能尽量满足,这里先是扣去ul和li中的超链接里的文字

PromptHtml = GetData.GetHTTPInfo(Config.Prompt_Url, "utf-8");
PromptHtml = PromptHtml.Replace("<ul><li>", "");
PromptHtml=PromptHtml.Replace("</li></ul>", "");
string ss = @"<a[\s\S]*?href=""([^" rel="external nofollow" "]*?)""[^>]*?>([\s\S]*?)</a>"; //这里
MatchCollection mcTable = Regex.Matches(PromptHtml, ss);
foreach (Match mTable in mcTable)
{
  if (mTable.Success)
  {
    PromptHtml = mTable.Groups[2].Value;
  }
}
resultHtml = PromptHtml;

具体的数据源如下:

复制代码 代码如下:
<ul><li><a href="http://localhost/tg.aspx?ID=4194" rel="external nofollow" >哪些主题基金有望爆发?</a></li></ul>

这篇是扣去ul和li中的span里面的文字:

middlebannerHtml = GetData.GetHTTPInfo(Config.Middlebanner_Url, "utf-8");
middlebannerHtml = middlebannerHtml.Replace("<ul><li>", "");
middlebannerHtml = middlebannerHtml.Replace("</li></ul>", "");
string ss = @"<span>([^<]+)</span>"; //这里
MatchCollection mcTable = Regex.Matches(middlebannerHtml, ss);
foreach (Match mTable in mcTable)
{
  if (mTable.Success)
  {
    middlebannerHtml = mTable.Groups[1].Value;
  }
}
middleContent = middlebannerHtml;

具体的数据源如下:

复制代码 代码如下:
<ul><li><span>3年5倍涨幅的 不只是股票哦~</span> <a href="http://localhost/tg.aspx?ID=4195" rel="external nofollow" >立即查看</a></li></ul>

PS:这里再为大家提供2款非常方便的正则表达式工具供大家参考使用:

JavaScript正则表达式在线测试工具:
http://tools.jb51.net/regex/javascript

正则表达式在线生成工具:
http://tools.jb51.net/regex/create_reg

更多关于C#相关内容感兴趣的读者可查看本站专题:《C#正则表达式用法总结》、《C#编码操作技巧总结》、《C#中XML文件操作技巧汇总》、《C#常见控件用法教程》、《WinForm控件用法总结》、《C#数据结构与算法教程》、《C#面向对象程序设计入门教程》及《C#程序设计之线程使用技巧总结

希望本文所述对大家C#程序设计有所帮助。

相关文章

最新评论