提取HTML代码中文字的C#函数

更新时间：2006年09月28日 00:00:00 作者：

/// <summary>
/// 去除HTML标记
/// </summary>
/// <param name="strHtml">包括HTML的源码 </param>
/// <returns>已经去除后的文字</returns>
public static string StripHTML(string strHtml)
{
string [] aryReg ={
@"<script[^>]*?>.*?</script>",

@"<(\/\s*)?!?((\w+:)?\w+)(\w+(\s*=?\s*(([""'])(\\[""'tbnr]|[^\7])*?\7|\w+)|.{0})|\s)*?(\/\s*)?>",
          @"([\r\n])[\s]+",
          @"&(quot|#34);",
          @"&(amp|#38);",
          @"&(lt|#60);",
          @"&(gt|#62);",
          @"&(nbsp|#160);",
          @"&(iexcl|#161);",
          @"&(cent|#162);",
          @"&(pound|#163);",
          @"&(copy|#169);",
          @"&#(\d+);",
          @"-->",
          @"<!--.*\n"

         };

   string [] aryRep = {
           "",
           "",
           "",
           "\"",
           "&",
           "<",
           ">",
           " ",
           "\xa1",//chr(161),
           "\xa2",//chr(162),
           "\xa3",//chr(163),
           "\xa9",//chr(169),
           "",
           "\r\n",
           ""
          };

   string newReg =aryReg[0];
   string strOutput=strHtml;
   for(int i = 0;i<aryReg.Length;i++)
   {
    Regex regex = new Regex(aryReg[i],RegexOptions.IgnoreCase );
    strOutput = regex.Replace(strOutput,aryRep[i]);
   }

   strOutput.Replace("<","");
   strOutput.Replace(">","");
   strOutput.Replace("\r\n","");

return strOutput;
}

您可能感兴趣的文章:

ASP.NET如何自定义项目模板详解
这篇文章主要给大家介绍了关于ASP.NET如何自定义项目模板的相关资料，文中通过示例代码介绍的非常详细，对大家学习或者使用ASP.NET具有一定的参考学习价值，需要的朋友们下面来一起学习学习吧
2019-08-08
ASP.NET 页面中动态增加的控件、添加事件
在ASP.NET中动态创建一个控件总是不那么顺利，特别是当对页面的Life Cycle不是那么了然的情况下！这里简单描述一下要求，然后提供一个解决方案，大家看看有没有更好的Idea，如果有的话就是我的大幸了，呵呵！
2009-07-07
Repeater控件实现编辑、更新、删除等操作示例代码
如何在Repeater控件中实现像GridView控件一样的编辑、更新、删除功能？下面有个不错的示例，感兴趣的朋友可以参考下，希望对大家有所帮助
2014-01-01
IE下document.referrer 拒绝访问的解决方法
原理就是给IE浏览器的页面偷偷加了个链接，然后自动点这个链接，于是referrer就能保留了，感兴趣的朋友可以参考下
2013-09-09
把js文件编译成dll供页面调用的方法
这篇文章主要介绍了把js文件编译成dll供页面调用的方法,需要的朋友可以参考下
2014-08-08
Asp.net中Microsoft.Identity的IPasswordHasher加密的默认实现与运用
本文主要介绍了Microsoft.Identity的IPasswordHasher加密的默认实现与运用。具有很好的参考价值，下面跟着小编一起来看下吧
2017-02-02
ASP.NET MVC5网站开发之登录、验证和注销管理员篇1(六)
这篇文章主要介绍了ASP.NET MVC5网站开发之管理员登录、验证和注销，文中示例代码介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2016-08-08
asp.net（文章截取前几行作为列表摘要）无损返回HTML代码
asp.net（文章截取前几行作为列表摘要）无损返回HTML代码，需要的朋友可以参考下
2012-12-12
关于ASP.NET页面打印技术的常用方法总结
B/S结构导致了Web应用程序中打印的特殊性;程序运行在浏览器中，打印机在本地，而文件确可能在服务器上，导致了打印控制不是很灵活,接下来介绍几种常见的打印技术，感兴趣的朋友可以了解下
2013-01-01
asp.net 读取文本文件并插入数据库的实现代码
最近我司和招行有合作，招行给财务的是一个txt格式的账务文本文件，文本文件包含很多内容，对账只需要用到其中一部分内容。
2010-04-04

提取HTML代码中文字的C#函数

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

常用在线小工具