C#使用正则表达式移除所有的Html标记,返回纯文本
C#使用正则表达式移除所有的Html标记,返回纯文本
C# Code: /// <summary> /// C#使用正则表达式移除所有的Html标记,返回纯文本 /// </summary> /// <param name="HtmlString"></param> /// <returns>返回纯文本</returns> private static string RemoveHTML(string HtmlString) { //删除脚本 HtmlString = Regex.Replace(HtmlString, @"<script[^>]*?>.*?</script>", "", RegexOptions.IgnoreCase); //删除HTML HtmlString = Regex.Replace(HtmlString, @"<(.[^>]*)>", "", RegexOptions.IgnoreCase); HtmlString = Regex.Replace(HtmlString, @"([\r\n])[\s]+", "", RegexOptions.IgnoreCase); HtmlString = Regex.Replace(HtmlString, @"-->", "", RegexOptions.IgnoreCase); HtmlString = Regex.Replace(HtmlString, @"<!--.*", "", RegexOptions.IgnoreCase); HtmlString = Regex.Replace(HtmlString, @"&(quot|#34);", "\"", RegexOptions.IgnoreCase); HtmlString = Regex.Replace(HtmlString, @"&(amp|#38);", "&", RegexOptions.IgnoreCase); HtmlString = Regex.Replace(HtmlString, @"&(lt|#60);", "<", RegexOptions.IgnoreCase); HtmlString = Regex.Replace(HtmlString, @"&(gt|#62);", ">", RegexOptions.IgnoreCase); HtmlString = Regex.Replace(HtmlString, @"&(nbsp|#160);", " ", RegexOptions.IgnoreCase); HtmlString = Regex.Replace(HtmlString, @"&(iexcl|#161);", "\xa1", RegexOptions.IgnoreCase); HtmlString = Regex.Replace(HtmlString, @"&(cent|#162);", "\xa2", RegexOptions.IgnoreCase); HtmlString = Regex.Replace(HtmlString, @"&(pound|#163);", "\xa3", RegexOptions.IgnoreCase); HtmlString = Regex.Replace(HtmlString, @"&(copy|#169);", "\xa9", RegexOptions.IgnoreCase); HtmlString = Regex.Replace(HtmlString, @"&#(\d+);", "", RegexOptions.IgnoreCase); HtmlString.Replace("<", ""); HtmlString.Replace(">", ""); HtmlString.Replace("\r\n", ""); HtmlString = HttpContext.Current.Server.HtmlEncode(HtmlString).Trim(); return HtmlString; } //来源:C/S框架网(www.csframework.com) QQ:23404761
参考文档:
C#调用Delphi编译的DLL函数库返回大文本数据 读取一个文件夹下所有的txt文件,并保存到一个txt文本中 C# 使用List C#正则表达式整理备忘 C#使用正则表达式判断手机号码 C#.NET 身份证号码格式正则表达式验证 C#.NET IP地址正则表达式验证 C#.NET 手机号码正则表达式验证 C# WebAPI控制器邮箱验证接口返回自动重定向HTML页面(原创) C#.NET通过CodeDom.Compiler动态编译计算表达式的值 C#正则表达式查找或替换指定字符串(标识)范围的内容 C#使用分词算法从文本字符串中抽取关键词模拟百度搜索|CSFramework.COM巨献 C#使用正则表达式替换或去掉半角标点符号 C#正则表达式判断url是否网络路径(http/ftp/https三种协议) C#正则表达式替换SQL单引号中间的空格
其它资料:
什么是C/S结构? | C/S框架核心组成部分 | C/S框架-WebService部署图 | C/S框架-权限管理 | C/S结构系统框架 - 5.1旗舰版介绍 | C/S结构系统框架 - 功能介绍 | C/S结构系统框架 - 产品列表 | C/S结构系统框架 - 应用展示(图) | 三层体系架构详解 | C/S架构轻量级快速开发框架 | C/S框架网客户案例 | WebApi快速开发框架 | C/S框架代码生成器 | 用户授权注册软件系统 | 版本自动升级软件 | 数据库底层应用框架 | CSFramework.CMS内容管理系统 | |