Warning: Error while sending QUERY packet. PID=4753 in /home/wwwroot/coco/domain/cnlamp/web/wp-includes/wp-db.php on line 1877 去除网站中HTML标签的正则表达式 | LAMP新闻|技巧|经验|资讯站
现在的位置: 首页其他技巧>正文
去除网站中HTML标签的正则表达式
发表于5年前 其他技巧 暂无评论

去除网站中HTML标签的正则表达式Image is everything

如何去除网站中HTML标签的正则表达式,在制作网站时,我们经常需要把一篇文章的部分片段展示出来,一般是截取文章前面的部分文字。但截取显示出的文字会把文章中的HTML代码显示出来,这样形成了乱码。

去除网站中HTML标签,一般使用正则表达式。去除了网站中的HTML标签,才能把截取的文字正确的显示出来。去除文章中的HTML标签也可以在网站后台中去除,但这样一个个的去除不仅效率低下,而且经常会出错。.net网站中可以使用以下正则表达式来去除文章中的HTML标签,代码如下。

string str = a.ToString();

str = Regex.Replace(str, @”</?span[^>]*>”, “”, RegexOptions.IgnoreCase);
str = Regex.Replace(str, @”&#[^>]*;”, “”, RegexOptions.IgnoreCase);
str = Regex.Replace(str, @”</?marquee[^>]*>”, “”, RegexOptions.IgnoreCase);
str = Regex.Replace(str, @”</?object[^>]*>”, “”, RegexOptions.IgnoreCase);
str = Regex.Replace(str, @”</?param[^>]*>”, “”, RegexOptions.IgnoreCase);
str = Regex.Replace(str, @”</?embed[^>]*>”,””,RegexOptions.IgnoreCase);
str = Regex.Replace(str, @”</?table[^>]*>”,””,RegexOptions.IgnoreCase);
str = Regex.Replace(str, @”&nbsp;”,””,RegexOptions.IgnoreCase);
str = Regex.Replace(str, @”</?tr[^>]*>”, “”, RegexOptions.IgnoreCase);
str = Regex.Replace(str, @”</?th[^>]*>”,””,RegexOptions.IgnoreCase);
str = Regex.Replace(str, @”</?p[^>]*>”,””,RegexOptions.IgnoreCase);
str = Regex.Replace(str, @”</?a[^>]*>”,””,RegexOptions.IgnoreCase);
str = Regex.Replace(str, @”</?img[^>]*>”,””,RegexOptions.IgnoreCase);
str = Regex.Replace(str, @”</?tbody[^>]*>”,””,RegexOptions.IgnoreCase);
str = Regex.Replace(str, @”</?li[^>]*>”,””,RegexOptions.IgnoreCase);
str = Regex.Replace(str, @”</?span[^>]*>”,””,RegexOptions.IgnoreCase);
str = Regex.Replace(str, @”</?div[^>]*>”,””,RegexOptions.IgnoreCase);
str = Regex.Replace(str, @”</?th[^>]*>”, “”, RegexOptions.IgnoreCase);
str = Regex.Replace(str, @”</?td[^>]*>”, “”, RegexOptions.IgnoreCase);
str = Regex.Replace(str, @”</?script[^>]*>”, “”, RegexOptions.IgnoreCase);
str = Regex.Replace(str, @”(javascript|jscript|vbscript|vbs):”, “”, RegexOptions.IgnoreCase);
str = Regex.Replace(str, @”on(mouse|exit|error|click|key)”, “”, RegexOptions.IgnoreCase);
str = Regex.Replace(str, @”<\\?xml[^>]*>”, “”, RegexOptions.IgnoreCase);
str = Regex.Replace(str, @”<\/?[a-z]+:[^>]*>”, “”, RegexOptions.IgnoreCase);
str = Regex.Replace(str, @”</?font[^>]*>”, “”, RegexOptions.IgnoreCase);
str = Regex.Replace(str, @”</?b[^>]*>”,””,RegexOptions.IgnoreCase);
str = Regex.Replace(str, @”</?u[^>]*>”,””,RegexOptions.IgnoreCase);
str = Regex.Replace(str, @”</?i[^>]*>”,””,RegexOptions.IgnoreCase);
str = Regex.Replace(str, @”</?strong[^>]*>”,””,RegexOptions.IgnoreCase);
str = Regex.Replace(string,”</?(a|A)( .*?>|>)”,””)    //去除所有边连接

 

给我留言

留言无头像?


×
腾讯微博