继续浏览精彩内容
慕课网APP
程序员的梦工厂
打开
继续
感谢您的支持,我会继续努力的
赞赏金额会直接到老师账户
将二维码发送给自己后长按识别
微信支付
支付宝支付

使用RegularExpressions去除HTML标签的字符串

慕勒551688
关注TA
已关注
手记 250
粉丝 39
获赞 133

网友要求做一个文章摘要,由于文章包含有Html标签,在截取文章头200个字符串时,得到的字符串将是一些意想不到的结果。因此让Insus.NET为他解决去除html标签,然后再从去除Html标签之后的结果截取200个字符串。

实现这个功能,可以使用RegularExpressions正则表达式:

.   匹配除 "\n" 之外的任何单个字符。

*  匹配前面的子表达式零次或多次。

?  匹配前面的子表达式零次或一次。

因此只要把文章的"<.*?>"替换为String.Empty即可。

 

接下来,Insus.NET写一个函数,在写函数之前,先引用一个命名空间:

using System.Text.RegularExpressions;

 

函数:

public static string RemoveHtmlTag(string articleString)
    {
        return Regex.Replace(articleString, "<.*?>", string.Empty);
    }

 

打开App,阅读手记
1人推荐
发表评论
随时随地看视频慕课网APP