怎么过滤掉网页中的脚本块

<P>最近做一个下载网页的程序,下载后想要把网页中的无用内容都过滤掉。</P><P>想找一个过滤javascript脚本块的正则表达式。</P><P>让我崩溃的是,在网上找了三天,竟找不到一个能用的。</P><P>比如这个:"&lt;script[\s\S]+&lt;/script *&gt;"</P><P>它会把"&lt;script"和"&lt;/script&gt;"中所有都替换掉。<BR>如果页头部分有个脚本块,然后页面底部也有一个脚本块,它就把这之间所有内容给匹配了。这显然是不正确的。<BR></P><P>期待高人...</P>

江户川乱折腾
浏览 933回答 2
2回答
打开App,查看更多内容
随时随地看视频慕课网APP