来求HTML标签正则匹配。

匹配以下代码中<FONT id=Zoom>........</FONT>之间的内容,因为中间有多个font标签,所以需要成对匹配,其实<FONT id=Zoom>........</FONT>之间的内容就是新闻内容,所以存在不确定的HTML标签个数。谢各位高人帮忙!谢谢

......

<TR>

    <td width="5%"></td> 

    <td style="......" vAlign=top width="90%">

        <FONT id=Zoom>

        ........

        <p><span><FONT style="FONT-SIZE: 10.5pt">这里是文字内容1。。。。。</FONT></SPAN></p>

        <p><Font styel=".....">这里是文字内容2。。。。</Font></p>

        <div style="....."><font sytle=".....">这里是文字3。。。。</font></div>

        ........

        </FONT>

    </td>

</TR>

......


jeck猫
浏览 640回答 2
2回答

慕沐林林

<(?<HtmlTag>[\w]+)[^>]*\sid=(?<Quote>["']?)Zoom(?(Quote)\k<Quote>)["']?[^>]*> (((?<Nested><\k<HtmlTag>[^>]*>)|</\k<HtmlTag>>(?<-Nested>)|.*?)*)</\k<HtmlTag>>这个绝对可以,我的爬虫就是用这个。
打开App,查看更多内容
随时随地看视频慕课网APP