python中,如何删除html页面中的文字,只留下html标签?

由于想比较同一个网页中某个标签下的子节点的的相似度。
操作对象只是html标签,所以想先删除html中标签之外的文字,以排除干扰。
请问,有什么比较高效快捷的解决方法吗?
注:目前只想到使用正则来解决
ibeautiful
浏览 557回答 2
2回答
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

JavaScript