猿问

爬虫 遇到了特殊情况

https://www.lagou.com/gongsi/... 网址

我要提取这个标签下面的内容<div class="item_manager_content"

但是第一个没有p 其他都有p 遇到这种情况如何处理?


Helenr
浏览 604回答 1
1回答

皈依舞

这种不完整的网页确实很坑,建议使用beautifulsoup的html5lib库来解析,它的容错性最好了,就是速度较慢
随时随地看视频慕课网APP

相关分类

Python
我要回答