猿问

pyspider如何手动判断某个url是否已经爬取过

想实现爬列表页的时候,发现有已经被爬过的文章url就停止列表爬取,否则继续下一页,如何实现?

一只斗牛犬
浏览 767回答 1
1回答

慕的地8271018

爬过的url写进记录里面,比如pickle文件。需要的时候调出来检查一下就知道了。
随时随地看视频慕课网APP

相关分类

Python
我要回答