猿问
回到首页
个人中心
反馈问题
注册登录
下载APP
首页
课程
实战
体系课
手记
专栏
慕课教程
pyspider如何手动判断某个url是否已经爬取过
想实现爬列表页的时候,发现有已经被爬过的文章url就停止列表爬取,否则继续下一页,如何实现?
一只斗牛犬
浏览 767
回答 1
1回答
慕的地8271018
爬过的url写进记录里面,比如pickle文件。需要的时候调出来检查一下就知道了。
0
0
0
打开App,查看更多内容
随时随地看视频
慕课网APP
相关分类
Python
继续浏览精彩内容
慕课网APP
程序员的梦工厂
打开
继续