我想为errback
每个添加一个函数来Request
捕获 DNS 查找失败、超时等。捕获它们后,我想提交一个要在管道中处理的新项目,以记录(在数据库中)URL x 因错误 y 而失败。
我可以想到两种理论上的方法来做到这一点(但实际上我也不知道该怎么做)。
1) 以某种方式修补爬虫引擎并向项目处理队列添加一个新项目。
2)手动调用相应的管道(为了公平起见,我只需要调用一个),但是访问它们可能类似于选项 1,不知何故需要修补引擎,然后笨拙地找到管道......
有什么建议吗?
慕森王
holdtom
相关分类