猿问
爬虫会对服务器造成影响,怎么减少对服务器的影响,慢慢爬取
爬虫会对服务器造成影响,怎么减少对服务器的影响,慢慢爬取,我爬一个网站做实验,结果没弄几下就被访问限制了
怎么解决
qq_0789
浏览 2093
回答 2
2回答
qq_吴富顺
具体是看对方用什么防御机制。Iptables 防御, 爬取行为判定, cookies, captcha爬虫有分恶意爬虫和善意爬虫 googlebot 和baiduspider都属于善意爬虫如果你不考虑恶意或者善意 可以用代理IP把爬虫变得隐蔽起来。在IP不断变换下判定机制不容易判断到你的爬虫。把User-agent和代理IP弄一弄。然后大约在查询20-30个左右就换一个IP和user-agent。服务器管理员和判定机制不触发你就不会被访问限制了。
0
0
0
随时随地看视频
慕课网APP
相关分类
Python
我要回答