猿问
回到首页
个人中心
反馈问题
注册登录
下载APP
首页
课程
实战
体系课
手记
专栏
慕课教程
爬虫会对服务器造成影响,怎么减少对服务器的影响,慢慢爬取
爬虫会对服务器造成影响,怎么减少对服务器的影响,慢慢爬取,我爬一个网站做实验,结果没弄几下就被访问限制了
怎么解决
qq_0789
浏览 2088
回答 2
2回答
qq_吴富顺
具体是看对方用什么防御机制。Iptables 防御, 爬取行为判定, cookies, captcha爬虫有分恶意爬虫和善意爬虫 googlebot 和baiduspider都属于善意爬虫如果你不考虑恶意或者善意 可以用代理IP把爬虫变得隐蔽起来。在IP不断变换下判定机制不容易判断到你的爬虫。把User-agent和代理IP弄一弄。然后大约在查询20-30个左右就换一个IP和user-agent。服务器管理员和判定机制不触发你就不会被访问限制了。
0
0
0
打开App,查看更多内容
随时随地看视频
慕课网APP
相关分类
Python
继续浏览精彩内容
慕课网APP
程序员的梦工厂
打开
继续