爬虫伪装方法:动态user-agent
随机产生user_agent
代理agent进行爬虫
代理IP进行爬虫
代码跟着敲,学的才快啊,https://github.com/kongweiteng/douban_crawler
settiing里开启他 优先级不能相同越小优先级越高
设置随机useragent
middlewares.py
新建useragent类
class my_useragent(object)
网上找user agent列表
随机抽取放入http头部信息
import random
使用 random.choice方法
在settings.py中DOWNLOADER_MIDDLEWARES中开启
设置自定义useragent
百度搜索user agent列表