为什么设置了user_agent隐藏之后,打印出来的信息里user_agent没有改变

来源:2-10 user-agent中间件的编写

幕布斯1226941

2018-09-25 17:29

2018-09-25 17:24:37 [scrapy.utils.log] INFO: Scrapy 1.5.1 started (bot: douban)

2018-09-25 17:24:37 [scrapy.utils.log] INFO: Versions: lxml 4.2.5.0, libxml2 2.9.5, cssselect 1.0.3, parsel 1.5.0, w3lib 1.19.0, Twisted 18.7.0, Python 3.6.0 (v3.6.0:41df79263a11, Dec 23 2016, 08:06:12) [MSC v.1900 64 bit (AMD64)], pyOpenSSL 18.0.0 (OpenSSL 1.1.0i  14 Aug 2018), cryptography 2.3.1, Platform Windows-10-10.0.17134-SP0

2018-09-25 17:24:37 [scrapy.crawler] INFO: Overridden settings: {'BOT_NAME': 'douban', 'NEWSPIDER_MODULE': 'douban.spiders', 'ROBOTSTXT_OBEY': True, 'SPIDER_MODULES': ['douban.spiders'], 'USER_AGENT': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.139 Safari/537.36'}

执行后打印出来的user_agent如上,与setting.py中的设置的一致:

# Crawl responsibly by identifying yourself (and your website) on the user-agent

不会随机取user_agent_list中的USER_AGENT吗?



写回答 关注

1回答

  • 大壮老师
    2018-10-01 20:43:49

    教程里,这里我有个手误,是user-agent,不是下划线

Python最火爬虫框架Scrapy入门与实践

做为爬虫工程师Python Scrapy主流爬虫框架你必须要会!

67418 学习 · 223 问题

查看课程

相似问题