我对任何形式的编码都很陌生。我通过尝试使用 Scrapy 制作一个简单的爬虫来开始学习过程。它有点工作,但由于某种原因,我无法正确输出图像 URL。它吐出一些“data:image/gif;base64...”值而不是 src 属性中的实际链接。我一直在寻找答案,但似乎找不到任何可以给我明确答案的东西(另外,我也可能不完全理解这个问题)。任何帮助将不胜感激。
def parse(self, response):
for data in response.css("a.styles__link--2pzz4"):
yield {
'title': data.css('a::attr(title)').get(),
'price': data.css('span::text').get(),
'url': data.css('a::attr(href)').get(),
'image url': data.css('img::attr(src)').get(),
}
next_page = response.css('li span a::attr(href)').get()
if next_page is not None:
next_page = response.urljoin(next_page)
yield scrapy.Request(next_page, callback=self.parse)
凤凰求蛊
千巷猫影
相关分类