我是scrapy的新手。我正在尝试为我正在从事的项目抓取 Indeed 的工作网站。我正在慢慢学习如何使用谷歌浏览器检查抓取的语法,然后点击 control-f。我跟着本教程:
https://www.digitalocean.com/community/tutorials/how-to-crawl-a-web-page-with-scrapy-and-python-3
我基本上无法获得每页 16 个列表。我可以看到它通常以“
//span[@class="company"]/a/text()
到目前为止,这是我的代码:
import scrapy
class IndeedSpider(scrapy.Spider):
name='indeed_jobs'
start_urls = ['https://www.indeed.com/jobs?q=software%20engineer&l=Portland%2C%20OR']
def parse(self, response):
SET_SELECTOR = '.jobsearch-SerpJobCard'
for jobListing in response.css(SET_SELECTOR):
pass
这没有任何回报。我希望有 16 行,所以我的 SET_SELECTOR 不正确。帮助将不胜感激!
白猪掌柜的
相关分类