Scrapy 返回单个单元格中的所有值

我正在尝试使用 scrapy 抓取此站点,但返回单个单元格中的所有值,除了不同行中的每个值。


example:

milage: 25

milage: 377

milage: 247433

milage: 464130

但我得到这样的数据


example:

milage:[u'25',

 u'377',

 u'247433',

 u'399109',

 u'464130',

 u'399631',

 u'435238',

 u'285000',

 u'287470',

 u'280000']

这是我的代码


import scrapy

from ..items import ExampleItem

from scrapy.selector import HtmlXPathSelector

url = 'https://example.com'

class Example(scrapy.Spider):

    name = 'example'

    allowed_domains = ['www.example.com']

    start_urls = [url]

    def parse(self, response):

        hxs = HtmlXPathSelector(response)

        item_selector = hxs.select('//div[@class="listing_format card5 relative"]')

        for fields in item_selector:

            item = ExampleItem()

            item ['Mileage'] = fields.select('//li[strong="Mileage"]/span/text()').extract()

            yield item


守着一只汪
浏览 124回答 2
2回答
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python