猿问

如何只抓取文本?

代码 :


import scrapy


class BlogSpider(scrapy.Spider):

    name = 'bijouterie'

    start_urls = ['https://www.example.com']


    def parse(self, response):

        for post in response.css('#engine-results .drs'):

            yield {'title': post.css('a.moodalbox.response').get()}

运行命令(Windows 10):


scrapy runspider C:\Users\DELL\Desktop\icscrape\bijouterie.py -o posts.csv


CSV 文件: https: //pastebin.com/qEQTKEcC

我只想抓取文本而不是整个 html 类代码。


萧十郎
浏览 85回答 1
1回答

Smart猫小萌

只需在 css 选择器末尾添加 (::text) 即可,例如{'title': post.css('a.moodalbox.response::text').get()}
随时随地看视频慕课网APP

相关分类

Python
我要回答