使用 Beautiful Soup 抓取亚马逊评论

Scrapy 将是完成此任务的不错选择。这将是一个非常简单的蜘蛛，它将能够收集所需的信息。import scrapyclass TestSpider(scrapy.Spider):    name = 'test'    start_urls = ['https://www.amazon.com/dp/B07Q6H83VY']    def parse(self, response):        for row in response.css('div.review'):            item = {}            item['author'] = row.css('span.a-profile-name::text').extract_first()            rating = row.css('i.review-rating > span::text').extract_first().strip().split(' ')[0]            item['rating'] = int(float(rating.strip().replace(',', '.')))            item['title'] = row.css('span.review-title > span::text').extract_first()            created_date = row.css('span.review-date::text').extract_first().strip()            item['created_date'] = created_date            review_content = row.css('div.reviewText ::text').extract()            review_content = [rc.strip() for rc in review_content if rc.strip()]            item['content'] = ', '.join(review_content)            yield item输出示例：{        "author": "Jhona Diaz",        "rating": 4,        "title": "Recomendable solo si eres fan ya que si está algo caro",        "created_date": "Reviewed in Mexico on November 23, 2019",        "content": "Buena calidad y pues muy completo"    },    {        "author": "MANUEL MENDOZA OLVERA",        "rating": 5,        "title": "Perfecto Estado",        "created_date": "Reviewed in Mexico on September 28, 2019",        "content": "excelente, la edición es de caja  metálica y llegó intacta"    },

使用 Beautiful Soup 抓取亚马逊评论

2回答