content循环,并没有爬取到第一行的导演主演信息

来源:2-7 spider文件的编写(2)

慕桂英1542291

2018-12-07 10:28

https://img1.mukewang.com/5c09daa30001119b04120113.jpg

https://img2.mukewang.com/5c09dabb0001fd9807160188.jpg

content=i_item.xpath(".//div[@class='info']//div[@class='bd']/p[1]/text()").extract()
#遇到多行数据,进行数据处理
for i_content in content:
    content_s="".join(i_content.split())    #通过空格分割
    douban_item['introduce']=content_s


写回答 关注

1回答

  • Disguiser99
    2019-01-06 17:34:38
    content_s =""
    for i_content in content:
        content_s += "".join(i_content.split())
        douban_item['introduce'] = content_s
    做字符串的拼接就好了,它的循环结果拿到最后一条查询记录

Python最火爬虫框架Scrapy入门与实践

做为爬虫工程师Python Scrapy主流爬虫框架你必须要会!

67418 学习 · 223 问题

查看课程

相似问题