问答详情
源自:2-7 spider文件的编写(2)

content循环,并没有爬取到第一行的导演主演信息

https://img1.mukewang.com/5c09daa30001119b04120113.jpg

https://img2.mukewang.com/5c09dabb0001fd9807160188.jpg

content=i_item.xpath(".//div[@class='info']//div[@class='bd']/p[1]/text()").extract()
#遇到多行数据,进行数据处理
for i_content in content:
    content_s="".join(i_content.split())    #通过空格分割
    douban_item['introduce']=content_s


提问者:慕桂英1542291 2018-12-07 10:28

个回答

  • Disguiser99
    2019-01-06 17:34:38

    content_s =""
    for i_content in content:
        content_s += "".join(i_content.split())
        douban_item['introduce'] = content_s
    做字符串的拼接就好了,它的循环结果拿到最后一条查询记录