introduce 那个不是只取了最后一行吗? 前面的行其实没有评进去呀?
对呢,确实是只取了一行,因为两行中间有个<br>换行,xpath提取之后每一行是一个元素为2的列表,但是视频循环一层默认就取了提取列表最后一项导致取得是后面一行,我加了一层循环好了,你可以试试
content = i_item.xpath(".//div[@class='info']//div[@class='bd']/p[1]/text()").extract() for i_content in content: print(i_content) for i in i_content: content_s = "".join(i.split('\n')) douban_item['introduce'] = content_s print(douban_item['introduce'])