我正在尝试将所有内容都放入 p 标签中,包括嵌套的 b 标签,但是除了 b 之外,我还得到了其他所有内容。有人可以帮我弄这个吗?
这是我的代码:
def parse(self, response):
images = response.css("#mw-content-text > div > table > tbody > tr > td > a > img::attr(src)").extract_first()
text1 = response.css("#mw-content-text > div > p::text").extract()
text2 = ''.join(text1)
yield {'text2': text2, 'image_urls':[PROTOCOL+ images]}
for next_page in response.css('#mw-content-text > div > ul > li > b > a::attr(href)').extract():
yield Request(BASE_URL + next_page, callback=self.parse)
料青山看我应如是
相关分类