提取关键部分 内容包含在 <b> 标记中的字符串

我只对获取<b>标签内的所有内容感兴趣。有没有最佳方法来做到这一点?据我所知,我只能使用它来实现它,.split但我认为这不是实现它的一种非常优雅或非常理想的方式


这是我想要的输出:


v

SER

&nbsp;infinitivo&nbsp;

ART

El

&nbsp;masculino&nbsp;&nbsp;singular&nbsp;

.

.

.

这是我对请求的字符串响应


一只斗牛犬
浏览 218回答 1
1回答

回首忆惘然

您可以使用 html.parserfrom html.parser import HTMLParserclass BExtractor(HTMLParser):&nbsp; &nbsp; def __init__(self, *args, **kwargs):&nbsp; &nbsp; &nbsp; &nbsp; super(BExtractor, self).__init__(*args, **kwargs)&nbsp; &nbsp; &nbsp; &nbsp; self.is_b = True&nbsp; &nbsp; def handle_starttag(self, tag, attrs):&nbsp; &nbsp; &nbsp; &nbsp; if tag == "b":&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; self.is_b = True&nbsp; &nbsp; def handle_endtag(self, tag):&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; self.is_b = False&nbsp; &nbsp; def handle_data(self, data):&nbsp; &nbsp; &nbsp; &nbsp; if self.is_b:&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; print(data)parser = BExtractor()parser.feed("""html""")
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python