如何在Python中将HTML转换为无标记的文本？

我喜欢使用以下方法。您可以.replace('<br>','\r\n')对字符串进行手动操作，然后再将其传递strip_tags(html)给新行。从这个问题：from HTMLParser import HTMLParserclass MLStripper(HTMLParser):    def __init__(self):        self.reset()        self.fed = []    def handle_data(self, d):        self.fed.append(d)    def get_data(self):        return ''.join(self.fed)def strip_tags(html):    s = MLStripper()    s.feed(html)    return s.get_data()

如何在Python中将HTML转换为无标记的文本？

2回答