我需要从HTML文档中获取纯文本,同时将<br>元素视为换行符。BeautifulSoup.text不处理<br>和换行符。HTML2Text非常不错,但是可以转换为markdown。我还能如何处理呢?
<br>
BeautifulSoup.text
慕少森
潇湘沐
相关分类