在 Python 中替换 HTML 字符串的文本部分中包含的某个字符

我有一个字符串,它是有效的 HTML,例如


s = """<html><head><title>The Dormouse's story</title></head>

<body>

<p class="title"><b>The Dormouse's story</b></p>


<p class="story">Once upon a time there were three little sisters; and their names were

<a href="http://example.com/elsie" class="sister" id="link1">Elsie</a>,

<a href="http://example.com/lacie" class="sister" id="link2">Lacie</a> and

<a href="http://example.com/tillie" class="sister" id="link3">Tillie</a>;

and they lived at the bottom of a well.</p>


<p class="story">...</p>"""

我想用 替换a这个字符串中的某个字符,x条件是只a出现在 HTML 的内部文本中被替换,并且任何a属于标记标签或值的部分都不应该被替换。


我尝试使用 BeautifulSoup 及其get_text()方法,但这并不能解决我的目的。有没有办法在 Python 中实现这一点?


交互式爱情
浏览 321回答 1
1回答
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python