我写了一个 Python 代码来修改我的 html 内容。但是在再次将其写入 html 文件时,我得到了奇怪的十六进制数字
import re
search="www.abc.com"
description="blah blah"
f = open('myhtml.html','r+')
content = f.read()
exp_keyword = re.compile(r'\.(\S+)\.')
reducedSearch = exp_keyword.findall(search)[0]
regexLink = re.compile(reducedSearch+r'\.'+r'.+'+'</a>',re.DOTALL)
matchregexLink = regexLink.search(content)
endOfMatch = matchregexLink.span()[1]
#slice the string
s1 = content[:endOfMatch]
s2=content[endOfMatch:]
content = s1+description+s2
print(content)
f.truncate(0)
f.write(content)
<html>
<head>
</head>
<body>
<div id="phy">
<p>
ett
</p>
<div class="links">
<ul>
<a href="www.abcd.com">
Link
</a>
<a href="www.abc.com">
Link
</a>
</ul>
</div>
</div>
</body>
</html>
这些奇怪的十六进制数字是我得到的输出。但是,当我在代码中打印时content
,它给出了正确的答案。为什么这样?我的预期答案blah blah
写在包含 www.abc.com 链接的结束</a>
标记之后。
小怪兽爱吃肉
相关分类