将字符串从xmlcharrefreplace转换回utf-8

我的下一部分代码是:


In [8]: st = u"опа"


In [11]: st.encode("ascii", "xmlcharrefreplace")

Out[11]: 'опа'


In [14]: st1 = st.encode("ascii", "xmlcharrefreplace")


In [15]: st1.decode("ascii", "xmlcharrefreplace")

Out[15]: u'опа'


In [16]: st1.decode("utf-8", "xmlcharrefreplace")

Out[16]: u'опа'

您知道如何转换st1回u"опа"吗?


慕尼黑的夜晚无繁华
浏览 201回答 1
1回答

蓝山帝景

使用html.unescape()功能(Python 3.4及更高版本):>>> import html>>> html.unescape('опа')'опа'在较旧的版本(包括Python 2)上,您必须使用的实例HTMLParser.HTMLParser():>>> from HTMLParser import HTMLParser>>> parser = HTMLParser()>>> parser.unescape('опа')u'\u043e\u043f\u0430'>>> print parser.unescape('опа')опа
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python