将数字字符引用表示法转换为Unicode字符串

有没有一种标准的方法(最好是Pythonic方法)将&#xxxx;表示法转换为正确的unicode字符串?

例如,

מפגשי

应转换为:

מפגשי

使用字符串操作可以很容易地做到这一点,但是我想知道是否有一个标准的库。


慕勒3428872
浏览 168回答 1
1回答

慕运维8079593

用途HTMLParser.HTMLParser():>>> from HTMLParser import HTMLParser>>> h = HTMLParser()>>> s = "מפגשי">>> print h.unescape(s)מפגשי它也是标准库的一部分。但是,如果您使用的是Python 3,则必须从导入html.parser:>>> from html.parser import HTMLParser>>> h = HTMLParser()>>> s = 'מפגשי'>>> print(h.unescape(s))מפגשי
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python