如何在python 3中将unicode字符转换为\Uxxxxxxxx格式

我有一个像 ? 这样的 unicode 字符,我想找回 \Uxxxxxxxx 格式。但直到现在,还没有找到一个简单的方法。已经尝试过:


text = ?


text.encode('utf-32').decode('utf-8')

returns error: UnicodeDecodeError: 'utf-8' codec can't decode byte 0xff in position 0: invalid start byte


text.encode('utf-32').decode('unicode-escape')

returns ÿþ

如何让它返回 \U000XXXXX ?我知道我可以从 \U000XXXXX 中得到这个字符:


string = "foo bar foo \U000XXXXX"

string.encode('utf-8').decode('unicode-escape')

returns "foo bar foo ?"


繁花如伊
浏览 291回答 1
1回答

Smart猫小萌

对于字节字符串:>>> text = '?'>>> text.encode('unicode-escape')b'\\U0001f3c6'对于 Unicode 字符串:>>> text.encode('unicode-escape').decode('ascii')'\\U0001f3c6'
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python