我有一个像 ? 这样的 unicode 字符,我想找回 \Uxxxxxxxx 格式。但直到现在,还没有找到一个简单的方法。已经尝试过:
text = ?
text.encode('utf-32').decode('utf-8')
returns error: UnicodeDecodeError: 'utf-8' codec can't decode byte 0xff in position 0: invalid start byte
text.encode('utf-32').decode('unicode-escape')
returns ÿþ
如何让它返回 \U000XXXXX ?我知道我可以从 \U000XXXXX 中得到这个字符:
string = "foo bar foo \U000XXXXX"
string.encode('utf-8').decode('unicode-escape')
returns "foo bar foo ?"
Smart猫小萌
相关分类