Python:从ISO-8859-1 / latin1转换为UTF-8

我已经使用电子邮件模块将该字符串从Quoted-printable解码为ISO-8859-1。这给了我像“ \ xC4pple”这样的字符串,它对应于“Äpple”(瑞典语中的Apple)。但是,我无法将这些字符串转换为UTF-8。


>>> apple = "\xC4pple"

>>> apple

'\xc4pple'

>>> apple.encode("UTF-8")

Traceback (most recent call last):

  File "<stdin>", line 1, in <module>

UnicodeDecodeError: 'ascii' codec can't decode byte 0xc4 in position 0: ordinal not in     range(128)

我该怎么办?


慕尼黑的夜晚无繁华
浏览 2350回答 3
3回答

斯蒂芬大帝

对于Python 3:bytes(apple,'iso-8859-1').decode('utf-8')我将其用于错误编码为iso-8859-1(显示类似VeÅ\x99ejné之类的单词)的文本,而不是utf-8。此代码产生正确的版本Veřejné。
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python