我正在尝试使用 Python 3's 解码一些电子邮件文本bytes.decode(encoding)
,其中encoding
来自charset
电子邮件标题的字段。
问题:一些电子邮件将“cp-850”列为他们的字符集,同时decode()
接受“cp850”。
如果我只是去掉连字符,那么另一个像 iso-8859-6 这样的代码集就会变成 iso88596,这是一种无法识别的编码。
如何在encoding
不创建更多未知编码的情况下清理 arg ?
[编辑] 后续问题:如何email.message.Message
以 接受的格式(别名)从对象中获取字符集bytes.decode()
?
[编辑] 澄清了问题。以前当我指的是字符集时使用了错误的术语“内容编码”。
红糖糍粑
相关分类