使用Python 2.7,我想知道使用type unicode代替真正的优势是什么str,因为它们似乎都可以容纳Unicode字符串。除了能够unicode使用转义字符在字符串中设置Unicode代码之外,还有什么特殊的原因\吗?:
使用以下命令执行模块:
# -*- coding: utf-8 -*-
a = 'á'
ua = u'á'
print a, ua
结果:á,á
编辑:
使用Python Shell进行更多测试:
>>> a = 'á'
>>> a
'\xc3\xa1'
>>> ua = u'á'
>>> ua
u'\xe1'
>>> ua.encode('utf8')
'\xc3\xa1'
>>> ua.encode('latin1')
'\xe1'
>>> ua
u'\xe1'
因此,该unicode字符串似乎是使用latin1而不是编码的utf-8,而原始字符串是使用utf-8?编码的。我现在更加困惑!:S
江户川乱折腾
长风秋雁
相关分类