看起来相同的字符串但不同的字节表示

上面的字符串是我输入的,而底部的字符串是从数据库中提取的。


bytes('TOYOTA', 'utf-8')

>> b'TOYOTA'


bytes('ΤΟΥΟΤΑ', 'utf-8')

>> b'\xce\xa4\xce\x9f\xce\xa5\xce\x9f\xce\xa4\xce\x91'

当我想检查它是否存在时,这会导致不良结果


'TOYOTA' == 'ΤΟΥΟΤΑ'

>> False

知道如何“修复”不正确的字符串吗?


杨__羊羊
浏览 165回答 1
1回答

蓝山帝景

这些似乎是希腊大写字母:>>> import unicodedata>>> s = 'ΤΟΥΟΤΑ'>>> for c in s:...     print(unicodedata.name(c))... GREEK CAPITAL LETTER TAUGREEK CAPITAL LETTER OMICRONGREEK CAPITAL LETTER UPSILONGREEK CAPITAL LETTER OMICRONGREEK CAPITAL LETTER TAUGREEK CAPITAL LETTER ALPHA
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python