如何将二进制字符串转换为字节？

如果我将字母 'à' 编码为 UTF-8，我会得到以下结果：

'à'.encode('utf-8')

>> b'\xc3\xa0'

现在从字节数组中，我想将 'à' 转换为二进制字符串并将其重新转换为 'à'。为此，我执行以下代码：

byte = bytearray('à','utf-8')

for x in byte:

print(bin(x))

我得到0b11000011和0b10100000，即 195 和 160。然后，我将它们融合在一起并取出0b部分。现在我执行这段代码：

s = '1100001110100000'

value1 = s[0:8].encode('utf-8')

value2 = s[9:16].encode('utf-8')

value = value1 + value2

print(chr(int(value, 2)))

>> 憠

无论我如何开发后面的部分，我都会得到符号并且似乎永远无法找回我的“à”。我想知道这是为什么？我怎么能得到一个'à'。

白衣非少年

浏览 533回答 3

3回答

侃侃无极

>>> bytes(int(s[i:i+8], 2) for i in range(0, len(s), 8)).decode('utf-8') 'à'这有多个部分。该bytes构造函数创建一个从整数序列的字节串。整数由int以 2 为基数的字符串组成。range与切片的组合一次剥离 8 个字符。最后decode将这些字节转换回 Unicode 字符。

神不在的星期二

你需要你的第二位是s[8:16]（或只是s[8:]）否则你会得到0100000您还需要将“位字符串”转换回整数，然后再将其视为一个字节 int("0010101",2)s = '1100001110100000'value1 =  bytearray([int(s[:8],2), # bits 0..7 (8 total)                     int(s[8:],2)] # bits 8..15 (8 total)) print(value1.decode("utf8"))

随时随地看视频慕课网APP