字符是一个信息单位,它是各种文字和符号的总称
字符集字符集是字符的集合
ASCII 有128个字符
Unicode 包含了世界各国语言中的所有字符
字符编码将字符集中的字符编码为特定的二进制数
ASCII包含英文字母 数字 一些普通符号 用一个字节表示
Unicode它为每种语言的每个字符设定了独一无二的编码
utf-8utf-8 是一种可变长的字符编码 用一到四个字节来表示字符 英文使用一个字节编码 汉字使用三个字节进行编码
python3 的默认编码是 utf-8import sys
sys.getdefaultencoding()
utf-8
bytes()
In [81]: bytes("中","utf-8")
Out[81]: b'\xe4\xb8\xad'
In [82]: bytes("A","utf-8")
Out[82]: b'A'