手记

python 字符集基础知识

字符

字符是一个信息单位,它是各种文字和符号的总称

字符集

字符集是字符的集合

ASCII 有128个字符

Unicode 包含了世界各国语言中的所有字符

字符编码

将字符集中的字符编码为特定的二进制数

ASCII

包含英文字母 数字 一些普通符号 用一个字节表示

Unicode

它为每种语言的每个字符设定了独一无二的编码

utf-8

utf-8 是一种可变长的字符编码 用一到四个字节来表示字符 英文使用一个字节编码 汉字使用三个字节进行编码

python3 的默认编码是 utf-8
import sys
sys.getdefaultencoding()
utf-8
bytes()
In [81]: bytes("中","utf-8")
Out[81]: b'\xe4\xb8\xad'

In [82]: bytes("A","utf-8")
Out[82]: b'A'
0人推荐
随时随地看视频
慕课网APP