杨魅力
Unicode 和 UTF-8 之间的转换关系表 ( x 字符表示码点占据的位 )码点的位数 码点起值 码点终值 字节序列 Byte 1 Byte 2 Byte 3 Byte 4 Byte 5 Byte 6 7 U+0000 U+007F 1 0xxxxxxx11 U+0080 U+07FF 2 110xxxxx 10xxxxxx16 U+0800 U+FFFF 3 1110xxxx 10xxxxxx 10xxxxxx21 U+10000 U+1FFFFF 4 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx26 U+200000 U+3FFFFFF 5 111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx31 U+4000000 U+7FFFFFFF 6 1111110x 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx非3个字节就是0x0800-0xffff之外的const str = '1。中\文a';const reg = /[^\u0800-\uffff]/g;str.replace(reg,'');