就是直接在E盘创建一个 联通1.txt 文件,里边是两个汉字“ 联通“,以utf-8编码格式保存,竟然是9字节。
但是我在eclipse中创建一个utf-8格式编码的 联通1.txt,里边也是两个汉字“ 联通“,拷贝到E盘下,查看属性,就是6字节。
大家知道UTF-8编码一个汉字3字节,同样的都是UTF-8格式,而且里边无其他内容,包括空格,一个是9字节,一个是6字节,求大神解答,困扰挺久了。。。
记事本有默认的BOM头占三个字节
记事本bug 换个别的字就行了
7、互联网的兴起,网页上要显示各种字符,必须统一啊,亲。utf-8就是Unicode最重要的实现方式之一。另外还有utf-16、utf-32等。UTF-8不是固定字长编码的,而是一种变长的编码方式。它可以使用1~4个字节表示一个符号,根据不同的符号而变化字节长度。这是种比较巧妙的设计,如果一个字节的第一位是0,则这个字节单独就是一个字符;如果第一位是1,则连续有多少个1,就表示当前字符占用多少个字节。
网页地址:http://blog.csdn.net/kaida1234/article/details/49515385
这个应该跟你的电脑编码有关 你的电脑编码是gbk的话 那就是4个 你的电脑编码是utf-16 那就是8个字节,我不清楚你的9个字节是什么编码