问答详情
源自:1-1 文件的编码

1-1我在E盘直接创建一个联通1.txt文件,以utf-8编码格式保存,里面写联通两字,竟然是9字节?

就是直接在E盘创建一个 联通1.txt 文件,里边是两个汉字“ 联通“,以utf-8编码格式保存,竟然是9字节。

但是我在eclipse中创建一个utf-8格式编码的 联通1.txt,里边也是两个汉字“ 联通“,拷贝到E盘下,查看属性,就是6字节。

大家知道UTF-8编码一个汉字3字节,同样的都是UTF-8格式,而且里边无其他内容,包括空格,一个是9字节,一个是6字节,求大神解答,困扰挺久了。。。

提问者:_长野的天 2016-08-22 14:06

个回答

  • mashimarommt
    2016-09-09 11:16:16
    已采纳

    记事本有默认的BOM头占三个字节

  • 慕斯卡1939121
    2016-08-22 21:54:40

    记事本bug 换个别的字就行了

  • qq_陌上花开_70
    2016-08-22 16:00:13

    7、互联网的兴起,网页上要显示各种字符,必须统一啊,亲。utf-8就是Unicode最重要的实现方式之一。另外还有utf-16、utf-32等。UTF-8不是固定字长编码的,而是一种变长的编码方式。它可以使用1~4个字节表示一个符号,根据不同的符号而变化字节长度。这是种比较巧妙的设计,如果一个字节的第一位是0,则这个字节单独就是一个字符;如果第一位是1,则连续有多少个1,就表示当前字符占用多少个字节。

    网页地址:http://blog.csdn.net/kaida1234/article/details/49515385

  • ELxiang
    2016-08-22 15:58:07

    这个应该跟你的电脑编码有关  你的电脑编码是gbk的话 那就是4个  你的电脑编码是utf-16  那就是8个字节,我不清楚你的9个字节是什么编码