手记

为什么 Java 要把字符串设计成不可变的

String是Java中一个不可变的类,所以它一旦被实例化就无法被修改。不可变类的实例一旦创建,其成员变量的值就不能被修改。不可变类有很多优势。本文总结了为什么字符串被设计成不可变的。将涉及到内存、同步和数据结构相关的知识。

字符串池
字符串池是Java运行环境方法区中的一部分特殊存储。当一个字符串被创建之时,首先会去这个字符串池中查找,如果找到直接返回对该字符串的引用。

下面的代码只会在堆中创建一个字符串:
String string1 = "abcd";
String string2 = "abcd";

下面是图示:

如果字符串可变的话,当两个引用指向指向同一个字符串时,对其中一个做修改就会影响另外一个。(请记住该影响,有助于理解后面的内容)

注意:
String s = new String(“abc”); 创建了几个对象,有两种情况:
1.如果字符串常量池中有字符串abc,那么只会在内存中创建一个对象(此对象是不能重复的);
2.如果字符串常量池中没有字符串abc,那么在字符串常量池中创建一个内容为abc的对象, 但是遇到了new关键字,则还是会在内存(不是常量池)中创建一个对象,然后将对象返回给引用s, 特别注意s不是一个对象。
说明:Java方法区中的字符串常量池,由String类维护。执行语句String s=“abc"时,首先查看字符串池中是否存在字符串"abc”,如果存在则直接将"abc"赋给s,如果不存在则先在字符串常量池中新建一个字符串"abc",然后再将其赋给s。执行语句String s=new String(“abc”)时,不管字符串常量池中是否存在字符串"abc",直接新建一个字符串"abc"(注意:新建的字符串"abc"不是在字符串常量池中),然后将其赋给s。

缓存Hashcode
Java中经常会用到字符串的哈希码(hashcode)。例如,在HashMap中,字符串的不可变能保证其hashcode永远保持一致,这样就可以避免一些不必要的麻烦。这也就意味着每次在使用一个字符串的hashcode的时候不用重新计算一次,这样更加高效。
在String类中,有以下代码:

private int hash;//this is used to cache hash code. 

以上代码中hash变量中就保存了一个String对象的hashcode,因为String类不可变,所以一旦对象被创建,该hash值也无法改变。所以,每次想要使用该对象的hashcode的时候,直接返回即可。

使其他类的使用更加便利:
在介绍这个内容之前,先看以下代码:

HashSet<String> set = new HashSet<String>();
set.add(new String("a"));
set.add(new String("b"));
set.add(new String("c"));
for(String a: set){
    a.value = "a";
}

在上面的例子中,如果字符串可以被改变,那么以上用法将有可能违反set的设计原则,因为set要求其中的元素不可以重复。上面的代码只是为了简单说明该问题,其实String类中并没有value这个字段值。

安全性
String被广泛的使用在其他Java类中充当参数。比如网络连接、打开文件等操作。如果字符串可变,那么类似操作可能导致安全问题。因为某个方法在调用连接操作的时候,他认为会连接到某台机器,但是实际上并没有(其他引用同一String对象的值修改会导致该连接中的字符串内容被修改)。可变的字符串也可能导致反射的安全问题,因为它的参数也是字符串。
代码示例:

boolean connect(string s){
    if (!isSecure(s)) { 
        throw new SecurityException(); 
    }
    //如果s在该操作之前被其他的引用所改变,那么就可能导致问题。   
    causeProblem(s);
}

不可变对象天生就是线程安全的
因为不可变对象不能被改变,所以他们可以自由地在多个线程之间共享。不需要任何同步处理。
总之,String被设计成不可变的主要目的是为了安全和高效。所以,使String是一个不可变类是一个很好的设计。

1人推荐
随时随地看视频
慕课网APP