Java内存模型是Java虚拟机制定的一种规范,众所周知的Java程序都是运行在JVM上的,而Java语言“一次编写,到处运行”的特效很多程度是来源与虚拟机,因为不同的操作系统都有自身相对应的内存模型和线程调度的方式,所以之前一些语言很难解决的问题就是同一套代码在不同平台上面运行时会因为操作系统以及机器的不同,产生很多的问题,而JVM中的内存模型规范就把开发人员和不同的硬件、操作系统分离开来,使得开发人员更好的专注于业务,除了Java是纯粹的面向对象语言以外,对各个平台的一致性也是Java如此多的被用于服务器端非常重要的原因之一,并发的程序在之前由于平台的差异产生的问题尤为突出,说这些,是因为要想理解Java并发编程的一些问题,对Java内存模型的了解是十分重要的,现在开始进入正题。
简单介绍Java内存模型主要目标是定义程序中各个变量的访问规则,这里不要和Java内存区域搞混了,内存区域是对Java程序进行的内存划分,这里可以看看我之前写的一篇Java内存区域,而Java内存模型的主要目标是定义程序中各个变量的访问规则,即在虚拟机中将变量存储到内存和从内存中取出时的具体细节。这里的变量包括了实例字段、静态字段和构成数组对象的元素,但不包括局部变量和方法参数(因为线程私有,不存在资源共享和竞争的问题)。Java内存模型没有限制执行引擎使用处理器的特点寄存器或缓存来和主内存进行交互,也没有限制即使编译器对代码的执行顺序进行调整。首先看一张图
Jvm通过Java内存模型(JMM)协调线程、工作内存之间的。Java内存模型规定了所有的变量都储存在主内存内,每条线程有自己的工作内存,线程的工作内存中保存了被该线程使用到的变量的主内存副本拷贝(注意拷贝的不是对象本身,一般是对象的引用、对象中某个线程访问到的字段)。线程对变量的读取、赋值等都必须在工作内存中进行,不能直接读取主内存中的变量(即使对于volatile关键字也不例外)。不同的线程之间也无法直接访问对方工作内存中的变量,线程间变量值的传递需要通过主内存来完成,因为程序的读写时主要访问的是工作内存,所以虚拟机会让工作内存优先存储于寄存器和高速缓存中。
内存间交互指一个变量如何从主内存拷贝到工作内存、如何从工作内存同步回主内存的实现细节,Java内存模型定义了8大操作来完成,虚拟保证了其中每一种操作都是原子的、不可再分的,看看下面的图
看看这张图,要把变量进行读写操作,就要经过上图中的流程,如果进行读取操作,先给这个变量加锁(Lock),然后把这个变量从主内存传输到线程的工作内存中(Read),接下来把得到的变量值放入到工作内存的变量副本中(Load),这样就可以给Java线程读取了(Use);如果要进行写操作,首先把一个从执行引擎接收到的值赋值给内存的变量(Assign),然后把工作内存中的一个变量值传送到主内存中(Store),最后把通过Store操作得到的变量值放入主内的变量中(Write),此后就是释放锁(UnLock)。这里是说按常规顺序,Java内存模型只对Read和Load(进行读操作时),Store和Write(进行写操作时)操作保证了必须顺序执行,如果对多个变量进行同时访问时顺序是可以,整体的顺序是可以被打乱的,如read a、read b、load b、load a。除此之外,在执行8大操作时还必须满足一下的规则
8大操作遵循的规则
1.不允许出现一个变量从主内存读取了但工作内存不接受,或者从工作内存读发起回写但主内存不接受的情况。
2.变量在工作内存中改变了之后必须把该变化同步回主内存。
3.不允许一个线程没有发生过assign操作就把数据从工作内存同步回主内存。
4.对一个变量进行use和store之前必须执行过assign和load操作。
5.一个变量在同一时刻只允许一条线程对其进行lock操作,但lock操作可以被同一线程重复执行多次。
6.对一个变量执行lock操作之前,回清除工作内存中此变量的值,在执行引擎使用这个变量前,需要重新执行load和assgin操作初始化变量的值。
7.如果一个变量没有进行锁定,就不得进行unlock操作,不允许unlock被其他线程锁定的变量。
8.对一个变量执行unlock之前,必须把此变量同步回主内存中。指令重排序
指令重排序是为了程序获得更好的性能,JVM对程序进行的优化,普通的变量能保证在方法执行过程中所有依赖赋值结果的地方都能获取到正确的结果,而不保证变量赋值的顺序与程序代码中的顺序一致,也正是由于这一点,所以程序多线程并发执行时会产生很多的问题。说到指令重排序,就不得不说下volatile关键字,volatile保证了变量对所有线程的可见性,也就是一旦变量值被修改,可以直接被其他线程得知,不需要通过主内存来进行传递(注意!可见性并不等于原子性);volatile还有一个重要的作用就是禁止指令重排序优化,指令重排序虽说是为了提高程序的性能,但会因此带来并发问题,这里用一段代码来看看
public class SingletonExample5 {
private SingletonExample5() {
}
// 单例对象 volatile+双重校验锁防止指令重排
private static volatile SingletonExample5 instance = null;
/**
* 线程不安全 多线程模式下JVM和CPU优化导致指令重排
* @return
*/
public static SingletonExample5 getInstance() {
if (instance == null) {
synchronized (SingletonExample5.class) {
if (instance == null) {
instance = new SingletonExample5();
}
}
}
return instance;
}
}
对设计模式了解的都知道,这就是使用了**双层校验锁**的单例模式,这里这个变量就是要用**volatile**来进行修饰,因为在多线程模式下,判断instance为空后就把这个类进行了锁定,如果这时另一个线程访问到这里,可能会导致变量instance未被初始化就指向了分配的内存空间,前面说过,指令重排导致出现的这个问题,而使用了volatile关键字后,会在变量赋值后插入一道**内存屏障**,指令重排序时不能把后面的指令重排序到屏障之前的位置,这样就保证了变量能够安全的执行后面的操作。而对于此时进来的线程来说,当执行引擎执行到内存屏障这里时,意外着之前的操作已经完成,这个线程将放弃后续的操作。
## 原子性、可见性、有序性
1.**原子性**: 由Java内存模型来直接保证的原子性变量操作包括read、load、assign、use、store和write,这些主要是对变量的读写操作,如果需要更大范围的原子性保证,可以用**synchronized**关键字。
2.**可见性**: 指当一个线程修改了共享变量的值,其它线程能立即得知这个修改。主要提供的关键字有**volatile**、**synchronized**、**final**,volatile就不多说了,sychronized的可见性是“对一个变量执行unlock操作之前,必须先把变量同步回主内存”;而final关键字是由于被其修饰的字段一旦初始化完成,构造器没有通过this的引用传递出去,其它线程就能直接获取final的值。
3.**有序性**: 线程内表现为串行,但多线程情况下会发生指令重排序和工作内存与主内存同步延迟。
## 先行发生原则
先行发生原则是Java内存模型已经制定的并且无需任何其它操作就存在的规范,这也是判断数据是否存在竞争、线程是否安全的主要依据,如下
>1.程序次序规则:在一个线程内,按照程序的控制流的顺序依次执行。
2.管程锁定规则:一个unlock操作先行发生于后面对同一个锁的lock操作。
3.volatile变量规则:对一个volatile变量的写操作先行发生于后面对这个变量的读操作。
4.线程启动规则:Thead对象的start()方法先行发生于此线程的每一个动作。
5.线程终止原则:线程中的所有操作都先行发生于对此线程的终止检测。
6.线程中断规则:对线程interrupt()方法的调用先行发生于被中断线程的代码检测到中断事件的发生。
7.对象终结规则:一个对象初始化的完成先行与它的**finalize()**方法的开始。
8.传递性:如果操作A先行发生于操作B,操作B先行发生于操作C,那么操作A先行发生于操作C。
## 结尾
Java内存模型的总结就到这里了,大部分是学习的笔记,也有自己的一些理解,如果有不对的地方,请留言指教。只要花时间去理解,这些东西也不是那么枯燥的,共勉。