吾生也有涯,而知也无涯。———《庄子》
通过上一篇文章,我们已经知道设计一个线程安全类的原则和步骤,以及在设计过程中我们应当注意的细节。实际上,Java 的集合库包含了线程安全集合和非线程安全集合,可以说 Java 的线程安全集合库就是按照前一篇说到的实例封闭、安全性的委托、组合这几个方式来实现的。
这篇主要简单介绍 Java 集合库包含哪些常用的容器类,它们可以简单区分为:
非同步集合
同步集合
并发集合
那么,它们分别包括哪些具体的集合类,它们有什么主要的区别,以及它们的框架是怎样的?
这就是今天要讲的内容,读完这篇文章你应该要知道常用的集合库有哪些具体容器类,多线程的情况下应该用哪种集合以及它们的主要区别。
Java 集合框架
Java 集合工具包在 Java.util 包下,它包含了常用的数据结构,比如数组、链表、栈、队列、集合、哈希表等等。
这里先放一张 Java 集合类的框架图:
Java 集合框架
Collection 接口是集合类的根接口,Java 中没有提供这个接口的直接的实现类。但是让其被继承产生了两个接口,就是 Set 和 List。Set中不能包含重复的元素。List是一个有序的集合,可以包含重复的元素,提供了按索引访问的方式。
Map 是 Java.util 包中的另一个接口,它和 Collection 接口没有关系,是相互独立的,但是都属于集合类的一部分。Map 包含了 key-value 对。Map 不能包含重复的 key,但是可以包含相同的 value。
其中还有一个 Iterator 接口,Collection 继承了它,也就是说所有的集合类,都实现了Iterator接口,这是一个用于遍历集合中元素的接口,主要包含以下三种方法:
hasNext()是否还有下一个元素。
next()返回下一个元素。
remove()删除当前元素。
对于 Java 集合框架,这里不再做过多的说明,如果要完全剖析,那估计得再开一个专栏来讲。下面对具体容器类分类,我们直接来看他们分别属于哪些类型。
非同步集合
非同步集合,在并发访问的时候,是非线程安全的;但是由于它们没有同步策略(加锁机制),它们的效率更高。常用的非同步集合它们包括下面几个:
ArrayList
HashSet
HashMap
LinkedList
TreeSet
TreeMap
PriorityQueue
同步集合
对每个方法都进行同步加锁,保证线程安全。
HashTable
Vector
Stack
同步包装器 : [ Collections.synchronizedMap(), Collections.synchronizedList() ]
Java 集合类中非线程安全的集合可以用同步包装器使集合变成线程安全,其实实现原理就是相当于对每个方法加多一层同步锁而已,比如:
HashMap --> Collections.synchronizedMap(new HashMap())
ArrayList --> Collections.synchronizedList(new ArrayList<>())
并发集合
java.util.concurrent包下,并发容器类如下::
ConcurrentHashMap
ConcurrentSkipListMap
ConcurrentSkipListSet
CopyOnWriteArrayList
CopyOnWriteArraySet
ArrayBlockingQueue
LinkedBlockingQueue
PriorityBlockingQueue
LinkedBlockingDeque
ConcurrentLinkedQueue
同步集合类和并发集合类的区别
不管是同步集合还是并发集合他们都支持线程安全,他们之间主要的区别体现在性能和可扩展性,还有他们如何实现的线程安全。
同步集合类,Hashtable 和 Vector 还有同步集合包装类,Collections.synchronizedMap()和Collections.synchronizedList(),相比并发的实现(比如:ConcurrentHashMap, CopyOnWriteArrayList, CopyOnWriteHashSet)会慢得多。
造成如此慢的主要原因是锁, 同步集合会把整个Map或List锁起来,每个操作都是串行的操作,同一时刻只有一个线程能操作。而并发集合不会,并发集合实现线程安全是通过使用先进的和成熟的技术把锁剥离。
比如ConcurrentHashMap 会把整个Map 划分成几个片段,只对相关的几个片段上锁,同时允许多线程访问其他未上锁的片段。
CopyOnWriteArrayList 允许多个线程以非同步的方式读,当有线程写的时候它会将整个List复制一个副本给它。如果在读多写少这种对并发集合有利的条件下使用并发集合,这会比使用同步集合更具有可伸缩性。