问题

为什么需要同步容器类？
同步容器类的优点和缺点？
对我们设计的启发

同步容器类

java 中的同步容器

在Java中，同步容器主要包括2类：

1）Vector、Stack、HashTable

2）Collections类中提供的静态工厂方法创建的类

Vector实现了List接口，Vector实际上就是一个数组，和ArrayList类似，但是Vector中的方法都是synchronized方法，即进行了同步措施。

Stack也是一个同步容器，它的方法也用synchronized进行了同步，它实际上是继承于Vector类。

HashTable实现了Map接口，它和HashMap很相似，但是HashTable进行了同步处理，而HashMap没有。

Collections类是一个工具提供类，注意，它和Collection不同，Collection是一个顶层的接口。

在Collections类中提供了大量的方法，比如对集合或者容器进行排序、查找等操作。

最重要的是，在它里面提供了几个静态工厂方法 Collections.synchronizedXXX 来创建同步容器类，

这些类实现安全的方式是，将他们的状态封装起来，并对每个public方法进行同步，从而使得每次只有一个线程能访问容器的状态。

复合操作

同步容器类都是线程安全的，但是对于某些复合操作需要额外的加锁来保护。常见复合操作有：迭代（反复访问元素，直到遍历所有元素）、跳转（根据指定顺序找到当期元素的下一个元素）以及条件运算（如：如没有则添加）。

Get/Delete 线程问题

存在问题的代码

  [java]
1
2
3
4
5
6
7
8
9
public static Object getLast(Vector list){
    int lastIndex = list.size() - 1;
    return list.get(lastIndex)
}

public static void deleteLast(Vector list){
    int lastIndex = list.size() - 1;
    list.remove(lastIndex);
}

上面例子中，Vector中定义了两个方法，它们都执行先检查再运行操作。先获取数组大小，再获取或删除最后一个元素。这些方法看似没问题，并且都是线程安全的，也不破坏Vector。但是从调用者角度来看，就有问题了。可能A线程调用getLast的过程中，B线程调用了deleteLast，Vector元素减少，导致A线程调用失败。

同步容器类遵守同步策略，即支持客户端加锁，因此只要我们知道应该使用那个锁，就能创建一些新的操作。这些新操作与容器与其他操作都是原子操作。同步容器通过自身的锁来保护它的每个方法。通过获取容器的锁，就能使上面的方法称为原子操作。size和get操作之间不会有其他操作。

Vector 上复合加锁

  [java]
1
2
3
4
5
6
7
8
9
10
11
12
13
14
public static Object getLast(Vector list){
    synchronized(list){
        int lastIndex = list.size() - 1;
        return list.get(lastIndex)
    }
    
}

public static void deleteLast(Vector list){
    synchronized(list){
        int lastIndex = list.size() - 1;
        list.remove(lastIndex);
    }
}

遍历的线程安全问题

问题代码

同样的问题也会出现在遍历上，如下面的例子：

  [java]
1
2
for(int i=0; i< vector.size(); i++)
    doSomgthing(vector.get(i));

如果另外一个线程删除一个元素，会导致ArrayIndexOutBoundsException异常。

修正代码

我们可以通过加锁来解决迭代不可靠问题，避免其他线程在遍历过程修改Vector。

但也带来性能问题，迭代期间其他线程无法访问它。

  [java]
1
2
3
4
synchronized(vector){
    for(int i=0; i< vector.size(); i++)
        doSomgthing(vector.get(i));
}

上面的例子在未加锁的情况下都可能抛出异常，这并不意味着Vector不是线程安全的。Vector仍然是线程安全的，抛出的异常也与其规范保持一致。

迭代器与ConcurrentModificationException

对容器进行迭代的标准方式是使用Iterator，使用for-each语法，也是调用Iterator。

在设计同步容器类的时候并没有考虑并发修改问题，它们表现出的行为是“及时失败”的，意味着在迭代过程中，如果有其他线程修改容器，会抛出ConcurrentModificationException异常。它们实现的方式是，将计数器变化与容器关联起来，放迭代器件计数器被修改，那么hasNext或next将抛出异常。这是设计上的一个权衡。

如果容器规模很大，那么后续线程将会等待较长的时间。调用 doSomething 时持有锁，可能会产生死锁。长时间对容器加锁会降低程序的可伸缩性。持有锁的时间过长，竞争就可能越激烈，如果有多个线程在等待，那么将极大降低吞吐量和CPU的利用率。

要想避免ConcurrentModificationException，就必须在迭代过程持有容器的锁。但是如果容器规模很大，迭代过程持有锁，将导致严重的性能问题。一种替代方式就是“克隆容器”，并在副本上迭代。克隆过程仍然需要加锁，同时存在显著的性能开销。克隆容器的好坏取决于过个元素，如容器大小，迭代时，每个元素执行的操作等。

隐藏迭代器

加锁可以防止迭代抛出ConcurrentModificationException异常，但是需要在所有迭代的地方进行加锁。实际情况通常更加复杂，有些情况下可能会忽略隐藏的迭代器。

  [java]
1
2
3
4
5
6
7
8
9
10
11
12
13
14
public class HiddenIterator{
    private final Set(Integer) set = new HashSet<>();
    
    public synchronized void add(Integer i){set.add(i)}
    public synchronized void remove(Integer i){set.remove(i)}
    
    public void addTenThings(){
        Random r = new Random();
        for(int i=0;i<10;i++){
            add(r.nextInt());
        }
        System.out.println("debug" + set)
    }
}

addTenThings方法可能抛出ConcurrentModificationException异常，因为在打印输出的时候进行字符串连接，会调用set的toString方法，toString方法会对容器进行迭代。在使用println前必须获取HiddenIterator的锁，但是实际应用中可能忽略。

封装对象的状态有助于维持不变性，封装对象的同步机制有助有确保实施同步策略。

如果使用synchronizedSet来包装HashSet，并且对同步代码进行封装，就不会发生这种错误。

隐式迭代情况

除了toString，hashCode和equals等方法也会间接执行迭代操作。

当容器作为另一个容器的元素和键值时，就会出现这种情况。

同样，containsAll，removeAll等方法，以及把容器作为参数的构造函数都会对容器进行迭代。这些间接操作都有可能抛出ConcurrentModificationException异常。

同步容器的缺陷

并非任何场景都是线程安全的。
因为加锁，性能比较差。

参考资料

《java 并发编程的艺术》

http://www.cnblogs.com/lilinwei340/p/6987008.html

https://www.cnblogs.com/dolphin0520/p/3933404.html

问题
同步容器类
迭代器与ConcurrentModificationException
隐藏迭代器
- 隐式迭代情况
同步容器的缺陷
参考资料

JCIP-06-同步容器类

问题