一道题目引发的血案

首先看一道题目。

题目

  • Singleton.java
public class Singleton {

    private static Singleton singleton = new Singleton();

    public static int count1;

    public static int count2 = 0;

    private Singleton() {
        count1++;
        count2++;
    }

    public static Singleton getInstance() {
        return singleton;
    }


    public static void main(String[] args) {
        Singleton singleton = Singleton.getInstance();
        System.out.println("count1=" + singleton.count1);
        System.out.println("count2=" + singleton.count2);
    }
}

答案

测试结果为:

count1=1
count2=0

如果你感觉到不解,你可能需要学习下类的加载机制。

过程分析

过程如下:

(看完全文,回顾看更容易理解)

  1. Singleton singleton = Singleton.getInstance(); 调用了类的 Singleton 调用了类的静态方法,触发类的初始化

  2. 类加载的时候在准备过程中为类的静态变量分配内存并初始化默认值 singleton=null count1=0,count2=0

  3. 类初始化,为类的静态变量赋值和执行静态代码快。singleton赋值为new SingleTon()调用类的构造方法

  4. 调用类的构造方法后count=1;count2=1;

  5. 继续为count1与count2赋值,此时count1没有赋值操作,所有count1为1,但是count2执行赋值操作就变为0

类加载机制

虚拟机把描述类的数据从class文件加载到内存中,并对数据进行校验,转换解析和初始化。

最终形成可以被虚拟机直接使用的java类型。这就是虚拟机的类加载机制。

类加载的时机

Java虚拟机通过装载、连接、初始化来使得一个Java类型可以被Java程序所使用,如下图所示,其中连接过程又分为验证、准备、解析三个部分。

其中部分类的解析过程可以推迟到程序真正使用其某个符号引用时再去解析。

虚拟机类加载机制

其中,加载、验证、准备、初始化和卸载这五个阶段的顺序是确定的,类的加载过程必须按照这种顺序按部就班的“开始”(仅仅指的是开始,而非执行或者结束,因为这些阶段通常都是互相交叉的混合进行,通常会在一个阶段执行的过程中调用或者激活另一个阶段),而解析阶段则不一定(它在某些情况下可以在初始化阶段之后再开始,这是为了支持Java语言的运行时绑定。

类初始化的时机

什么情况下需要开始类加载过程的第一个阶段:”加载”。

虚拟机规范中并没强行约束,这点可以交给虚拟机的的具体实现自由把握,但是对于初始化阶段虚拟机规范是严格规定了如下几种情况,如果类未初始化会对类进行初始化。

  1. 创建类的实例

  2. 访问类的静态变量(除常量【被final修辞的静态变量】原因:常量一种特殊的变量,因为编译器把他们当作值(value)而不是域(field)来对待。如果你的代码中用到了常变量(constant variable),编译器并不会生成字节码来从对象中载入域的值,而是直接把这个值插入到字节码中。这是一种很有用的优化,但是如果你需要改变final域的值那么每一块用到那个域的代码都需要重新编译。

  3. 访问类的静态方法

  4. 反射如(Class.forName(“my.xyz.Test”))

  5. 当初始化一个类时,发现其父类还未初始化,则先出发父类的初始化

  6. 虚拟机启动时,定义了 main() 方法的那个类先初始化

以上情况称为称对一个类进行主动引用,除此种情况之外,均不会触发类的初始化,称为被动引用

接口的加载过程与类的加载过程稍有不同。接口中不能使用 static{} 块。

当一个接口在初始化时,并不要求其父接口全部都完成了初始化,只有真正在使用到父接口时(例如引用接口中定义的常量)才会初始化。

被动引用

场景

  1. 子类调用父类的静态变量,子类不会被初始化。只有父类被初始化。对于静态字段,只有直接定义这个字段的类才会被初始化.

  2. 通过数组定义来引用类,不会触发类的初始化

  3. 访问类的常量,不会初始化类

例子

  • SuperClass.java
public class SuperClass {

    static {
        System.out.println("superclass init");
    }

    public static int value = 123;
}
  • SubClass.java
public class SubClass extends SuperClass {
    static {
        System.out.println("subclass init");
    }

    public static final String HELLO_CLASS = "hello class";
}
  • 测试
public static void main(String[] args) {
    // 被动应用 1
    System.out.println(SubClass.value);
    // 被动引用 2
    SubClass[] subClasses = new SubClass[10];
    // 被动引用 3
    System.out.println(SubClass.HELLO_CLASS);
}
  • 日志
superclass init
123
hello class

类加载的过程

1.加载

“加载”(Loading)阶段是“类加载”(Class Loading)过程的第一个阶段,在此阶段,虚拟机需要完成以下三件事情:

1、通过一个类的全限定名来获取定义此类的二进制字节流。

2、将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构。

3、在Java堆中生成一个代表这个类的 java.lang.Class 对象,作为方法区这些数据的访问入口。

加载阶段即可以使用系统提供的类加载器在完成,也可以由用户自定义的类加载器来完成。

加载阶段与连接阶段的部分内容(如一部分字节码文件格式验证动作)是交叉进行的,加载阶段尚未完成,连接阶段可能已经开始。

2.验证

验证是连接阶段的第一步,这一阶段的目的是为了确保Class文件的字节流中包含的信息符合当前虚拟机的要求,并且不会危害虚拟机自身的安全。

Java语言本身是相对安全的语言,使用Java编码是无法做到如访问数组边界以外的数据、将一个对象转型为它并未实现的类型等,如果这样做了,编译器将拒绝编译。

但是,Class文件并不一定是由Java源码编译而来,可以使用任何途径,包括用十六进制编辑器(如UltraEdit)直接编写。

如果直接编写了有害的“代码”(字节流),而虚拟机在加载该Class时不进行检查的话,就有可能危害到虚拟机或程序的安全。

不同的虚拟机,对类验证的实现可能有所不同,但大致都会完成下面四个阶段的验证:文件格式验证、元数据验证、字节码验证和符号引用验证。

1、文件格式验证,是要验证字节流是否符合Class文件格式的规范,并且能被当前版本的虚拟机处理。

如验证魔数是否0xCAFEBABE;主、次版本号是否正在当前虚拟机处理范围之内;常量池的常量中是否有不被支持的常量类型……该验证阶段的主要目的是保证输入的字节流能正确地解析并存储于方法区中,经过这个阶段的验证后,字节流才会进入内存的方法区中存储,所以后面的三个验证阶段都是基于方法区的存储结构进行的。

2、元数据验证,是对字节码描述的信息进行语义分析,以保证其描述的信息符合Java语言规范的要求。

可能包括的验证如:这个类是否有父类;这个类的父类是否继承了不允许被继承的类;如果这个类不是抽象类,是否实现了其父类或接口中要求实现的所有方法。

3、字节码验证,主要工作是进行数据流和控制流分析,保证被校验类的方法在运行时不会做出危害虚拟机安全的行为。

如果一个类方法体的字节码没有通过字节码验证,那肯定是有问题的;但如果一个方法体通过了字节码验证,也不能说明其一定就是安全的。

4、符号引用验证,发生在虚拟机将符号引用转化为直接引用的时候,这个转化动作将在“解析阶段”中发生。

验证符号引用中通过字符串描述的权限定名是否能找到对应的类;在指定类中是否存在符合方法字段的描述符及简单名称所描述的方法和字段;符号引用中的类、字段和方法的访问性(private、protected、public、default)是否可被当前类访问

验证阶段对于虚拟机的类加载机制来说,不一定是必要的阶段。

如果所运行的全部代码确认是安全的,可以使用 -Xverify:none 参数来关闭大部分的类验证措施,以缩短虚拟机类加载时间。

3.准备

准备阶段是为类的静态变量分配内存并将其初始化为默认值,这些内存都将在方法区中进行分配。

准备阶段不分配类中的实例变量的内存,实例变量将会在对象实例化时随着对象一起分配在 Java 堆中。

// 在准备阶段 value 初始值为0,在初始化阶段才会变为123
public static int value=123;

4.解析

解析阶段是虚拟机将常量池内的符号引用替换为直接引用的过程。

  • 符号引用(Symbolic Reference)

符号引用以一组符号来描述所引用的目标,符号可以是任何形式的字面量,只要使用时能无歧义地定位到目标即可。

符号引用与虚拟机实现的内存布局无关,引用的目标并不一定已经加载到内存中。

  • 直接引用(Direct Reference)

直接引用可以是直接指向目标的指针、相对偏移量或是一个能间接定位到目标的句柄。

直接引用是与虚拟机实现的内存布局相关的,如果有了直接引用,那么引用的目标必定已经在内存中存在。

5.初始化

类初始化是类加载过程的最后一步,前面的类加载过程,除了在加载阶段用户应用程序可以通过自定义类加载器参与之外,其余动作完全由虚拟机主导和控制。

到了初始化阶段,才真正开始执行类中定义的Java程序代码。

初始化阶段是执行类构造器 <clinit>() 方法的过程。

<clinit>() 方法是由编译器自动收集类中的所有类变量的赋值动作和静态语句块( static{} 块)中的语句合并产生的。

  • 注意

<clinit>() 方法与类的构造函数不同,前者不需要显式的调用父类的 <clinit>() 方法, Java虚拟机保证会在调用子类的 <clinit>() 方法之前先执行父类的 <clinit>() 方法,也就意味着父类中定义的静态语句块先于子类的变量赋值操作。

拓展阅读

类加载器

参考资料

《深入理解 jvm》

  • 虚拟机类加载机制

从一道面试题来认识java类加载时机与过程

https://www.jianshu.com/p/6e7c8df9d9c3

http://chenzhou123520.iteye.com/blog/1597597