JVM 常见面试题之 GC 垃圾回收
系列目录
前言
大家好,我是老马。
GC 在面试中频率也比较高,对常见问题进行整理,便于平时查阅收藏。
JVM体系结构
一、在理解GC之前,先了解下JVM体系结构

JVM JRE JDK的关系
JVM(java虚拟机),将 .class 文件中的字节码指令进行识别并调用操作系统向上的 API 完成动作。JVM不仅可以运行java程序,只要是能编译成.class的文件都能运行。
JRE (Java 运行时环境),包含了jvm和core lib。
JDK (Java 开发工具包),它集成了jre和一些工具。比如javac.exe,java.exe,jar.exe等。大家都知道,要想执行java程序,需要安装jdk。
JVM 初识
JVM其实是一种规范,它提供可以执行Java字节码的运行时环境。
不同的供应商提供这种规范的不同实现。
常见的JVM实现有
Hotspot oracle官方提供
TaobaoVM 阿里对hotspot深底定制版
J9 ibm实现
Jrockit 号称是世界上最快的JVM
openJDK
azul zing
LiquidVm 直接针对硬件
Microsoft JVM
JVM的内存模型
虚拟机在执行文件的时候将内存分为不同的区域,它们各司其职。
程序计数器
java虚拟机栈栈
堆
方法区
本地方法栈
程序计数器/行号指示器
可以看作是当前线程所执行的字节码的行号指示器。
字节码解释器工作时就是通过改变这个计数器的值来选取下一条需要执行的字节码指令,分支、循环、跳转、异常处理、线程恢复等基础功能都需要依赖这个计数器来完成。
java虚拟机的多线程是通过线程轮流切换并分配处理器执行时间的方式来实现的,任何一个确定的时刻,一个处理器都只执行一条线程中的指令。
因此,为了线程切换后能恢复到正确的执行位置,每条线程都需要有一个独立的程序计数器,各条线程之间的计数器互不影响,独立存储。
所以这类内存区域为“线程私有”的内存。---《深入理解java虚拟机》它是一块较小的空间,也是唯一一个在java虚拟机规范中没有定义任何OOM的区域。
正在执行java方法的话,计数器记录的是虚拟机字节码指令的地址(当前指令的地址)。
如果是Natice方法,则为空。
java虚拟机栈
也为线程私有,生命周期与线程相同,它描述的是Java方法执行的内存模型。
每个方法在执行的时候都会创建一个栈,每一个方法被调用的过程就对应一个栈帧在虚拟机栈中从入栈到出栈的过程。
它存储局部变量表、操作数栈,方法出口等信息。局部变量表的大小在编辑期间完成,所以进入执行方法时,栈的大小是确定的。
如果线程请求的栈深度大于虚拟机所允许的深度,将抛出StackOverflowError 异常;
如果虚拟机栈可以动态扩展,当扩展时无法申请到足够的内存时会抛出OutOfMemoryError 异常。
更多信息可参考 Java虚拟机运行时栈帧结构
本地方法栈和java虚拟机栈类似,只不过它表示的是Native方法
堆
这是java虚拟机中最大的一块内存,是被所有线程共享的一块内存区域,在虚拟机启动的时候被创建。
几乎所有的对象实例的内存都在这里,这也是它存在目的。
Java堆还可以细分为新生代和老年代。
新生代有可以分为eden伊甸区、from servivor,to servivor。
根据虚拟机规范,Java堆可以存在物理上不连续的内存空间,就像磁盘空间只要逻辑是连续的即可。
它的内存大小可以设为固定大小,也可以扩展。当前主流的虚拟机如HotPot都能按扩展实现(通过设置 -Xmx和-Xms),如果堆中没有内存内存完成实例分配,而且堆无法扩展将报OOM错误。
方法区这也是一块共享区。存储了已被虚拟机加载的类信息、常量、静态变量、即使编辑器编辑后的代码等数据。
在老版jdk,方法区也被称为永久代「HotSpot虚拟机以永久代来实现方法区」。jdk8真正开始废弃永久代,而使用元空间(Metaspace)。
当然上面的区分是JVM规范,每个虚拟机实现可能有不同的划分。有时候,我们可以粗略的把区域分为堆区和栈区。这也是程序员最关心的2个部分。
java 内存模型,JMM(java memory model)
JMM作用
Java虚拟机规范中定义了Java内存模型(Java Memory Model,JMM),用于屏蔽掉各种硬件和操作系统的内存访问差异,以实现让Java程序在各种平台下都能达到一致的并发效果,JMM规范了Java虚拟机与计算机内存是如何协同工作的:规定了一个线程如何和何时可以看到由其他线程修改过后的共享变量的值,以及在必须时如何同步的访问共享变量。
详情参考 Java内存模型(JMM)总结
java中的引用
强引用(Strong Reference):
在代码中普遍存在的,类似”Object obj = new Object”这类引用,只要强引用还在,垃圾收集器永远不会回收掉被引用的对象
软引用(Sofe Reference):
有用但并非必须的对象,可用SoftReference类来实现软引用,在系统将要发生内存溢出异常之前,将会把这些对象列进回收范围之中进行二次回收。如果这次回收还没有足够的内存,才会抛出内存异常异常。
弱引用(Weak Reference):
被弱引用关联的对象只能生存到下一次垃圾收集发生之前,JDK提供了WeakReference类来实现弱引用。
虚引用(Phantom Reference):
也称为幽灵引用或幻影引用,是最弱的一种引用关系,JDK提供了PhantomReference类来实现虚引用。
finalize 方法什么作用
对于一个对象来说,在被判断没有 GCroots 与其相关联时,被第一次标记,然后判断该对象是否应该执行finalize方法(判断依据:如果对象的finalize方法被复写,并且没有执行过,则可以被执行)。
如果允许执行那么这个对象将会被放到一个叫F-Query的队列中,等待被执行。
(注意:由于finalize的优先级比较低,所以该对象的的finalize方法不一定被执行,即使被执行了,也不保证finalize方法一定会执行完)
什么是GC
GC可以理解为在追踪仍然使用的所有对象,并将其余对象标记为垃圾然后进行回收,这样的一个过程称之为GC,所有的GC系统可以从如下几个方面进行实现
GC判断策略(例如引用计数,对象可达)
GC收集算法(标记清除法,标记清除整理法,标记复制清除法,分代法)
GC收集器(例如Serial,Parallel,CMS,G1)
手动 GC
什么是手动 GC 呢?
即是手动为对象分配内存并回收内存
如下这是一个简单的手动内存管理C编写的示例
int send_request() {
size_t n = read_size();
int *elements = malloc(n * sizeof(int));
if(read_elements(n, elements) [Java HotSpot VM Options](http://www.oracle.com/technetwork/java/javase/tech/vmoptions-jsp-140102.html)
下面只列举其中的几个常用和容易掌握的配置选项

代码:
```java
/**
-Xms60m
-Xmx60m
-Xmn20m
-XX:NewRatio=2 ( 若 Xms = Xmx, 并且设定了 Xmn, 那么该项配置就不需要配置了 )
-XX:SurvivorRatio=8
-XX:PermSize=30m
-XX:MaxPermSize=30m
-XX:+PrintGCDetails
*/
public static void main(String[] args) {
new Test().doTest();
}
public void doTest(){
Integer M = new Integer(1024 * 1024 * 1); //单位, 兆(M)
byte[] bytes = new byte[1 * M]; //申请 1M 大小的内存空间
bytes = null; //断开引用链
System.gc(); //通知 GC 收集垃圾
System.out.println();
bytes = new byte[1 * M]; //重新申请 1M 大小的内存空间
bytes = new byte[1 * M]; //再次申请 1M 大小的内存空间
System.gc();
System.out.println();
}
按上面代码中注释的信息设定 jvm 相关的参数项,并执行程序,下面是一次执行完成控制台打印的结果:
[ GC [ PSYoungGen: 1351K -> 288K (18432K) ] 1351K -> 288K (59392K), 0.0012389 secs ] [ Times: user=0.00 sys=0.00, real=0.00 secs ]
[ Full GC (System) [ PSYoungGen: 288K -> 0K (18432K) ] [ PSOldGen: 0K -> 160K (40960K) ] 288K -> 160K (59392K) [ PSPermGen: 2942K -> 2942K (30720K) ], 0.0057649 secs ] [ Times: user=0.00 sys=0.00, real=0.01 secs ]
[ GC [ PSYoungGen: 2703K -> 1056K (18432K) ] 2863K -> 1216K(59392K), 0.0008206 secs ] [ Times: user=0.00 sys=0.00, real=0.00 secs ]
[ Full GC (System) [ PSYoungGen: 1056K -> 0K (18432K) ] [ PSOldGen: 160K -> 1184K (40960K) ] 1216K -> 1184K (59392K) [ PSPermGen: 2951K -> 2951K (30720K) ], 0.0052445 secs ] [ Times: user=0.02 sys=0.00, real=0.01 secs ]
Heap
PSYoungGen total 18432K, used 327K [0x00000000fec00000, 0x0000000100000000, 0x0000000100000000)
eden space 16384K, 2% used [0x00000000fec00000,0x00000000fec51f58,0x00000000ffc00000)
from space 2048K, 0% used [0x00000000ffe00000,0x00000000ffe00000,0x0000000100000000)
to space 2048K, 0% used [0x00000000ffc00000,0x00000000ffc00000,0x00000000ffe00000)
PSOldGen total 40960K, used 1184K [0x00000000fc400000, 0x00000000fec00000, 0x00000000fec00000)
object space 40960K, 2% used [0x00000000fc400000,0x00000000fc5281f8,0x00000000fec00000)
PSPermGen total 30720K, used 2959K [0x00000000fa600000, 0x00000000fc400000, 0x00000000fc400000)
object space 30720K, 9% used [0x00000000fa600000,0x00000000fa8e3ce0,0x00000000fc400000)
从打印结果可以看出,堆中新生代的内存空间为 18432K ( 约 18M ),eden 的内存空间为 16384K ( 约 16M),from / to survivor 的内存空间为 2048K ( 约 2M)。
这里所配置的 Xmn 为 20M,也就是指定了新生代的内存空间为 20M,可是从打印的堆信息来看,新生代怎么就只有 18M 呢? 另外的 2M 哪里去了?
别急,是这样的。新生代 = eden + from + to = 16 + 2 + 2 = 20M,可见新生代的内存空间确实是按 Xmn 参数分配得到的。
而且这里指定了 SurvivorRatio = 8,因此,eden = 8/10 的新生代空间 = 8/10 * 20 = 16M。from = to = 1/10 的新生代空间 = 1/10 * 20 = 2M。
堆信息中新生代的 total 18432K 是这样来的: eden + 1 个 survivor = 16384K + 2048K = 18432K,即约为 18M。
因为 jvm 每次只是用新生代中的 eden 和 一个 survivor,因此新生代实际的可用内存空间大小为所指定的 90%。
因此可以知道,这里新生代的内存空间指的是新生代可用的总的内存空间,而不是指整个新生代的空间大小。
另外,可以看出老年代的内存空间为 40960K ( 约 40M ),堆大小 = 新生代 + 老年代。因此在这里,老年代 = 堆大小 - 新生代 = 60 - 20 = 40M。
最后,这里还指定了 PermSize = 30m,PermGen 即永久代 ( 方法区 ),它还有一个名字,叫非堆,主要用来存储由 jvm 加载的类文件信息、常量、静态变量等
参考资料
https://www.jb51.net/article/214026.htm
https://segmentfault.com/a/1190000023017150
https://baijiahao.baidu.com/s?id=1700237878506043329&wfr=spider&for=pc
https://www.cnblogs.com/hongshaozi/p/14151742.html