我们知道大多数的垃圾收集器在在收集垃圾的时候会停顿所有的线程(Stop The World)来进行可达性分析,那么如何快速找到GC Roots?线程应该在什么地方停止呢?
一、快速找到GC ROOTS:OopMap
当所有线程停下来的时候,并不需要一个不漏的检查完所有执行上下文和全局引用位置,虚拟机应该是有办法直接知道哪些地方存放着对象引用。在HotSpot的实现中,是使用一组称为OopMap的数据结构来达到目的的。
OopMap存储两种对象引用:
1、对象内的引用
在类加载完的时候,HotSpot就把对象内什么偏移量上是什么类型的数据计算出来。
2、栈、寄存器中引用
在JIT编辑过程中,也会在特定的位置记录下栈和寄存器中哪些位置是引用。这样,GC在扫描的时候就知道这些信息了。
通过OopMap垃圾收集器就可以更快的找到GC Roots,并且更快的完成GC Roots的枚举,大概展示如下图:
二、线程中断点:安全点(Safe Point)
1、定义
安全点就是程序能够停顿的位置。即程序不是在任何时候停顿下来进行GC,只有到了安全点才去更新OopMap和停顿,等待GC完成在继续执行。
2、分析
有了OopMap,HotSpot就能很快的完成GC Roots的枚举了。但是问题来了,每一行代码都有可能使引用变化,就需要更新OopMap,在哪个位置去更新OopMap呢?如果每一行都执行一次更新,肯定是不科学的,所以就有了安全点(safe point)。
安全点设置太多肯定不行,造成运行压力,太少的话两个点之间太长,如果刚过第一个安全点然后要求GC,但是程序要运行到下一个安全点才能停下来,那么GC等待的时间就太长了。
3、安全点选择标准
是否就有让程序长时间执行的特征。一条指令执行时间都很短,而一段程序一般不会说因为很长的指令流而造成长时间的运行,所以一般都是在指令复用的地方出现。比如:方法调用、循环跳转、异常跳转。
三、让线程停下来的两种方法
1、抢断式中断
在GC发生时,中断直接所有线程,发现没有在安全点的,再恢复线程让他跑到安全点。现在几乎没有虚拟机采用这种方式。
2、主动式中断
当GC需要中断线程时,设置一个标志,各个线程去轮询这个标志,发现需要中断,线程就自己中断。轮询点和安全点在一个地方,在加上创建对象需要分配内存的地方。
实现方式:
设置一个内存不可读,当线程访问这个内存就会产生一个自陷异常信号,预先注册的异常处理器中捕获这个异常暂停线程。通过一个指令和一个异常处理器就实现了这个功能。
四、休眠线程如何中断:安全区域(Safe Region)
1、安全点不能解决的问题
安全点解决了正在执行的线程中断问题,我们知道线程还有没执行的状态,比如线程是Sleep、Blocked状态。这些线程不能自己走到安全点。如果休眠的线程在GC途中醒来,在线程运行到安全点之前就会有可能修改对象的引用关系。所以我们需要在线程醒来的时候如果正在GC那么也中断。
2、安全区域
安全区域就是在一段代码中引用关系不会发生变化。所以在这个区域内任何地方GC都是安全的。在执行到安全区的时线程会标识自己处于安全区中,当离开安全区时,就需要检查系统是否已经完成枚举GC Roots(或者整个GC过程),如果已经完成那么线程继续执行,否则就等待。
3、安全区域举例
线程的Sleep、Blocked(这个区域内当前线程肯定不会改变对象引用)就被包含在安全区中,也就是说只要线程Sleep那么他就处于安全区,一旦Sleep时间到线程继续执行,首先就要判断是否能够离开安全区。
五、GC基础全面总结
最近三篇学习了:可达性分析、标记-清除算法、标记-复制算法、标记-整理算法,再加上今天的OopMap、安全区域、安全点,就基本上把垃圾回收的基础理论分析完成。
可以猜测GC大概流程:线程运行时设置OopMap,当需要GC时,所以执行中的线程跑到安全点然后中断,不在执行中的线程处在安全安全区域。此时遍历OopMap(相当于GC Roots)根据可达性分析,标记出存活对象(或者需回收对象),然后根据区域和具体实现进行清除算法、复制算法、整理算法。GC完成线程继续执行,如果在GC过程中从Sleep醒来的线程也可以继续执行。
大意如下图:
学习心得:
1、虚拟机中实现所有线程到达安全点自动中断功能只用了一个标志位和一个异常处理器。为我们有时候遇到一些全局功能时提供了一种解决思路。
2、既然正在休眠类的线程不能走到安全点,那就把线程休眠的周围设置成一块区域,离开区域的时候先问问能不能离开。
Java程序员日常学习笔记,如理解有误欢迎各位交流讨论!