JVM之【GC-可达性分析算法】
在Java虚拟机(JVM)中,可达性分析算法(Reachability Analysis)用于垃圾收集,以确定哪些对象是“可达”的,即哪些对象仍然有用,哪些对象可以被回收。下面是对可达性分析算法及其底层实现的详细描述。
可达性分析算法概述
可达性分析算法通过从一组称为"根对象"(GC Roots)的对象开始,遍历对象引用图,确定哪些对象是可达的。那些无法从根对象访问到的对象被视为不可达的,可以被垃圾收集器回收。
根对象(GC Roots)
在JVM中,根对象包括以下几类:
- 虚拟机栈中的引用:包括各个线程的栈帧中的本地变量表中引用的对象。
- 方法区中的类静态属性引用的对象:即静态字段引用的对象。
- 方法区中的常量引用的对象:如字符串常量池中的引用。
- 本地方法栈中的引用:即JNI(Java Native Interface)引用的对象。
- 所有被同步锁synchronized持有的对象
所以!GC Roots是很多很多个的,而不要看到Roots就认为只有一个
可达性分析过程
可达性分析的过程可以概括为以下几个步骤:
- 标记阶段:
- 从GC Roots开始,将所有可达对象标记为活跃。
- 使用一种图遍历算法(如深度优先搜索DFS或广度优先搜索BFS)遍历对象引用图,找到所有可达对象。
- 清除阶段:
- 在标记阶段之后,所有未被标记的对象被视为不可达,可以被垃圾收集器回收。
- 如果要使用可达性分析算法来判断内存是否可回收,那么分析工作必须在一个能保障一致性的快照中进行。否则分析结果的准确性就无法保证
- 这也是导致GC时必须“Stop the World” 的一个重要原因!!
底层实现
-
对象引用图:
- JVM内部使用一种称为“对象图”的数据结构来表示对象及其相互引用关系。对象图中的每个节点表示一个对象,每条边表示一个对象对另一个对象的引用。
-
标记-清除算法(Mark-Sweep Algorithm):
- 标记阶段:Collector从GC Roots开始,遍历对象图,对所有访问到的对象进行标记。标记通常通过在对象头部设置标志位来实现。
- 清除阶段:Collector遍历堆中的所有对象,回收那些未被标记的对象。
- 缺点:
- 效率不高
- GC的时候需要stop整个应用程序
- 清理出来的内存不连续,即不会整合内存,而是复用垃圾对象的内存。会存在大量内存碎片
-
并发标记-清除算法:
- 在现代JVM中,为了减少垃圾收集带来的暂停时间(stop-the-world),通常会采用并发标记-清除算法。这些算法允许应用线程和垃圾收集线程同时工作。
- 三色标记法:是并发标记的一种实现方式,通过将对象标记为白色、灰色和黑色来实现。
- 白色:尚未访问的对象。
- 灰色:已访问但未处理完引用的对象。
- 黑色:已访问且引用已处理完的对象。
- 并发标记阶段:
- 初始标记:标记从根对象直接可达的对象,通常会短暂暂停所有应用线程。
- 并发标记:与应用线程并发运行,标记所有可达对象。
- 最终标记:处理并发标记期间产生的引用变化,通常会有短暂停顿。
- 清除阶段:回收未被标记的对象。
-
分代垃圾回收:
- JVM通常采用分代垃圾回收策略,将堆分为年轻代和老年代。不同代使用不同的回收算法以优化性能。
- 年轻代使用复制算法(复制存活对象到新的区域,回收旧区域的所有对象)。
- 老年代使用标记-清除或标记-整理算法(将存活对象压缩到一侧,回收剩余空间)。
根对象和其他对象的连接
-
引用链:
- 根对象通过引用链(Reference Chain)连接到其他对象。每个对象都有字段指向其他对象,这些字段形成了对象图中的边。
- 在标记阶段,算法通过引用链从根对象递归或迭代地访问其他对象。
-
栈和静态变量的引用:
- 虚拟机栈中的本地变量表和方法区中的静态变量表保存着对对象的直接引用。这些引用成为可达性分析的起点。
通过以上步骤和机制,JVM能够有效地识别和回收不可达的对象,从而管理堆内存并保证应用程序的正常运行和性能。