跳到主要内容

02、JVM 实战 - 垃圾收集算法

一、标记-清除算法(Mark-Sweep)

这种算法分为“标记”和“清除”两个阶段:首先标记出所有需要回收的对象,在标记完成后统一回收所有被标记的对象。

Mark-Sweep 算法是最基础的收集算法,几乎所有的收集算法都是基于这种思路并对其不足进行改进而得到。它的不足之处主要有两个:

1、效率问题。标记和清除两个过程的效率都不高;

2、空间问题。标记清除之后会产生大量的内存碎片,空间碎片太多可能会导致在需要分配较大对象时,无法找到足够的连续内存而不得不提前触发另一次垃圾收集动作。

二、复制算法(Copying)

这种算法将可用内存按容量划分为大小相等的两块,每次只使用其中的一块。当这一块内存用完了,就将标记存活的对象复制到另外一块上面,然后再把已使用的半区空间一次性清理掉。

Copying 算法每次都只对半区进行回收,很好的解决了内存碎片的问题,而且实现简单,运行高效。

该算法的不足之处在于:

**1、**将内存缩小为原来的一半,代价高昂,并且需要额外空间做分配担保。

**2、**在对象存活率较高的时就要进行较多的复制操作,效率降低。

现在的商用虚拟机都采用这种收集算法来回收新生代。虚拟机将新生代内存分为一块较大的 Eden 空间和两块较小的 Survivor 空间(默认比例是 8:1:1),每次分配对象时,使用 Eden 和其中一块 Survivor 空间,当进行垃圾回收时,将 Eden 和 Survivor 标记存活的对象复制到另外一块 Survivor 空间上,然后一次清理掉 Eden 和刚才用过的 Survivor 空间。当然,我们没有办法保证每次回收都只有不多余 10% 的对象存活,当 Survivor 空间不够用时,需要依赖其他内存(这里指老年代)进行分配担保。

三、标记-整理算法(Mark-Compact)

这种算法分为“标记”和“整理”两个阶段:首先标记出所有需要回收的对象,然后让所有存活的对象都向一端移动,接着直接清理掉端边界以外的内存。

Mark-Compact 算法在解决内存碎片的同时,避免 Copying 算法的空间浪费和效率问题。

四、分代收集算法(Generational Collection)

这种算法根据对象存活周期的不同将内存划分为几块,一般把 Java 堆分为新生代和老生代。

在新生代,每次垃圾收集时都发现有大批对象死去,只有少量存活,那就选用 Copying 算法,只要付出少量存活对象的复制成本就可以完成收集。

在老生代,对象存活率高,没有额外空间对它进行担保,就必须使用 Mark-Sweep 或者 Mark-Compact 算法。