跳到主要内容

13、调优实战 - 定位 StackOverflowError

1. Java虚拟机栈和方法调用

在前面OOM的文章里面已经介绍过了Java虚拟机栈相关概念,这里再重复一下。

在jvm的内存模型中,有一块叫做java虚拟机栈的地方,每个线程都有一个自己的固定大小的虚拟机栈,也就是 栈内存;
一个线程在调用一个方法的时候,会为这个方法创建一个栈帧,这个栈帧中包含了:方法参数、实现业务逻辑的时候在方法里面定义一些局部变量、方法本身需要记录的一些操作数栈、方法出口等信息;
然后将这个栈帧放入到线程的虚拟机栈里面去。

我们也知道,有一个jvm参数是可以来设置每个线程的栈大小的:-Xss1m,一般来说默认都是设置为1M;
所以对于每个线程的虚拟机栈内存大小也是固定的。

2. 什么情况会发生 StackOverflow

既然每个线程的虚拟机栈内存大小是有限的,如果让这个线程不停地去调用多个方法,也就是说会创建多个栈帧放入这个线程的栈内存中,那是不是会填满这个线程的栈内存呢?肯定是的。

不过通常来说,即使你的线程的虚拟机栈只有128k或者256k,都是能够满足日常系统中一定深度的方法调用的。

但有一种情况就不一定了:如果你的一个方法里面没有终止条件的去递归调用当前方法;
即使是同一个方法,每次调用都会创建一个栈帧压入到栈中;如果不停的递归调用,最终肯定会填满线程的栈内存。

所以如果发生了栈溢出,往往都是代码里面写了这种递归调用的bug导致的,正常情况下很少发生。

3. 模拟 StackOverflowError

/**
 * jvm options:
 * -Xss1m -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -Xloggc:log/stack-over-flow-error.log
 * -XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=hprof/stack-over-flow-error
 */
public class StackOverflowErrorDemo {
   
     
	private static int count = 0;

	public static void main(String[] args) {
   
     
		test();
	}

	private static void test() {
   
     
		System.out.println("当前调用了 " + (++count) + "次 test 方法...");
		test();
	}
}

非常简单的一个递归调用代码,在test()方法中无限地递归调用自己;

执行结果:
 

可以看到,在调用了 6786次之后,发生了 java.lang.StackOverflowError异常;也就是说当main线程调用了 6786次test()方法,往它的栈内存里面压入了6786个test()方法的栈帧之后,把1M内存给填满了,引发了栈溢出异常。

4. StackOverflowError 的定位及解决

从上面的代码中也看到了,在连续调用了6000多次方法之后才会填满1M的栈内存;这个调用数量已经很多了,除了递归调用方法之外,是根本不可能出现连续调用几千次方法的情况的。

但是当这种情况发生的时候,又该怎么来定位和解决呢?之前介绍到的那些GC日志,内存快照这些东西,对于解决栈内存溢出还有帮助吗?

先来看看GC日志:
 

我们可以看到这个GC日志中什么信息都没有,连一次GC都没有发生过;另外,当它发生栈溢出的时候,也没有生成内存快照;所以这些东西对于解决这个问题都没有多大作用。

那怎么解决呢?其实非常简单…
直接看程序的运行日志就行了,在发生栈溢出的时候,会直接把异常写入你的日志中;并且里面也会包含发生异常的具体类和方法,然后直接去代码中定位问题就行了。