背景
线上服务频繁Full GC,每次full gc就会有接口超时问题,引起系统告警,曲线图大概如下
老年代内存回收锯齿状。
原因分析
oldgen频繁full gc,先想到的是因为oldgen区域过小吗,调整大以后发现问题依旧没有解决。
我想到的第二个原因:Eden区过小,因为小Eden区域yong gc就会很频繁,这还不是引起Full gc的原因,熟悉gc算法的知道,Young GC 采用的是复制算法,会伴随这对象年龄晋升,如果遇到大对象,或者Eden区过小,就会导致直接把大对象抛到old区,old区一满,就会触发full gc,但是每次full gc完成,old又回到了x轴最低处,因为Eden区过小,old很快又塞满,所以我们看到gc的曲线是锯齿状。
是因为本来old区域的对象就这么多吗?显然不是,因为full gc过后,内存明显变大,显然old里面的对象都是垃圾,是从Eden区过来的。
解决办法
扩大Eden区,调整-Xmn的值,缩小oldgen区域,因为old用不了那么多,大概就是常驻对象的三倍左右,比如,我的工程每次full gc 后,old常驻对象就是400m,那old给1.2G大小,剩下全给Eden。
源码
uint ageTable::compute_tenuring_threshold(size_t survivor_capacity) {
//TargetSurvivorRatio默认50,意思是:在回收之后希望survivor区的占用率达到这个比例
size_t desired_survivor_size = (size_t)((((double) survivor_capacity)*TargetSurvivorRatio)/100);
size_t total = 0;
uint age = 1;
assert(sizes[0] == 0, "no objects with age zero should be recorded");
while (age < table_size) {//table_size=16
total += sizes[age];
//如果加上这个年龄的所有对象的大小之后,占用量>期望的大小,就设置age为新的晋升阈值
if (total > desired_survivor_size) break;
age++;
}
uint result = age < MaxTenuringThreshold ? age : MaxTenuringThreshold;
if (PrintTenuringDistribution || UsePerfData) {
//打印期望的survivor的大小以及新计算出来的阈值,和设置的最大阈值
if (PrintTenuringDistribution) {
gclog_or_tty->cr();
gclog_or_tty->print_cr("Desired survivor size " SIZE_FORMAT " bytes, new threshold %u (max %u)",
desired_survivor_size*oopSize, result, (int) MaxTenuringThreshold);
}
total = 0;
age = 1;
while (age < table_size) {
total += sizes[age];
if (sizes[age] > 0) {
if (PrintTenuringDistribution) {
gclog_or_tty->print_cr("- age %3u: " SIZE_FORMAT_W(10) " bytes, " SIZE_FORMAT_W(10) " total",
age, sizes[age]*oopSize, total*oopSize);
}
}
if (UsePerfData) {
_perf_sizes[age]->set_value(sizes[age]*oopSize);
}
age++;
}
if (UsePerfData) {
SharedHeap* sh = SharedHeap::heap();
CollectorPolicy* policy = sh->collector_policy();
GCPolicyCounters* gc_counters = policy->counters();
gc_counters->tenuring_threshold()->set_value(result);
gc_counters->desired_survivor_size()->set_value(
desired_survivor_size*oopSize);
}
}
return result;
}
可以看到 Hotspot 遍历所有对象时,从所有年龄为 0 的对象占用的空间开始累加,如果加上年龄等于 n 的所有对象的空间之后,使用 Survivor 区的条件值(TargetSurvivorRatio / 100,TargetSurvivorRatio 默认值为 50)进行判断,若大于这个值则结束循环,将 n 和 MaxTenuringThreshold 比较,若 n 小,则阈值为 n,若 n 大,则只能去设置最大阈值为 MaxTenuringThreshold。