Java应用CPU过高的排查全流程

 更新时间:2026年06月03日 09:30:55   作者:码不停蹄的玄黓  
Java CPU 飙高90% 都是业务代码死循环、频繁GC、密集计算、死锁/自旋导致的,排查有标准、固定、可落地的流程,不需要猜,下面给你一套从登录服务器到定位代码行的完整实战步骤,需要的朋友可以参考下

引言

Java CPU 飙高90% 都是业务代码死循环、频繁GC、密集计算、死锁/自旋导致的,排查有标准、固定、可落地的流程,不需要猜。

下面给你一套从登录服务器到定位代码行的完整实战步骤,直接照着做就能定位问题。

一、快速定位:哪个进程占用 CPU 最高

1. 查看系统整体 CPU 占用

top

找到 CPU 使用率最高的 Java 进程 PID(第一列)。

二、精准定位:这个进程里哪个线程在耗 CPU

2. 查看该 Java 进程内的线程排行

top -H -p <PID>

会列出该 Java 进程内部所有线程,找到CPU 最高的线程 TID

3. 把线程 TID 转成 16 进制(JVM 栈用 16 进制标识线程)

printf "%x\n" <TID>

得到一个16 进制线程 ID(记下来,后面要用)。

三、抓取线程栈:找到耗 CPU 的代码

4. 导出 Java 线程栈

jstack <PID> > stack.log

5. 在栈文件里搜索刚才的 16 进制线程 ID

grep -A 20 <16进制TID> stack.log

-A 20 表示显示后 20 行,直接就能看到:

  • 线程名称
  • 线程状态
  • 具体耗 CPU 的代码类、方法、行号

四、最常见的 4 种 CPU 飙高原因(一看栈就知道)

1. 死循环 / 无限递归(最常见)

栈特征:

com.xxx.service.UserService.getUserList(UserService.java:88)

代码一直卡在同一行,没有阻塞,一直在跑。

2. 频繁 Full GC / Young GC

栈特征:

VM Thread
GC task thread

排查命令:

jstat -gc <PID> 1000 10

如果 FGC(FullGC次数)每秒涨好几次,就是内存泄漏/GC 导致 CPU 高。

3. 大量锁自旋 / CAS 空循环

栈特征:

sun.misc.Unsafe.park
java.util.concurrent.locks

线程处于 RUNNABLE 但一直在自旋

4. 密集计算(加密、循环、正则、JSON 解析)

栈会停留在:

  • 加密工具类
  • 复杂 for 循环
  • 正则表达式(灾难性回溯)
  • JSON/XML 序列化

五、1 分钟快速排查脚本(直接复制用)

把下面内容保存为 check_cpu.sh,一键定位耗 CPU 代码行:

#!/bin/bash
PID=$1
jstack $PID > stack.log
TID=$(top -b -n 1 -H -p $PID | grep java | sort -nrk 9 | head -1 | awk '{print $1}')
HEX_TID=$(printf "%x\n" $TID)
echo "高耗CPU线程16进制:$HEX_TID"
grep -A 30 $HEX_TID stack.log

使用:

chmod +x check_cpu.sh
./check_cpu.sh <Java进程PID>

六、定位到代码后怎么解决?

  1. 死循环:检查循环条件、边界值、迭代逻辑
  2. 频繁GC:查内存泄漏(用 jmap 堆 dump)、调整堆大小
  3. 锁自旋:改用公平锁、减少锁竞争、异步化
  4. 密集计算:异步执行、分片、缓存结果、优化算法

七、必备工具(无需安装)

Linux + JDK 自带,生产环境直接用

  • top:看进程/线程 CPU
  • jstack:线程栈
  • jstat:GC 监控
  • jmap:堆内存 dump(定位内存泄漏)

总结

  1. top 找 Java 进程 PID
  2. top -H 找耗 CPU 线程 TID
  3. 转 16 进制
  4. jstack + grep 定位代码行
  5. 按栈特征判断是死循环/GC/锁/密集计算

整个流程不重启、不影响业务、1~3 分钟定位根因

到此这篇关于Java应用CPU过高的排查全流程的文章就介绍到这了,更多相关Java应用CPU过高排查内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • java并发编程之ThreadLocal详解

    java并发编程之ThreadLocal详解

    在锁的使用中会导致运行效率降低,ThreadLocal的使用彻底避免对共享资源的竞争,同时又可以不影响效率。本文详细讲解了ThreadLocal,需要了解的小伙伴可以看一看这篇文章
    2021-08-08
  • Java字符串中删除指定子字符串的方法简介

    Java字符串中删除指定子字符串的方法简介

    这篇文章主要介绍了Java字符串中删除指定子字符串的方法,是Java入门学习中的基础知识,需要的朋友可以参考下
    2015-11-11
  • Java中classpath的基本概念和配置方法详析

    Java中classpath的基本概念和配置方法详析

    这篇文章主要介绍了Java中的classpath概念,包括其基本概念、设置方法以及在Java应用中的作用,在IDE中的配置也进行了详细说明,并提到了一些通用注意事项,需要的朋友可以参考下
    2025-02-02
  • 详解SpringBoot中Session超时原理说明

    详解SpringBoot中Session超时原理说明

    本篇文章主要介绍了详解SpringBoot中Session超时原理说明,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2017-08-08
  • java发送http get请求的两种方式

    java发送http get请求的两种方式

    这篇文章主要为大家详细介绍了java发送http get请求的两种方式,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2017-05-05
  • Spring核心概念解析之IOC、DI与AOP使用方式

    Spring核心概念解析之IOC、DI与AOP使用方式

    本文解析Spring框架的IoC、DI与AOP三大核心,阐述其原理与协同应用,帮助开发者实现解耦、模块化和高效系统设计
    2025-09-09
  • 详解mybatis-plus的 mapper.xml 路径配置的坑

    详解mybatis-plus的 mapper.xml 路径配置的坑

    这篇文章主要介绍了详解mybatis-plus的 mapper.xml 路径配置的坑,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-08-08
  • 深入学习java ThreadLocal的源码知识

    深入学习java ThreadLocal的源码知识

    ThreadLocal是一个本地线程副本变量工具类。主要用于将私有线程和该线程存放的副本对象做一个映射,各个线程之间的变量互不干扰,特别适用于各个线程依赖不通的变量值完成操作的场景。下面我们来详细了解一下它吧
    2019-06-06
  • Java 集合中的类关于线程安全

    Java 集合中的类关于线程安全

    这篇文章主要介绍了Java 集合中的类关于线程安全的相关资料,需要的朋友可以参考下
    2017-01-01
  • java开发使用BigDecimal避坑四则

    java开发使用BigDecimal避坑四则

    这篇文章主要为大家介绍了java开发使用BigDecimal的避坑四则,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2022-07-07

最新评论