当前位置: 首页 > news >正文

CPU飙升100%怎么办?字节跳动面试官告诉你答案!

小北说在前面

CPU占用率突然飙升是技术人员常遇到的一个棘手问题,它是一个与具体技术无关的普遍挑战。

这个问题可以很简单,也可以相当复杂。

有时候,只是一个死循环在作祟。
有时候,是死锁导致的。
有时候,代码中有不必要的同步块。
有时候,是大量计算密集型任务在运行。
有时候,是线程数过多引起的。
有时候,是频繁的上下文切换。
有时候,是内存不足的问题。
有时候,是频繁的垃圾回收。
有时候,是内存泄漏导致的。
等等。

导致CPU占用率飙升的问题多种多样,不同系统中的不同场景,其原因可能各不相同。

在这里,小北将对这些问题进行系统化、体系化的梳理,帮助大家在实际工作和面试过程中能够清晰、有条理地分析和解决CPU占用率过高的问题

插播一条:真的免费,如果你近期准备面试跳槽,建议在cxykk.com在线刷题,涵盖 1万+ 道 Java 面试题,几乎覆盖了所有主流技术面试题、简历模板、算法刷题。

一、cpu占用很高的3大类型,9大场景

1.1业务类问题

1.1.1 死循环

死循环是指程序在特定条件下进入了一个无限循环,无法跳出,导致CPU资源被完全占用。

例如:我们有一段代码用来检查文件的更新状态,但由于逻辑错误,条件永远无法满足,结果程序进入了死循环。

while (true) {if (file.isUpdated()) {break;}
}
1.1.2 死锁

死锁是指两个或多个线程互相等待对方释放资源,导致所有线程都无法继续执行,CPU资源被消耗殆尽。


发生死锁后,就会存在忙等待或自旋锁等编程问题,从而导致 繁忙等待问题,从而导致 CPU 100%

1.1.3 不必要的代码块

一些冗余、不必要的代码块在运行时占用了大量的CPU资源。

例如,不需要的地方使用synchronized块。

public synchronized void unnecessarySync() {// 执行一些不需要同步的操作
}

在不需要的地方使用synchronized块,会导致线程竞争和上下文切换

1.2、并发类问题

1.2.1 大量计算密集型的任务

大量计算密集型任务在同一时间运行,会导致CPU资源被完全占用。

例如:在数据分析或科学计算中,多个计算密集型任务同时运行

1.2.2 大量并发线程

统中存在大量并发线程,线程切换频繁,导致CPU资源被大量消耗在上下文切换上

例如:Web服务器同时处理大量请求,每个请求都创建一个新线程

解决方案:使用线程池来限制并发线程数量

1.2.3 大量的上下文切换

当系统中存在大量线程时,CPU在不同线程间频繁切换,导致性能下降

例如:一个程序中开启了数百个线程,每个线程都在不断进行I/O操作

for (int i = 0; i < 1000; i++) {new Thread(new IOHandler()).start();
}

线程是很宝贵的资源,开启线程一定要合理的控制线程数量

3、内存类问题

1.3.1 内存不足

当系统内存不足时,就会将磁盘存储作为虚拟内存使用,而虚拟内存的运行速度要慢得多。

例如:直接一次性加载一个非常大的文件到内存中,导致内存不足

byte[] largeData = Files.readAllBytes(Paths.get("largeFile.txt"));

这种过度的分页和交换会导致 CPU 占用率居高不下,因为处理器需要花费更多时间来管理内存访问,而不是高效地执行进程。

解决方案:优化内存使用,采用流式处理避免一次性加载大文件

try (BufferedReader reader = Files.newBufferedReader(Paths.get("largeFile.txt"))) {String line;while ((line = reader.readLine()) != null) {// 处理每一行数据}
}
1.3.2 频繁GC

频繁的垃圾回收(GC)操作会占用大量CPU资源,导致性能下降。

例如:程序中频繁创建和销毁对象,导致GC频繁触发

for (int i = 0; i < 1000000; i++) {String temp = new String("temp" + i);
}

解决方案:优化对象创建和销毁,减少临时对象的生成。

1.3.4 内存泄漏

内存泄漏导致可用内存逐渐减少,最终触发频繁的GC操作,占用大量CPU资源

例如:某个数据结构中不断添加对象,却从未删除,导致内存泄漏

List<Object> list = new ArrayList<>();
while (true) {list.add(new Object());
}

解决方案:定期清理不再使用的对象,使用合适的数据结构

插播一条:真的免费,如果你近期准备面试跳槽,建议在cxykk.com在线刷题,涵盖 1万+ 道 Java 面试题,几乎覆盖了所有主流技术面试题、简历模板、算法刷题。

这么多会导致CPU飙升100%的原因,那么该如何解决呢?
有没有一个标准的套路,可以帮助我快速定位呢?

答案是;当然有

二、CPU 飙升100%的解决思路和方法论

2.1 使用jstack 解决CPU 100%问题


使用jstack 解决 CPU 100%问题,在方法论上要用到的两个核心命令

  • top 命令查看TOP N线程,
  • jstack命令查看堆栈信息
2.1.1 确定Java进程ID

首先,需要找到CPU占用高的Java进程的PID(进程ID)。可以使用 top 或 ps 命令来找到该进程。

top -H -p <PID>
2.1.2 找到占用CPU高的线程ID

在 top 的输出中,按 P 键可以按CPU使用率排序,找到使用CPU最多的线程。
记下这些线程的ID(nid),这些ID是十进制的。

2.1.3 将线程ID转换为十六进制

jstack 输出的线程ID是十六进制的,因此需要将找到的高CPU使用率的线程ID转换为十六进制。可以使用 printf 命令:

printf "%x\n" <thread_id>
2.1.3 使用 jstack 生成线程快照

使用 jstack 命令生成Java进程的线程快照:

jstack -l <PID> > thread_dump.txt
2.1.4 分析线程快照

在生成的 thread_dump.txt 文件中,查找转换后的十六进制线程ID。可以使用 grep 命令:

grep "0x<hex_thread_id>" thread_dump.txt -A 20

这将显示包含该线程ID的线程栈信息。分析这些线程栈,找到可能导致CPU高占用的代码

2.2 使用阿里开源Arthas性能监控工具

Arthas 是一款强大的 Java 诊断工具,能够帮助开发人员快速定位和解决 CPU 100% 的问题

使用arthas解决CPU 100%问题,在方法论上要用到两个核心命令:

  • dashboard 命令查看TOP N线程,
  • thread 命令查看堆栈信息
2.2.1. 安装和启动 Arthas

安装 Arthas
通过 curl 命令下载并安装 Arthas:

curl -O https://arthas.aliyun.com/arthas-boot.jar

注意:在生产环境中,我们一般是选择其中一台机器开启Arthas监控,因为使用 Arthas 对系统性能会有一定影响

2.2.2 启动 Arthas

启动目标 Java 应用程序,然后在终端中运行:

java -jar arthas-boot.jar

Arthas 会显示当前运行的 Java 进程列表,选择要诊断的 Java 进程:例如输入1显示如下

2.2.3 使用 dashboard 命令查看系统概况

连接到目标进程后,使用 dashboard 命令查看系统的整体性能概况,包括 CPU 使用情况

dashboard

2.2.4 使用 thread 命令定位高 CPU 线程

查看线程列表
使用 thread 命令查看所有线程的信息,并找出 CPU 使用率高的线程

thread -n 3

这个命令会显示 CPU 使用率最高的 3 个线程,输出中会包含每个线程的 ID 和名称

2.2.5 查看具体线程的堆栈信息

假设你发现线程 ID 为 8 的线程 CPU 使用率很高,可以进一步查看该线程的堆栈信息:

thread 8

该命令会显示线程 8 的详细堆栈信息,帮助你定位到具体的代码位置

插播一条:真的免费,如果你近期准备面试跳槽,建议在cxykk.com在线刷题,涵盖 1万+ 道 Java 面试题,几乎覆盖了所有主流技术面试题、简历模板、算法刷题。

三、总结

工具的选择建议使用arthas,它还有很多的功能在实际中很有用

感兴趣的同学可以自行前往官网学习了解:https://arthas.aliyun.com/doc/

需要注意的是:大家在面试的时候如果遇到cpu被打满该如何排查这样的问题,千万不要上来就回答使用arthas来定位问题。

在生产环境中出现问题时,我们第一时间要做的是解决问题,所以回答要符合实际场景,不然面试官一听,就知道你是背的八股文。

那么该如何回答呢?

生产中如果出现 CPU 飙升100% 的情况

  1. 先确定前一天或者最近是否有新版本发布或者依赖域的服务有新版本发布,有的话第一时间回滚。
  2. 如果最近或很长一段时间都没有新版本发布,那就先申请紧急扩容,增加机器

最后才是通过文本的这一套套路排查具体的原因分析和解决方案

最后说一句(求关注,求赞,别白嫖我)

最近无意间获得一份阿里大佬写的刷题笔记,一下子打通了我的任督二脉,进大厂原来没那么难。
这是大佬写的, 7701页的BAT大佬写的刷题笔记,让我offer拿到手软

本文,已收录于,我的技术网站 cxykk.com:程序员编程资料站,有大厂完整面经,工作技术,架构师成长之路,等经验分享

求一键三连:点赞、分享、收藏

点赞对我真的非常重要!在线求赞,加个关注我会非常感激!

真的免费,如果你近期准备面试跳槽,建议在cxykk.com在线刷题,涵盖 1万+ 道 Java 面试题,几乎覆盖了所有主流技术面试题、简历模板、算法刷题

相关文章:

  • LeetCode26. 删除有序数组中的重复项题解
  • 【Linux】基础IO_3
  • 【C++11】initializer_list详解!
  • NSSCTF-Web题目14
  • 前端 JS 经典:通用性函数封装思路
  • 常见的创建型设计模式( 一 )
  • 数据结构之探索“队列”的奥秘
  • vue elementui table给表格中满足条件的每一条记录添加计时器
  • 低代码平台框架:开源选型、实践与应用深度解析
  • C++拷贝构造函数、运算符重载函数、赋值运算符重载函数、前置++和后置++重载等的介绍
  • ThreadLocal的原理
  • 深入浅出简单工厂模式及其在 Spring 框架中的应用
  • 【专业英语 复习】第9章 Privacy, Security,and Ethics
  • 【Flask】学习
  • 丰臣秀吉-读书笔记六
  • CSS相对定位
  • Docker入门(二) - Dockerfile
  • IP路由与转发
  • JavaScript 无符号位移运算符 三个大于号 的使用方法
  • Kibana配置logstash,报表一体化
  • mysql 5.6 原生Online DDL解析
  • mysql innodb 索引使用指南
  • Redis字符串类型内部编码剖析
  • RxJS 实现摩斯密码(Morse) 【内附脑图】
  • Swift 中的尾递归和蹦床
  • zookeeper系列(七)实战分布式命名服务
  • 从0到1:PostCSS 插件开发最佳实践
  • 大型网站性能监测、分析与优化常见问题QA
  • 基于Volley网络库实现加载多种网络图片(包括GIF动态图片、圆形图片、普通图片)...
  • 精益 React 学习指南 (Lean React)- 1.5 React 与 DOM
  • 开年巨制!千人千面回放技术让你“看到”Flutter用户侧问题
  • 怎么把视频里的音乐提取出来
  • ​ssh免密码登录设置及问题总结
  • ​zookeeper集群配置与启动
  • #微信小程序:微信小程序常见的配置传值
  • $con= MySQL有关填空题_2015年计算机二级考试《MySQL》提高练习题(10)
  • ()、[]、{}、(())、[[]]命令替换
  • (06)金属布线——为半导体注入生命的连接
  • (1)STL算法之遍历容器
  • (C语言)fgets与fputs函数详解
  • (ZT)一个美国文科博士的YardLife
  • (附源码)计算机毕业设计ssm基于B_S的汽车售后服务管理系统
  • (区间dp) (经典例题) 石子合并
  • (十六)Flask之蓝图
  • (十一)JAVA springboot ssm b2b2c多用户商城系统源码:服务网关Zuul高级篇
  • (十一)手动添加用户和文件的特殊权限
  • (学习总结16)C++模版2
  • (一)Spring Cloud 直击微服务作用、架构应用、hystrix降级
  • (转)Sublime Text3配置Lua运行环境
  • ./mysql.server: 没有那个文件或目录_Linux下安装MySQL出现“ls: /var/lib/mysql/*.pid: 没有那个文件或目录”...
  • .dwp和.webpart的区别
  • .Net Core 微服务之Consul(三)-KV存储分布式锁
  • .NET Standard、.NET Framework 、.NET Core三者的关系与区别?
  • .NET/C#⾯试题汇总系列:⾯向对象
  • .NetCore发布到IIS