不懂CPU性能分析？这份性能分析指南请收好，全面解析CPU性能分析技巧

更新时间：2023-11-25 00:42:30作者：cblsl

本文涉及案例来自于学习极客时间专栏《Linux性能优化实战》精心整理而来，案例分析不到位的请各位多多指正

在前面的几篇案例分析文章中，我们通过多个案例、从不同角度、使用不同的性能工具分析了CPU性能问题，今天我们就来总结下，怎么能又快又准的定位到问题。要回答好这个问题，我们就需要明白影响CPU的指标有哪些？又有哪些工具可以获取到指标数据，这些数据的合理值是什么？让我们一起把这几个问题搞明白。

CPU性能指标

1.CPU使用率：

用户CPU (us): 用户态运行的时间百分比，使用率越高。说明有应用程序比较繁忙系统CPU (sy): 内核态运行的时间百分比，使用率越高。说明内核越繁忙等待CPU (wa): 通常也称为 iowait，表示等待 I/O 的时间百分比，使用率高，说明系统与硬件设备的I/O交互时间比较长软中断CPU (si): 处理软中断时间百分比，大量的中断也会导致CPU的使用率升高。比如前面分析的大量的小网络包导致频繁的硬中断和软中断，想要了解的，可以回看上篇Linux系统下CPU性能问题分析案例（下）硬中断CPU (hi): 处理硬中断时间百分比。硬中断是硬件触发，执行速度很快，使用率高的话，大部分是硬件故障导致空闲CPU (id): 代表空闲时间百分比。越高反而说明压力越小低优先级 (ni): 低优先级用户态CPU时间百分比，nice可取值范围是-20到19，数值越大，优先级反而越低，默认值是0。steal (st): 代表当系统运行在虚拟机中的时候，虚拟机占用的CPU时间guest: 代表通过虚拟化运行其他操作系统的时间，也就是运行虚拟机的CPU时间

2.上下文切换

上下文切换分为进程上下文切换、线程上下文切换。线程上下文切换的代价是远远高于线程上下文切换的，因为涉及到虚拟内存、栈、全局变量等资源的加载，而线程的虚拟内存是共享的，就会快很多上下文切换中自愿上下文切换、非自愿上下文切换是我们关注的重点

3.平均负载

概念：系统处于可运行状态和不可中断状态的平均进程数，也就是平均活跃进程数。这里提到的进程状态也是我们关注的重点。比如僵尸进程、不可中断进程每个进程都可以得到cpu时间片是最完美的，所以平均负载高于CPU核心数就说明存在过载的情况了

4.CPU缓存

这取决于CPU型号的具体指标。越大越说明CPU的性能表现越出色观测工具

我们知道了CPU的核心性能指标，如果能理解每个指标对应的工具的特性，一定更高效、更灵活，下面是我整理的性能指标对应的查询工具表格，方便我们去观测这些指标。