简单的 OS 性能分析速查(运维场景)预备知识库:计算机组成原理(如内存 Hierarchy、CPU 基本组成),操作系统原理(kernel/user space、资源抽象、进程状态抽象等)。 以下是很零碎、经验化的思路,总结下来方便回顾。 1. CPU 分析业界主流的对于 CPU 忙碌情况的指标是 “Load Average”,定义为 处于可运行状态(running)和不可中断睡眠(uninterruptible sleep,通常在等待 I/O)的进程数平均值。相关知识参见 附录 II。 Linux 上使用 top 类指令查看到的 load average 通常有 3 个数字,分别代表在过去 1 分钟、5 分钟、15 分钟内的 load average。 例:load average: 2.35, 1.87, 1.25 表示 1 分钟平均有 2.35 个进程在等待 CPU 或 I/O 资源(粗略认为)。 一般情况正常工作的理想状况 load average 约等于 CPU 核心数。load average 两倍于 CPU 核心数超过 5 分钟认为过载预警,4 倍于 CPU 核心数认为严重过载。 另一个指标是...