运维工程师必备:Linux系统监控与故障排查的命令大全

 更新时间:2025年12月31日 09:42:16   作者:RumIV  
文章整理了Linux系统监控命令,按功能分类并附使用示例,涵盖了系统概览、CPU、内存、磁盘、网络、进程与服务、高级监控工具等多个方面,需要的朋友可以参考下

在日常运维工作中,快速获取系统状态信息至关重要。以下整理了常用的Linux监控命令,按功能分类并附使用示例:

一、系统概览信息

命令功能示例输出
hostname查看主机名web-server-01
uname -a系统内核信息Linux db01 5.4.0-131-generic #148-Ubuntu SMP
cat /etc/os-release操作系统版本PRETTY_NAME="Ubuntu 20.04.4 LTS"
uptime运行时间与负载18:05:01 up 45 days, 3:21, 1 user, load average: 0.08, 0.03, 0.05
date系统时间Thu Aug 18 18:05:24 CST 2023

二、CPU监控

命令功能关键指标
lscpuCPU架构信息核心数/线程数/型号
top -bn1实时CPU使用率%Cpu(s): 12.3 us, 6.2 sy
mpstat -P ALL多核CPU详细统计各核心的user/sys/idle占比
sar -u 2 5周期性CPU采样平均使用率趋势
vmstat 1综合性能监控r(运行队列)/b(阻塞进程)

高级技巧

# 按CPU使用率排序进程
ps -eo pid,ppid,cmd,%mem,%cpu --sort=-%cpu | head -n 10

三、内存监控

命令功能关键指标
free -m内存总量与使用Mem: 32042 29582 2460
vmstat -s详细内存统计active/inactive memory
cat /proc/meminfo内存详细信息MemTotal/Cached/Swap
slabtop内核slab缓存内核对象缓存使用

内存泄漏排查

# 监控进程内存变化
watch -n 1 "ps -eo pid,cmd,rss --sort=-rss | head -n 5"

四、磁盘监控

命令功能关键指标
df -h磁盘空间使用/dev/sda1 98G 45G 48G 49% /
iostat -dx 2磁盘IO性能await(ms)/util(%)
iotop实时IO进程进程级读写速率
`du -sh /*sort -hr`目录大小排序
lsblk块设备信息磁盘分区/挂载点

IO瓶颈诊断

# 定位高IO进程
pidstat -d 1

五、网络监控

命令功能关键指标
ifconfig/ip addr网络接口信息IP地址/RX/TX包量
netstat -tulnp端口监听状态服务端口/PID
ss -s连接统计Total: 987 (kernel 0)
tcpdump -i eth0网络包捕获实时流量分析
iftop -P带宽使用排名主机级流量统计

连接分析

# 查看ESTABLISHED连接数
netstat -an | grep ESTABLISHED | wc -l

六、进程与服务监控

命令功能关键指标
ps aux进程列表CPU/MEM使用率
pidstat 1进程资源统计%CPU/%MEM
systemctl status服务状态Active(running)
journalctl -u nginx服务日志服务运行日志
lsof -p <PID>进程打开文件文件描述符

进程树查看

# 显示进程树关系
pstree -ap

七、高级监控工具

实时监控面板

  • htop:增强版top(支持鼠标操作)
  • glances:全能监控面板(需安装)
  • nmon:专业性能监控工具

日志分析

# 查看包含ERROR的最新日志
tail -f /var/log/syslog | grep -i error

# 统计404错误次数
awk '$9==404 {print $7}' access.log | sort | uniq -c | sort -nr

性能分析

  • perf top:CPU热点函数分析
  • strace -p <PID>:系统调用跟踪
  • dstat:综合性能统计工具

八、最佳实践建议

命令组合使用

# 单行获取关键指标
echo "Load:$(uptime | awk -F'load average: ' '{print $2}') | Mem:$(free -m | awk '/Mem/{print $3"/"$2"MB"}')"

监控自动化

  • 使用cron定期收集指标
  • 通过tee同时输出到屏幕和文件
  • 编写脚本格式化输出(如本文示例)

安全注意事项

  • 避免在生产环境直接修改配置
  • 使用nohup执行长时间任务
  • 敏感命令添加-i交互确认

运维箴言:掌握这些命令如同获得系统"听诊器",但真正的价值在于理解数据背后的意义。建议建立自己的命令手册,定期练习形成肌肉记忆。

通过熟练使用这些命令,运维工程师可以快速诊断系统瓶颈,有效处理故障,保障业务稳定运行。记住:好的运维不是救火队员,而是通过监控提前发现隐患的守护者。

以上就是运维工程师必备:Linux系统监控与故障排查的命令大全的详细内容,更多关于Linux系统监控与故障排查的资料请关注脚本之家其它相关文章!

相关文章

  • Ubuntu 14.04下安装和配置redis数据库

    Ubuntu 14.04下安装和配置redis数据库

    安装Redis服务器,会自动地一起安装Redis命令行客户端程序。在本机输入redis-cli命令就可以启动,客户端程序访问Redis服务器。
    2016-04-04
  • ubuntu20.04连接wifi的方法(2种)

    ubuntu20.04连接wifi的方法(2种)

    这篇文章主要介绍了ubuntu20.04连接wifi的方法(2种),文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-07-07
  • 安装ubuntu18.04报:failed to load ldlinux.c32的问题及解决步骤

    安装ubuntu18.04报:failed to load ldlinux.c32的问题及解决步骤

    这篇文章主要介绍了安装ubuntu18.04报:failed to load ldlinux.c32的问题,本文通过图文并茂的形式给大家分享解决方法,需要的朋友可以参考下
    2020-08-08
  • Linux离线安装gcc和gcc-c++全过程

    Linux离线安装gcc和gcc-c++全过程

    文章介绍了在联网和离线情况下安装GCC和GCC-C++组件的方法,联网时,可以直接使用命令`yum -y install gcc`进行安装,离线安装时,需要从百度云盘下载GCC和GCC-C++的离线安装包,然后按照一定的顺序执行安装命令,此外,文章还提供了查看GCC版本和安装GCC-C++组件的步骤
    2025-10-10
  • LNAMP架构中后端Apache获取用户真实IP地址的2种方法

    LNAMP架构中后端Apache获取用户真实IP地址的2种方法

    Nginx作为前端,Apache作为后端的情况下,Apache只能获取到Nginx前端的ip地址(127.0.0.1),而无法获取到用户的真实ip地址,在这种情况下,后端Apache如何获取用户真实IP地址?
    2014-03-03
  • 10大HBase常见运维工具整理小结

    10大HBase常见运维工具整理小结

    这篇文章主要介绍了10大HBase常见运维工具整理小结,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2020-07-07
  • Linux高并发场景下的网络参数调优实战指南

    Linux高并发场景下的网络参数调优实战指南

    在高并发网络服务场景中,Linux内核的默认网络参数往往无法满足需求,导致性能瓶颈、连接超时甚至服务崩溃,本文基于真实案例分析,从参数解读、问题诊断到优化实践,手把手教你如何调优Linux网络参数,支撑百万级并发连接,需要的朋友可以参考下
    2025-05-05
  • sersync实现数据实时同步的方法

    sersync实现数据实时同步的方法

    下面小编就为大家分享一篇sersync实现数据实时同步的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2017-12-12
  • Linux如何设置服务自启动

    Linux如何设置服务自启动

    这篇文章主要介绍了Linux中设置服务自启动的三种方式,ln -s 建立启动软连接
    2015-11-11
  • 在Linux和Windows下安装nc(netcat)的详细步骤

    在Linux和Windows下安装nc(netcat)的详细步骤

    本文详细介绍了在Linux和Windows系统下安装netcat(nc)的方法,对于Linux系统,使用APT包管理器安装,推荐使用netcat-openbsd;对于Windows系统,推荐使用Nmap自带的Ncat或者下载独立版Netcat,需要的朋友可以参考下
    2025-10-10

最新评论