Linux文件内容查看与文本处理命令详解
更新时间:2026年06月14日 14:50:45 作者:Csvn
看日志、查配置、分析数据——这是运维的日常三件套,文本处理命令用的好,排查问题速度快 10 倍,本文大家从简单的文件查看到强大介绍了文本流处理命令,需要的朋友可以参考下
知识点简介
看日志、查配置、分析数据——这是运维的日常三件套。文本处理命令用的好,排查问题速度快 10 倍。从简单的文件查看到强大的文本流处理,组成了运维工作的"瑞士军刀"。
核心命令整理
一、文件内容查看
| 命令 | 用途 | 常用参数 |
|---|---|---|
cat | 查看全文 / 合并文件 | -n 显示行号 · -b 有内容行显示行号 · -E 显示行尾 $ · -T 显示制表符 |
tac | 反向查看(从尾到头) | 同 cat |
nl | 带行号显示文件 | -ba 全行编号 · -bt 非空行编号(默认) |
less | 分页查看(推荐⭐) | g 首行 · G 末行 · / 搜索 · n 下一个 · N 上一个 · -N 显示行号 |
more | 分页查看(基础版) | Space 翻页 · Enter 下一行 · q 退出 |
head | 查看文件头部 | -n 20 前 20 行 · -c 100 前 100 字节 |
tail | 查看文件尾部 | -n 20 后 20 行 · -f 实时追加重磅 ⭐ · --pid=PID 进程结束自动停 |
二、文本搜索与处理
| 命令 | 用途 | 常用参数 |
|---|---|---|
grep | 文本搜索(王牌工具) | -i 忽略大小写 · -v 反向匹配 · -r 递归 · -l 仅显示文件名 · -n 显示行号 · -c 计数 · -E 扩展正则 · -A/B/C 上下文行 |
sed | 流编辑器(替换/删除/插入) | s/old/new/g 全局替换 · /pattern/d 删除行 · -i 原地修改 · -n p 只打印匹配行 |
awk | 文本分析 & 格式化输出 | '{print $1,$NF}' 字段提取 · -F: 指定分隔符 · NR 行号 · NF 每行字段数 |
sort | 排序 | -n 按数值 · -r 降序 · -k 按列 · -t 指定分隔符 · -u 去重排序 |
uniq | 去重 / 统计 | -c 统计出现次数 · -d 仅显示重复行 · -u 仅显示唯一行 |
wc | 统计行/词/字符 | -l 行数 · -w 单词数 · -c 字符数 |
三、文本比较
| 命令 | 用途 | 常用参数 |
|---|---|---|
diff | 逐行比较文件差异 | -u 上下文格式(推荐) · -i 忽略大小写 · -w 忽略空白 · -r 递归比较目录 |
comm | 比较两个已排序文件 | -1 隐藏文件1独有 · -2 隐藏文件2独有 · -3 隐藏共有 |
实操示例
场景 1:实时监控 Nginx 错误日志中的 5xx 错误
# 实时追踪错误日志,过滤 5xx 状态码 tail -f /var/log/nginx/access.log | grep --line-buffered ' "5[0-9][0-9] '
场景 2:分析访问日志 TOP 10 IP
# 提取 IP → 排序 → 去重计数 → 降序排 → 取前10
awk '{print $1}' /var/log/nginx/access.log | sort | uniq -c | sort -rn | head -10
场景 3:批量替换配置文件中的某个值
# 将所有 config 文件中的 placeholder 替换为实际域名(保留备份) sed -i.bak 's/__DOMAIN__/example.com/g' /etc/app/*.conf
场景 4:查看日志中某个时间范围内的记录
# 从 10:00 到 10:30 的日志 sed -n '/2026-06-11 10:00/,/2026-06-11 10:30/p' app.log
场景 5:用 awk 格式化输出进程信息
# 列出占用内存最高的前 5 个进程
ps aux | awk 'NR>1{print $4"\t"$11}' | sort -rn | head -5
场景 6:对比两个配置文件差异
# 比较生产与预发布环境配置 diff -u /etc/nginx/nginx.conf.prod /etc/nginx/nginx.conf.staging
常见坑点 / 注意事项
tail -f大文件性能:对 GB 级日志慎用tail -f,会持续占用 I/O。可先用less导航到文件尾部,或限制tail -f -n 50。grep -v过度过滤:反选过滤时可能误删重要信息,建议先用-c看匹配数量再决定。sed -i原地修改无备份:生产环境务必加后缀-i.bak保留备份,出事能回滚。awk默认分隔符:默认按空格/Tab 分割,处理/etc/passwd等文件要指定-F:。uniq只去重相邻行:一定要先sort再uniq -c,否则统计不准确。- 管道链的
--line-buffered:管道中grep默认有缓冲区,实时场景加--line-buffered强制逐行输出。
知识不记则废,命令不用则生。建议在测试机上逐条敲一遍,形成肌肉记忆。
到此这篇关于Linux文件内容查看与文本处理命令详解的文章就介绍到这了,更多相关Linux文件内容查看与文本处理命令内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!
相关文章
Linux shell编程中IO和条件及循环处理的细节问题讨论
这篇文章主要介绍了Linux shell编程中IO和条件及循环处理的细节问题讨论,需要的朋友可以参考下2016-02-02
Shell脚本实现随机数多种方法介绍(date、random、uuid)
这篇文章主要介绍了Shell脚本实现随机数多种方法介绍,本文讲解了通过时间获得随机数、通过内部系统变量、通过系统内部唯一数据生成随机数等方法,需要的朋友可以参考下2014-11-11
一个shell for循环与case结合的脚本(监控程序状态)
分享一个for循环+case的脚本(监控程序状态并执行相关操作) ,供大家学习参考2013-11-11


最新评论