📖 知识点简介
看日志、查配置、分析数据——这是运维的日常三件套。文本处理命令用的好,排查问题速度快 10 倍。从简单的文件查看到强大的文本流处理,组成了运维工作的"瑞士军刀"。
🛠 核心命令整理
一、文件内容查看
| 命令 | 用途 | 常用参数 |
|---|
cat | 查看全文 / 合并文件 | -n 显示行号 · -b 有内容行显示行号 · -E 显示行尾 $ · -T 显示制表符 |
tac | 反向查看(从尾到头) | 同 cat |
nl | 带行号显示文件 | -ba 全行编号 · -bt 非空行编号(默认) |
less | 分页查看(推荐⭐) | g 首行 · G 末行 · / 搜索 · n 下一个 · N 上一个 · -N 显示行号 |
more | 分页查看(基础版) | Space 翻页 · Enter 下一行 · q 退出 |
head | 查看文件头部 | -n 20 前 20 行 · -c 100 前 100 字节 |
tail | 查看文件尾部 | -n 20 后 20 行 · -f 实时追加重磅 ⭐ · --pid=PID 进程结束自动停 |
二、文本搜索与处理
| 命令 | 用途 | 常用参数 |
|---|
grep | 文本搜索(王牌工具) | -i 忽略大小写 · -v 反向匹配 · -r 递归 · -l 仅显示文件名 · -n 显示行号 · -c 计数 · -E 扩展正则 · -A/B/C 上下文行 |
sed | 流编辑器(替换/删除/插入) | s/old/new/g 全局替换 · /pattern/d 删除行 · -i 原地修改 · -n p 只打印匹配行 |
awk | 文本分析 & 格式化输出 | '{print $1,$NF}' 字段提取 · -F: 指定分隔符 · NR 行号 · NF 每行字段数 |
sort | 排序 | -n 按数值 · -r 降序 · -k 按列 · -t 指定分隔符 · -u 去重排序 |
uniq | 去重 / 统计 | -c 统计出现次数 · -d 仅显示重复行 · -u 仅显示唯一行 |
wc | 统计行/词/字符 | -l 行数 · -w 单词数 · -c 字符数 |
三、文本比较
| 命令 | 用途 | 常用参数 |
|---|
diff | 逐行比较文件差异 | -u 上下文格式(推荐) · -i 忽略大小写 · -w 忽略空白 · -r 递归比较目录 |
comm | 比较两个已排序文件 | -1 隐藏文件1独有 · -2 隐藏文件2独有 · -3 隐藏共有 |
💻 实操示例
场景 1:实时监控 Nginx 错误日志中的 5xx 错误
tail -f /var/log/nginx/access.log | grep --line-buffered ' "5[0-9][0-9] '
场景 2:分析访问日志 TOP 10 IP
awk '{print $1}' /var/log/nginx/access.log | sort | uniq -c | sort -rn | head -10
场景 3:批量替换配置文件中的某个值
sed -i.bak 's/__DOMAIN__/example.com/g' /etc/app/*.conf
场景 4:查看日志中某个时间范围内的记录
sed -n '/2026-06-11 10:00/,/2026-06-11 10:30/p' app.log
场景 5:用 awk 格式化输出进程信息
ps aux | awk 'NR>1{print $4"\t"$11}' | sort -rn | head -5
场景 6:对比两个配置文件差异
diff -u /etc/nginx/nginx.conf.prod /etc/nginx/nginx.conf.staging
⚠️ 常见坑点 / 注意事项
tail -f 大文件性能:对 GB 级日志慎用 tail -f,会持续占用 I/O。可先用 less 导航到文件尾部,或限制 tail -f -n 50。
grep -v 过度过滤:反选过滤时可能误删重要信息,建议先用 -c 看匹配数量再决定。
sed -i 原地修改无备份:生产环境务必加后缀 -i.bak 保留备份,出事能回滚。
awk 默认分隔符:默认按空格/Tab 分割,处理 /etc/passwd 等文件要指定 -F:。
uniq 只去重相邻行:一定要先 sort 再 uniq -c,否则统计不准确。
- 管道链的
--line-buffered:管道中 grep 默认有缓冲区,实时场景加 --line-buffered 强制逐行输出。
🧠 知识不记则废,命令不用则生。建议在测试机上逐条敲一遍,形成肌肉记忆。