一、笔记基础信息栏
- 笔记标题:【云原生学习】Linux 系统管理核心操作精讲 + 实战踩坑
- 学习日期 / 更新日期:2026-04-13
- 所属模块:云基础 / 云运维 / 安全运维
- 学习难度:入门级
- 核心标签:# 云原生 #云运维 #Linux #Linux 系统管理 #大学计算机学习 #运维入门
- 学习目标:掌握 Linux 系统管理全流程操作,熟练使用进程、服务、磁盘、用户、监控命令,独立排查常见系统故障
- 前置知识:Linux 基础命令、虚拟机环境配置
二、核心知识笔记模块
模块 1:理论概念笔记
1. 核心定义与本质
- 标准定义:Linux 系统管理是对 Linux 操作系统的进程、服务、用户、权限、磁盘、内存、日志等资源进行监控、配置、维护与故障排查的一系列操作,是服务器稳定运行的基础。
- 大白话解读:就是给 Linux 服务器 “做体检、管权限、控进程、清磁盘、修故障”,保证服务器不宕机、跑得稳。
- 核心特点:命令行主导、多用户管控、服务化管理、资源可监控、日志可追溯。
2. 知识架构与关联
-
体系框架:Linux 基础 → 系统管理 → 服务部署 → 容器运维 → 云服务器运维
-
关联知识点:系统管理是 Docker、K8s、云 ECS 运维的前提,容器运行依赖 Linux 进程与资源调度。
-
易混淆辨析:
- 进程:正在运行的程序实体
- 服务:后台持续运行的进程集合(如 sshd、nginx)
- 系统监控:查看资源状态;系统管理:控制与维护资源
模块 2:实操运维笔记
1. 实操环境准备
- 硬件 / 软件配置:VMware 虚拟机、Ubuntu 22.04 / CentOS 7、XShell 远程工具
- 前置依赖:已安装 Linux 系统、可正常联网、拥有 root/sudo 权限
2. 分步实操流程
-
步骤 1:系统信息与状态管理
执行命令:
uname -a # 查看系统内核
hostnamectl # 查看主机信息
uptime # 查看运行时间与负载
reboot # 重启
shutdown -h now # 关机
-
命令解析:查看系统基础信息、控制开关机与重启。
-
预期结果:正确显示系统版本、运行时间,开关机指令生效。
步骤 2:进程管理
执行命令:
ps aux # 查看所有进程
top # 实时监控进程
pidof nginx # 查看进程PID
kill 进程ID # 正常结束进程
kill -9 进程ID # 强制结束进程
-
命令解析:ps 静态查看、top 动态监控、kill 终止进程。
-
预期结果:可定位进程、正常杀死目标进程。
步骤 3:系统服务管理(systemd)
执行命令:
systemctl start sshd # 启动服务
systemctl stop sshd # 停止服务
systemctl restart sshd # 重启服务
systemctl status sshd # 查看状态
systemctl enable sshd # 开机自启
-
命令解析:systemctl 是 CentOS/Ubuntu 主流服务管理工具。
-
预期结果:服务启动成功,状态显示 running。
步骤 4:磁盘与内存管理
执行命令:
df -h # 查看磁盘空间
du -sh 目录 # 查看目录大小
free -h # 查看内存
lsblk # 查看磁盘设备
-
命令解析:监控磁盘、内存使用情况。
-
预期结果:清晰显示使用率、挂载点。
步骤 5:用户与权限管理
执行命令:
useradd tom # 创建用户
passwd tom # 设置密码
chmod 755 test.txt # 修改权限
chown tom:tom test.txt # 修改归属
- 命令解析:管理系统用户、文件权限与归属。
- 预期结果:用户创建成功,权限修改生效。
3. 常用命令速查
- 核心运维命令
# 进程
ps aux、top、kill、pidof
# 服务
systemctl start/stop/restart/enable/status
# 磁盘
df -h、du -sh、free -h
# 用户
useradd、passwd、chmod、chown
# 日志
tail -f、journalctl -f
- 快捷脚本
#!/bin/bash
echo "=== 系统资源监控 ==="
free -h
echo ""
df -h | grep -v tmpfs
echo ""
top -b -n 1 | grep Cpu
4. 实战踩坑与排错
-
报错场景 1:kill 进程提示权限不足
- 错误原因:普通用户无法管理系统 / 其他用户进程
- 解决方案:加 sudo 或切换 root 执行
-
报错场景 2:systemctl start 提示 Unit not found
- 错误原因:服务名错误或未安装
- 解决方案:核对服务名、安装对应软件
-
报错场景 3:磁盘使用率 100%,无法写入
- 错误原因:日志、大文件占满磁盘
- 解决方案:du -sh /* 定位大目录,清理无用文件
-
报错场景 4:内存占用过高,系统卡顿
- 错误原因:进程泄漏或服务异常
- 解决方案:top 定位高占用进程,重启或 kill
模块 3:架构设计笔记
-
架构图:本地 / 云服务器 → Linux 系统 → 进程 / 服务 / 用户 / 磁盘 / 日志 → 运维命令管理 → 稳定运行
-
组件职责:
- 进程:运行程序
- 服务:后台支撑
- 用户:权限隔离
- 磁盘:数据存储
- 日志:故障追溯
-
扩容 / 容灾方案:磁盘扩容、内存升级、快照备份、日志轮转
-
优缺点分析:
- 优势:稳定、轻量、命令高效、适合服务器
- 局限性:图形化弱,需记忆命令
三、学习复盘与拓展模块
1. 本节学习总结
- 核心收获:掌握 Linux 系统管理五大模块:系统信息、进程、服务、磁盘、用户;能独立完成监控、启停、排错。
- 知识盲区:systemd 配置编写、内核调优、磁盘阵列、高级权限管理。
- 学习心得:系统管理重在多练多敲,遇到报错先看日志、查权限、定位资源,新手多用快照避免反复装系统。
2. 拓展学习资源
- 官方文档:Linux 官方文档、Ubuntu/CentOS 官方手册
- 优质教程:《鸟哥的 Linux 私房菜》、B 站 Linux 运维入门
- 实操工具:htop、glances、XShell、阿里云 ECS 学生机
3. 后续学习计划
- 下一节学习内容:Linux 日志管理、crontab 定时任务、Shell 脚本入门
- 实战项目:编写系统监控脚本、搭建自动日志清理任务
4. 考点 / 面试重点
-
课程高频考点:进程查看命令、服务管理、磁盘查看、用户权限修改
-
技术面试高频题:
- 如何查看 Linux 系统 CPU / 内存使用率?
- systemctl 常用命令有哪些?
- 磁盘满了如何排查?
- kill 和 kill -9 的区别?