【云原生学习】Linux 系统管理核心操作精讲 + 实战踩坑

2 阅读5分钟

一、笔记基础信息栏

  • 笔记标题:【云原生学习】Linux 系统管理核心操作精讲 + 实战踩坑
  • 学习日期 / 更新日期:2026-04-13
  • 所属模块:云基础 / 云运维 / 安全运维
  • 学习难度:入门级
  • 核心标签:# 云原生 #云运维 #Linux #Linux 系统管理 #大学计算机学习 #运维入门
  • 学习目标:掌握 Linux 系统管理全流程操作,熟练使用进程、服务、磁盘、用户、监控命令,独立排查常见系统故障
  • 前置知识:Linux 基础命令、虚拟机环境配置

二、核心知识笔记模块

模块 1:理论概念笔记

1. 核心定义与本质

  • 标准定义:Linux 系统管理是对 Linux 操作系统的进程、服务、用户、权限、磁盘、内存、日志等资源进行监控、配置、维护与故障排查的一系列操作,是服务器稳定运行的基础。
  • 大白话解读:就是给 Linux 服务器 “做体检、管权限、控进程、清磁盘、修故障”,保证服务器不宕机、跑得稳。
  • 核心特点命令行主导多用户管控服务化管理资源可监控日志可追溯

2. 知识架构与关联

  • 体系框架:Linux 基础 → 系统管理 → 服务部署 → 容器运维 → 云服务器运维

  • 关联知识点:系统管理是 Docker、K8s、云 ECS 运维的前提,容器运行依赖 Linux 进程与资源调度。

  • 易混淆辨析:

    • 进程:正在运行的程序实体
    • 服务:后台持续运行的进程集合(如 sshd、nginx)
    • 系统监控:查看资源状态;系统管理:控制与维护资源

模块 2:实操运维笔记

1. 实操环境准备

  • 硬件 / 软件配置:VMware 虚拟机、Ubuntu 22.04 / CentOS 7、XShell 远程工具
  • 前置依赖:已安装 Linux 系统、可正常联网、拥有 root/sudo 权限

2. 分步实操流程

  1. 步骤 1:系统信息与状态管理

    执行命令:

uname -a          # 查看系统内核
hostnamectl       # 查看主机信息
uptime            # 查看运行时间与负载
reboot            # 重启
shutdown -h now   # 关机
  1. 命令解析:查看系统基础信息、控制开关机与重启。

  2. 预期结果:正确显示系统版本、运行时间,开关机指令生效。

    步骤 2:进程管理

    执行命令:

ps aux            # 查看所有进程
top               # 实时监控进程
pidof nginx       # 查看进程PID
kill 进程ID        # 正常结束进程
kill -9 进程ID     # 强制结束进程
  1. 命令解析:ps 静态查看、top 动态监控、kill 终止进程。

  2. 预期结果:可定位进程、正常杀死目标进程。

    步骤 3:系统服务管理(systemd)

    执行命令:

systemctl start sshd      # 启动服务
systemctl stop sshd       # 停止服务
systemctl restart sshd    # 重启服务
systemctl status sshd     # 查看状态
systemctl enable sshd     # 开机自启
  1. 命令解析:systemctl 是 CentOS/Ubuntu 主流服务管理工具。

  2. 预期结果:服务启动成功,状态显示 running。

    步骤 4:磁盘与内存管理

    执行命令:

df -h              # 查看磁盘空间
du -sh 目录         # 查看目录大小
free -h            # 查看内存
lsblk              # 查看磁盘设备
  1. 命令解析:监控磁盘、内存使用情况。

  2. 预期结果:清晰显示使用率、挂载点。

    步骤 5:用户与权限管理

    执行命令:

useradd tom            # 创建用户
passwd tom             # 设置密码
chmod 755 test.txt      # 修改权限
chown tom:tom test.txt  # 修改归属
  1. 命令解析:管理系统用户、文件权限与归属。
  2. 预期结果:用户创建成功,权限修改生效。

3. 常用命令速查

  • 核心运维命令
# 进程
ps aux、top、kill、pidof
# 服务
systemctl start/stop/restart/enable/status
# 磁盘
df -h、du -sh、free -h
# 用户
useradd、passwd、chmodchown
# 日志
tail -f、journalctl -f
  • 快捷脚本
#!/bin/bash
echo "=== 系统资源监控 ==="
free -h
echo ""
df -h | grep -v tmpfs
echo ""
top -b -n 1 | grep Cpu

4. 实战踩坑与排错

  • 报错场景 1:kill 进程提示权限不足

    • 错误原因:普通用户无法管理系统 / 其他用户进程
    • 解决方案:加 sudo 或切换 root 执行
  • 报错场景 2:systemctl start 提示 Unit not found

    • 错误原因:服务名错误或未安装
    • 解决方案:核对服务名、安装对应软件
  • 报错场景 3:磁盘使用率 100%,无法写入

    • 错误原因:日志、大文件占满磁盘
    • 解决方案:du -sh /* 定位大目录,清理无用文件
  • 报错场景 4:内存占用过高,系统卡顿

    • 错误原因:进程泄漏或服务异常
    • 解决方案:top 定位高占用进程,重启或 kill

模块 3:架构设计笔记

  • 架构图:本地 / 云服务器 → Linux 系统 → 进程 / 服务 / 用户 / 磁盘 / 日志 → 运维命令管理 → 稳定运行

  • 组件职责:

    • 进程:运行程序
    • 服务:后台支撑
    • 用户:权限隔离
    • 磁盘:数据存储
    • 日志:故障追溯
  • 扩容 / 容灾方案:磁盘扩容、内存升级、快照备份、日志轮转

  • 优缺点分析:

    • 优势:稳定、轻量、命令高效、适合服务器
    • 局限性:图形化弱,需记忆命令

三、学习复盘与拓展模块

1. 本节学习总结

  • 核心收获:掌握 Linux 系统管理五大模块:系统信息、进程、服务、磁盘、用户;能独立完成监控、启停、排错。
  • 知识盲区:systemd 配置编写、内核调优、磁盘阵列、高级权限管理。
  • 学习心得:系统管理重在多练多敲,遇到报错先看日志、查权限、定位资源,新手多用快照避免反复装系统。

2. 拓展学习资源

  • 官方文档:Linux 官方文档、Ubuntu/CentOS 官方手册
  • 优质教程:《鸟哥的 Linux 私房菜》、B 站 Linux 运维入门
  • 实操工具:htop、glances、XShell、阿里云 ECS 学生机

3. 后续学习计划

  • 下一节学习内容:Linux 日志管理、crontab 定时任务、Shell 脚本入门
  • 实战项目:编写系统监控脚本、搭建自动日志清理任务

4. 考点 / 面试重点

  • 课程高频考点:进程查看命令、服务管理、磁盘查看、用户权限修改

  • 技术面试高频题:

    1. 如何查看 Linux 系统 CPU / 内存使用率?
    2. systemctl 常用命令有哪些?
    3. 磁盘满了如何排查?
    4. kill 和 kill -9 的区别?