Linux引导过程与排除启动故障

173 阅读8分钟

一、Linux引导过程

linux引导过程一般包括以下几个阶段: 开机自检 、 MBR 引导 、GRUB 菜单 、加载Linux内核 、 init(centos6),Systemd(centos7) 进程初始化 。 image.png

1、开机自检

服务器主机开机以后,将根据主板 BIOS 中的设置对 CPU(Central Processing Unit, 中央处理器)、内存、显卡、键盘等设备进行初步检测,检测成功后根据预设的启动顺序移交系统控制权,大多时候会移交给本机硬盘。

2、MBR引导

当从本机硬盘中启动系统时,首先根据硬盘第一个扇区中 MBR(Master Boot Record, 主引导记录)的设置,将系统控制权传递给包含操作系统引导文件的分区;或者直接根据 MBR 记录中的引导信息调用启动菜单(如 GRUB)。 总结:运行放在MBR扇区里的启动菜单GRUB引导程序。

3、GRUB菜单

对于 Linux 操作系统来说,GRUB(GRand Unified Bootloader,统一启动加载器)是使用最为广泛的多系统引导器程序。系统控制权传递给 GRUB 以后,将会显示启动菜单给用户选择,并根据所选项(或采用默认值)加载 Linux 内核文件,然后将系统控制权转交给内核。需要注意的是,CentOS 7 采用的是 GRUB2 启动引导器。 总结:GRUB引导程序通过读取GRUB配置文件/boot/grub2/grub.cfg,来获取内核和镜像文件系统的设置和路径位置。 (即选择内核文件和系统类型)

4、加载Linux内核

Linux 内核是一个预先编译好的特殊二进制文件,介于各种硬件资源与系统程序之间, 负责资源分配与调度。内核接过系统控制权以后,将完全掌控整个 Linux 操作系统的运行过 程。在 CentOS 系统中,默认的内核文件位于“/boot/vmlinuz-3.10.0-514.el7.x86_64”。 总结:把内核和镜像文件系统加载到内存中,使其可以使用。

5、init/systemd进程初始化

为了完成进一步的系统引导过程,Linux内核首先将系统中的“/sbin/init”程序加载到内存中运行(运行中的程序称为进程),init 进程负责完成一系列的系统初始化过程,最后等待用户进行登录。CentOS 7 采用的是 Systemd 启动方式。 总结:加载硬件驱动程序,内核把init进程加载到内存中运行。 在Systemd中不同类型的systemd对象被统一称为单元(unit),是让系统知道该如何进行操作和管理资源的主要对象,所以systemd有许多单元类型。 Systemd单元文件最初默认存放在/lib/systemd/system目录中,每当安装新的软件都会自动在这个目录中添加一个配置文件。通过配置文件进行标识和配置不同单元;文件中主要包含了系统服务、监听。

ps:systemd的单元进程

image.png

image.png

二、排除启动类故障

1、修复MBR扇区故障

故障原因

  • 病毒、木马的等造成的破坏;
  • 不正确的分区操作、磁盘读写误操作等。

故障现象

  • 找不到引导程序,启动中断;
  • 无法加载操作系统,开机后黑屏。

解决思路:

  • 提前添加一块新硬盘;
  • 提前做好备份文件(将MBR扇区备份到另一块硬盘上);
  • 以安装光盘引导进入急救模式;
  • 从备份文件中恢复。

MBR扇区:

第一块硬盘的第一个物理扇区共512字节,其中前446字节为MBR(主引导记录),后64字节为硬盘分区表,最后2字节为硬盘标识。

备份命令:

mkdir /data/aa  
mount /dev/sdb1 /data/aa  
dd if=/dev/sda  of=/data/aa/mbr.bak  count=512  bs=1

在光盘中恢复MBR扇区命令:

sh-4.2# mkdir /backup  
sh-4.2# mount /dev/sdb1 /data/backup  
sh-4.2# dd if=/backup/mbr.bak of=/dev/sda count=512 bs=1

重启观察故障情况。因为第一块硬盘的引导程序被破坏,系统自动改用光盘启动。选择Troubleshooting,之后选择rescue mode(急救模式),使用备份文件恢复MBR扇区。

重启发生故障,无法正常启动。

选择 troubleshooting ,然后选择“Rescue a CentOS system”(急救模式),从备份文件中恢复MBR扇区,最后重新启动。

image.png

image.png

image.png

image.png

image.png 就可以成功进入界面

2、修复GRUB引导故障

故障原因:

  • MBR中的GRUB引导程序遭到破坏
  • grub.cfg 文件丢失、引导配置有误

故障现象:

  • 系统引导停滞,显示“grup>” 提示符

解决思路:

  • 尝试手动输入引导命令(笨拙繁琐,不建议使用)
  • 提前备份文件,恢复MBR扇区中的grub引导程序
  • 进入急救模式,重写或者从备份中恢复grub.cfg 文件

演示(恢复MBR扇区中的grub引导程序)

改用光盘启动,进入急救模式,从备份中恢复grub引导程序(/dev/sda的前446个字节)。

MBR位于第一块硬盘(/dev/sda)的第一个物理扇区处,总共512字节,前446字节是主引导记录,分区表保存在NBRA扇区中的第447-510字节中。

1)先备份MBR扇区的前446个字节。

[root@localhost ~]# mount /dev/sdb1 /data/aa   //将sdb1挂载到/data/aa目录下  
[root@localhost ~]# dd if=/dev/sda of=/data/aa/grub.bak bs=446 count=1     //将MBR扇区的前446个字节备份到/dev/sdb1中  
记录了1+0 的读入  
记录了1+0 的写出  446字节(446 B)已复制,0.000140753 秒,3.2 MB/秒  
[root@localhost ~]# ls /data/aa  grub.bak mbr.bak

2)模拟对MRB中的GRUB引导程序的破坏,但并不破坏分区表。

#使用空字符串破坏前446个字节(即主引导记录) 
[root@localhost ~]# dd if=/dev/zero of=/dev/sda bs=446 count=1      使用空串字符覆盖引导记录
记录了1+0 的读入  
记录了1+0 的写出  
446字节(446 B)已复制,0.000168803 秒,2.6 MB/秒  
[root@localhost ~]# reboot   //重启,观察故障情况

3)重启发生故障。进入急救模式,从备份中恢复grub引导程序 (方法和上面一个实验一致)

image.png image.png

案例演示2(重建grub.cfg 文件)

引导界面进入急救模式,重建GRUB菜单配置文件。

主要指令:

chroot /mnt/sysimage      #进入急救模式后,加载光盘镜像,切换到光驱系统的根环境 
grub2-install /dev/sda      #重新将GRUB引导程序安装到第一块硬盘(dev/sda)的MBR扇区 
grub2-mkconfig -o /boot/grub2/grub.cfg      #重新构建GRUB菜单配置文件

出现故障后重新启动,在读条界面按 Esc 键进入启动菜单,改用光盘启动,引导界面进入急救模式,重建GRUB菜单配置文件

出现”grub>“故障提示符

image.png 重新启动,在读条界面按 Esc 键进入启动菜单,改用光盘启动,进入急救模式,重建GRUB菜单配置文件

image.png

image.png

image.png

image.png

image.png

重启后可以直接进入用户登入界面,则重新构建成功

3、遗忘root用户密码

故障原因:

  • 遗忘root用户的密码

故障现象:

  • 无法进行需要root权限的管理操作;
  • 若没有其他可用账号,将无法登陆操作系统。

解决思路

  • 进入急救模式,重设密码。

案列:

情况一:

有光盘的情况下,使用光盘启动,进入急救模式。使用root环境,passwd修改root用户密码。

chroot /mnt/sysimage     //进入急救模式后,切换到光驱系统的根环境  

passwd                   //修改密码

image.png

image.png

image.png

情况二:

没有光盘的情况下,启动时按任意键暂停启动,之后按e键进入编辑模式。

将光标移动到 linux 开始的行,添加内核参数 rd.break,之后按ctrl-x启动进入单用户模式。

image.png 进入单用户模式后使用以下命令:

mount –o remount,rw /sysroot  
chroot /sysroot  passwd root 

#如果SELinux是启用的,才需要执行下面操作,如果没有启动,不需要执行  
touch /.autorelabel  
exit  
reboot

image.png

三、Linux系统的运行级别

1、查看运行级别

runlevel命令(只能查看切换运行级别与当前运行级别)

[root@localhost ~]# runlevel //查看切换运行级别与当前运行级别 
N 5    N:表示前一次没有切换运行级别
       5:当前运行级别5,处于图形界面

#N:表示前一次没有切换过运行级别  
#5:当前运行级别5,处于图像界面的多用户模式

systemctl工具(能查看默认的运行级别)

[root@localhost ~]# systemctl get-default //查看默认的运行级别  
graphical.target       //默认运行级别为图形界面

2、临时切换运行级别:

init命令

init 0     //关机  
init 1     //切换到单用户模式(single,维护模式)  
init 3     //切换到字符界面的多用户模式  
init 5     //切换到图形界面的多用户模式  
init 6     //重启

systemctl工具

systemctl [command] [unit.target]

command参数:

  • get-default:取得当前的target
  • set-default:设置指定的target为默认的运行级别
  • isolate:切换到指定的运行级别

unit.target:指运行级别(共7个)

临时切换运行级别:

systemctl isolate poweroff.target     //关机  
systemctl isolate rescue.target       //切换到单用户模式(single,维护模式)                      
systemctl isolate multi-user.target   //切换到字符界面的多用户模式        
systemctl isolate graphical.target   //切换到图形界面的多用户模  
systemctl isolate reboot.target       //重启

注:设置默认运行级别的过程,实际是创建一个指向指定运行级别的软链接。