服务器驱动bug

102 阅读1分钟

需求背景

在给定的服务器上面安装部署ComfyUI

实现思路

根据ComfyUI的官方文档:github.com/comfyanonym…

和闫总给的一篇安装驱动的文档:gist.github.com/denguir/b21…

思路:首先参考安装驱动的文档安装Nvidia驱动:CUDA 和 cuDNN,然后参考ComfyUI安装部署

使用gpt来翻译ComfyUI的官方文档,发现有几种机器对应安装方式

登录服务器输入命令查看自己的系统信息,发现是Nvidia,匹配官方文档中的安装方式

问题描述

问题:在参照安装驱动的文档安装完之后,重启,服务器连接不上

谷歌搜索问题,关键词:NVIDIA 、 驱动 、连接服务器

过滤搜索结果,找到和当前场景最类似的

找到在博客园的一篇文档:www.cnblogs.com/ygsworld/p/…

初步确认问题:在于系统重启后选择的内核版本改变了,导致已安装的驱动信息不匹配

解决方案

解决思路:文档中给出下载DKMS,维护内核外的驱动程序

同时根据已知向AI提问,给出第二种方案:更改 GRUB 配置文件以引导到正确的内核(实现较复杂)

最终解决:下载DKMS解决