本文已参与「新人创作礼」活动,一起开启掘金创作之路。
预先在ubuntu系统中安装nvidia显卡,使用如下命令查看可以安装的版本
sudo apt list nvidia-driver*
在nvidia官网查看cuda与nvidia驱动版本的兼容对应关系
本文直接安装470版本,同样在ubuntu中使用如下命令安装:
sudo apt install nvidia-driver-470
安装结束之后,重启服务器,进行如下验证:
nvidia-smi
可以看到显卡驱动已经安装成功,它对应的cuda的型号是11.4版本,那么docker就应当安装不高于此版本。
在dockerHub中查找对应的版本
本文选用 1.12.1-cuda11.3-cudnn8-devel 版本进行安装(选后缀为devel的版本),命令如下:
docker pull pytorch/pytorch:1.12.1-cuda11.3-cudnn8-devel
查看系统中已经存在的docker镜像文件(截图中倒数第二行):
docker images
使用如下命令运行刚刚下载的镜像:
nvidia-docker run -itd -p 5004:22 pytorch/pytorch:1.12.1-cuda11.3-cudnn8-devel
此时可以使用如下命令查看正在运行的容器:
docker ps
使用如下命令进入目标容器的 bash (其中 50a6c 为容器的ID),并进行cuda和pytorch环境的测试:
docker exec -it 50a6c /bin/bash
之后,使用命令conda init初始化conda,再退出并重新进入bash。