机器学习:docker中安装pytorch(gpu)+cuda

1,626 阅读1分钟

本文已参与「新人创作礼」活动,一起开启掘金创作之路。

预先在ubuntu系统中安装nvidia显卡,使用如下命令查看可以安装的版本

sudo apt list nvidia-driver*

image.png

nvidia官网查看cuda与nvidia驱动版本的兼容对应关系

image.png

本文直接安装470版本,同样在ubuntu中使用如下命令安装:

sudo apt install nvidia-driver-470

安装结束之后,重启服务器,进行如下验证:

nvidia-smi

image.png

可以看到显卡驱动已经安装成功,它对应的cuda的型号是11.4版本,那么docker就应当安装不高于此版本。

dockerHub中查找对应的版本

image.png

本文选用 1.12.1-cuda11.3-cudnn8-devel 版本进行安装(选后缀为devel的版本),命令如下:

docker pull pytorch/pytorch:1.12.1-cuda11.3-cudnn8-devel

查看系统中已经存在的docker镜像文件(截图中倒数第二行):

docker images

image.png

使用如下命令运行刚刚下载的镜像:

nvidia-docker run -itd -p 5004:22 pytorch/pytorch:1.12.1-cuda11.3-cudnn8-devel

此时可以使用如下命令查看正在运行的容器:

docker ps

image.png

使用如下命令进入目标容器的 bash (其中 50a6c 为容器的ID),并进行cuda和pytorch环境的测试:

docker exec -it 50a6c /bin/bash

image.png

之后,使用命令conda init初始化conda,再退出并重新进入bash。