机器学习：docker中安装pytorch(gpu)+cuda机器学习之：在ubuntu系统中，基于docker安装py

本文已参与「新人创作礼」活动，一起开启掘金创作之路。

预先在ubuntu系统中安装nvidia显卡，使用如下命令查看可以安装的版本

sudo apt list nvidia-driver*

在nvidia官网查看cuda与nvidia驱动版本的兼容对应关系

本文直接安装470版本，同样在ubuntu中使用如下命令安装：

sudo apt install nvidia-driver-470

安装结束之后，重启服务器，进行如下验证：

nvidia-smi

可以看到显卡驱动已经安装成功，它对应的cuda的型号是11.4版本，那么docker就应当安装不高于此版本。

在dockerHub中查找对应的版本

本文选用 1.12.1-cuda11.3-cudnn8-devel 版本进行安装（选后缀为devel的版本），命令如下：

docker pull pytorch/pytorch:1.12.1-cuda11.3-cudnn8-devel

查看系统中已经存在的docker镜像文件（截图中倒数第二行）：

docker images

使用如下命令运行刚刚下载的镜像：

nvidia-docker run -itd -p 5004:22 pytorch/pytorch:1.12.1-cuda11.3-cudnn8-devel

此时可以使用如下命令查看正在运行的容器：

docker ps

使用如下命令进入目标容器的 bash （其中 50a6c 为容器的ID），并进行cuda和pytorch环境的测试:

docker exec -it 50a6c /bin/bash

之后，使用命令conda init初始化conda，再退出并重新进入bash。