【上手AI】4-配AI环境配置

114 阅读1分钟

目标

配环境

tips

建议不要动base的环境,去conda配虚拟环境

不然真的是牵一发而动全身

核心思路

  1. 先看你的显卡信息

    nvidia-smi

    可以看到你的显卡支持最高的cuda版本,比如

image.png

  1. 去装对应版本的cuda

不要去这个页面 developer.nvidia.com/cuda-downlo…

去归档页面,developer.nvidia.com/cuda-toolki…

选择对应的版本,开始安装

这三种方式都可以

image.png

我之前这里还是有很多坑的,后面整理了再发出来

比如11.8装好了之后,nvcc --version还是10.1的

image.png

这里解决方法:

whereis nvcc
sudo ln -s /usr/local/cuda-11.8/bin/nvcc /usr/local/bin/nvcc
export PATH=/usr/local/cuda-11.8/bin:$PATH
source ~/.bashrc

ps:bug的解决方法不要盲目相信gpt3.5,相信stackflow

  1. 去装对应版本的pytorch

pytorch.org/get-started…

上面都写明了cuda某个版本对应的pytorch

总结

环境的要义:

要有显卡,==> nvidia-smi

要装显卡对应的cuda,==> nvcc --verison

要装cuda对应的pytorch

当然可以直接使用docker免去环境的困扰

解释

就是我的服务器上本来有10.1,为什么我要装11.8

因为微软那个tts服务跑起来说版本太低了

然后为什么我说不要动base

因为我当时服务器上base是10.1,但其实有12.0的conda环境

同事没有告诉我,所以不建议动base