AI算法GPU环境安装

148 阅读2分钟

一、安装gcc等环境

 

1、上传安装包

安装包包含gcc 、kernel-headers(需和内核版本一致)、kernel-devel)(需和内核版本一致)

查看内核版本命令:uname -r

 

1) 创建目录:mkdir -p /usr/local/tools/gcc-4.8.5-36

2) 将gcc-4.8.5-36.tar上传至 /usr/local/tools/gcc-4.8.5-36目录

3) 进入目录:cd /usr/local/tools/

4) 解压gcc安装包:tar gcc-4.8.5-36.tar -C mkdir -p /usr/local/tools/gcc-4.8.5-36

5) 删除tar包:rm -rf gcc-4.8.5-36.tar

 

2、安装gcc

输入命令:rpm -Uvh *.rpm --nodeps --force

如未报错则

输入命令:gcc -V 如果出现版本号则说明安装成功

 

 

二、安装NVIDA驱动

1、禁止nouveau

1)执行命令:lsmod | grep nouveau #无结果说明已禁用无需执行下面操作

2)执行命令:cp /local-repo/nvidia-installer-disable-nouveau.conf /etc/modprobe.d/

3)执行命令:dracut --force

4)重启:reboot

5)执行命令:lsmod | grep nouveau #无结果显示即为成功

 

2、安装NVIDA驱动

1) 创建目录:mkdir -p /usr/local/tools/nvidia

2) 将驱动上传至/usr/local/tools/nvidia

3) 执行命令:cd /usr/local/tools/nvidia

4) 执行命令:chmod +x NVIDIA-Linux-x86_64-430.50.run #赋执行权限

5) 执行命令:./NVIDIA-Linux-x86_64-430.50.run  #按照提示下一步即可

如果内核版本不一致则可指定内核版本执行命令:

./NVIDIA-Linux-x86_64-470.86.run --kernel-source-path=/usr/src/kernels/3.10.0-957.el7.x86_64 -k 3.10.0-957.el7.x86_6

 

6) 安装完成后执行命令:nvidia-smi #出现显卡信息说明安装成功

7) 查看显卡信息:lspci -vv |grep -i nvidia #看显卡数量和驱动的数量是否一致

 

三、安装docker19.3

1、卸载已安装的docker(未安装则不用卸载,跳过此步骤)

1)执行命令:yum list installed|grep docker

2)执行命令:yum -y remove docker-ce x86_64

 

2、上传安装包

1)上传docker-19.03.1.tar.gz 至 /usr/local/tools/docker-19.03

2)解压:tar -xzf docker-19.03.1.tar.gz -C /usr/local/tools/docker-19.03

 

3、安装docker

1) 安装执行命令:yum localinstall -y docker-install/*.rpm #

2) 启动执行命令:systemctl start docker

3) 设置开机自启docker:systemctl enable docker

4) 查看docker状态:systemctl status docker

5) 查看docker版本:docker version

 

 

 

 

四、安装CUDA

1、安装

1)将cuda_10.1.243_418.87.00_linux.run上传至/usr/local/tools/nvidia

2)执行命令:chmod +x cuda_10.1.243_418.87.00_linux #赋执行权限

3)执行命令:./cuda_10.1.243_418.87.00_linux.run# 按照提示安装,选择install

3)安装完成后目录在/usr/local/cuda-10.1下

 

2、设置环境变量

1)打开.bashrc 文件:sudo vi ~/.bashrc

2)打开文件后将下面两句话加入进去

export LD_LIBRARY_PATH=LDLIBRARYPATH:/usr/local/cuda10.1/lib64exportPATH=LDLIBRARY_PATH:/usr/local/cuda-10.1/lib64export PATH=PATH:/usr/local/cuda-10.1/binexport CUDA_HOME=$CUDA_HOME:/usr/local/cuda-10.1

3)执行命令:source ~./bashrc

4)执行命令:nvcc -V 会输出CUDA的版本信息

 

3、编译并测试设备 deviceQuery

1)执行命令:cd /usr/local/cuda-10.1/samples/1_Utilities/deviceQuery

2)执行命令:sudo make

3)执行命令:./deviceQuery

 

4、编译并测试带宽 bandwidthTest

1)执行命令:cd ../bandwidthTest

2)sudo make

3)./bandwidthTest

 

五、安装cudnn

 

在tar文件所在目录下解压下载的文件:

tar -xzvf cudnn-10.1-linux-x64-xxx.tgz

 

可以看到cuda文件夹,在当前目录打开终端,执行如下命令:

 

sudo cp cuda/include/cudnn.h /usr/local/cuda/include/

 

sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/

 

sudo chmod a+r /usr/local/cuda/include/cudnn.h

 

sudo chmod a+r /usr/local/cuda/lib64/libcudnn*