一、安装gcc等环境
1、上传安装包
安装包包含gcc 、kernel-headers(需和内核版本一致)、kernel-devel)(需和内核版本一致)
查看内核版本命令:uname -r
1) 创建目录:mkdir -p /usr/local/tools/gcc-4.8.5-36
2) 将gcc-4.8.5-36.tar上传至 /usr/local/tools/gcc-4.8.5-36目录
3) 进入目录:cd /usr/local/tools/
4) 解压gcc安装包:tar gcc-4.8.5-36.tar -C mkdir -p /usr/local/tools/gcc-4.8.5-36
5) 删除tar包:rm -rf gcc-4.8.5-36.tar
2、安装gcc
输入命令:rpm -Uvh *.rpm --nodeps --force
如未报错则
输入命令:gcc -V 如果出现版本号则说明安装成功
二、安装NVIDA驱动
1、禁止nouveau
1)执行命令:lsmod | grep nouveau #无结果说明已禁用无需执行下面操作
2)执行命令:cp /local-repo/nvidia-installer-disable-nouveau.conf /etc/modprobe.d/
3)执行命令:dracut --force
4)重启:reboot
5)执行命令:lsmod | grep nouveau #无结果显示即为成功
2、安装NVIDA驱动
1) 创建目录:mkdir -p /usr/local/tools/nvidia
2) 将驱动上传至/usr/local/tools/nvidia
3) 执行命令:cd /usr/local/tools/nvidia
4) 执行命令:chmod +x NVIDIA-Linux-x86_64-430.50.run #赋执行权限
5) 执行命令:./NVIDIA-Linux-x86_64-430.50.run #按照提示下一步即可
如果内核版本不一致则可指定内核版本执行命令:
./NVIDIA-Linux-x86_64-470.86.run --kernel-source-path=/usr/src/kernels/3.10.0-957.el7.x86_64 -k 3.10.0-957.el7.x86_6
6) 安装完成后执行命令:nvidia-smi #出现显卡信息说明安装成功
7) 查看显卡信息:lspci -vv |grep -i nvidia #看显卡数量和驱动的数量是否一致
三、安装docker19.3
1、卸载已安装的docker(未安装则不用卸载,跳过此步骤)
1)执行命令:yum list installed|grep docker
2)执行命令:yum -y remove docker-ce x86_64
2、上传安装包
1)上传docker-19.03.1.tar.gz 至 /usr/local/tools/docker-19.03
2)解压:tar -xzf docker-19.03.1.tar.gz -C /usr/local/tools/docker-19.03
3、安装docker
1) 安装执行命令:yum localinstall -y docker-install/*.rpm #
2) 启动执行命令:systemctl start docker
3) 设置开机自启docker:systemctl enable docker
4) 查看docker状态:systemctl status docker
5) 查看docker版本:docker version
四、安装CUDA
1、安装
1)将cuda_10.1.243_418.87.00_linux.run上传至/usr/local/tools/nvidia
2)执行命令:chmod +x cuda_10.1.243_418.87.00_linux #赋执行权限
3)执行命令:./cuda_10.1.243_418.87.00_linux.run# 按照提示安装,选择install
3)安装完成后目录在/usr/local/cuda-10.1下
2、设置环境变量
1)打开.bashrc 文件:sudo vi ~/.bashrc
2)打开文件后将下面两句话加入进去
| export LD_LIBRARY_PATH=PATH:/usr/local/cuda-10.1/binexport CUDA_HOME=$CUDA_HOME:/usr/local/cuda-10.1 |
|---|
3)执行命令:source ~./bashrc
4)执行命令:nvcc -V 会输出CUDA的版本信息
3、编译并测试设备 deviceQuery
1)执行命令:cd /usr/local/cuda-10.1/samples/1_Utilities/deviceQuery
2)执行命令:sudo make
3)执行命令:./deviceQuery
4、编译并测试带宽 bandwidthTest
1)执行命令:cd ../bandwidthTest
2)sudo make
3)./bandwidthTest
五、安装cudnn
在tar文件所在目录下解压下载的文件:
tar -xzvf cudnn-10.1-linux-x64-xxx.tgz
可以看到cuda文件夹,在当前目录打开终端,执行如下命令:
sudo cp cuda/include/cudnn.h /usr/local/cuda/include/
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/
sudo chmod a+r /usr/local/cuda/include/cudnn.h
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*