Ubuntu 20.04 深度学习开发环境安装教程完全体
本安装教程包括:
- Ubuntu 20.04 LTS Desktop 系统安装
- 软件中心问题
- 安装Barrier
- 设置中文输入法
- 安装WPS
- Python 开发环境
- CUDA Toolkit
- CuDNN
- Pytorch
- Docker
1. Ubuntu 20.04 LTS Desktop 系统安装
- 下载 Ubuntu20.04 LTS Desktop 桌面版 镜像
- 下载 balanceEtcher USB 镜像工具
- 1 个 8 GB 左右的 USB (提前备份);
- 打开镜像工具,依次添加 ISO 镜像文件,选择 USB,单击 Flash! 生成镜像 :
- 重启电脑,进入BIOS修改启动顺序,将USB 启动作为最高优先级。 不同机型进入 BIOS 方式:
- ASRock: F2 or DEL
- ASUS: F2 for all PCs, F2 or DEL for Motherboards
- Acer: F2 or DEL
- Dell: F2 or F12
- ECS: DEL
- Gigabyte / Aorus: F2 or DEL
- HP: F10
- Lenovo (Consumer Laptops): F2 or Fn + F2
- Lenovo (Desktops): F1
- Lenovo (ThinkPads): Enter then F1
- MSI: DEL for motherboards and PCs
- Microsoft Surface Tablets: Press and hold volume up button
- Origin PC: F2
- Samsung: F2
- Toshiba: F2
2. 软件中心问题
Ubuntu 20.04 默认把软件中心换成了 snap, 感觉 snap 应用老出状况, snap 应用不但体积大, 安装好的应用还不时就崩溃, 所以如果要把电脑里的所有 snap 应用全部替换了, snapd 也卸载了
sudo apt install ubuntu-software
sudo snap remove snap-store
sudo apt purge snapd
3. 安装Barrier
Barrier 是一个免费的开源软件,可以轻松地通过本地网络在运行 Windows、Linux 和 macOS 的机器之间共享鼠标和键盘。
sudo apt update
sudo apt upgrade
sudo apt install barrier
- Barrier服务端设置(共享键鼠)
- Barrier客户端设置(使用另外一台电脑的键鼠)
4. 设置中文输入法
- 删除fcitx
sudo apt remove fcitx
- 安装ibus-libpinyin
sudo apt install ibus-libpinyin
sudo apt install ibus-clutter
- “语言支持” 里更改"键盘输入法系统":
- 重启系统
5. 安装WPS
- 下载 wps官网下载地址:www.wps.cn/product/wps… 点击“立即下载”,选择“64位Deb格式”下的Forx64
- 安装
sudo dpkg -i wps-office_11.1.0.11664_amd64.deb
6. Python 开发环境
- Anaconda 虚拟环境
- 官网下载 Anaconda(x86) 脚本,本文选择了 Python 3.9 版本。该版本是指虚拟环境中的默认 Python 版本,与系统的 Python 版本无关。
# 右击安装包所在文件夹的空白位置,选择Open Terminal打开终端或 cd 至该文件夹; cd ~/Downloads bash Anaconda3-2022.10-Linux-x86_64.sh- 安装过程中根据提示输入即可:
Please, press ENTER to continue: 按回车键Do you accept the license terms? [yes|no]: 输入 yes[/home/sparkai/miniconda3]>>>: 回车Do you wish the installer to initialize Anaconda3 by running conda init? [yes|no]: 输入 yes
- Conda 常用命令
- 创建环境:
conda create -n <环境名> python=3.8 - 显示环境:
conda env list - 激活环境:
conda activate <环境名> - 退出环境:
conda deactivate - 拷贝环境:
conda create -n <环境名> --clone <旧环境名> - 删除环境:
conda remove -n <环境名> --all
- 创建环境:
- 安装VScode
官网下载安装包,直接软件中心安装
7. CUDA Toolkit
- NVIDIA 驱动安装
-
方法一:软件和更新 >>> 附加驱动 >>> 选择对应版本的驱动(510版)
-
方法二:
- 从官网下载510版驱动,或执行命令:
cd ~/Downloads wget https://us.download.nvidia.com/XFree86/Linux-x86_64/510.47.03/NVIDIA-Linux-x86_64-510.47.03.run- 禁用 Nouveau 驱动:
- 查看 nouveau:
lsmod | grep nouveau - 加入黑名单 :
BLACKLIST=/etc/modprobe.d/blacklist-nouveau.conf sudo touch ${BLACKLIST} echo "blacklist nouveau" | sudo tee ${BLACKLIST} echo "options nouveau modeset=0" | sudo tee -a ${BLACKLIST} - 查看 nouveau:
- 更新 initramfs:
sudo update-initramfs -u - 重启系统:
sudo reboot - 安装驱动:
cd ~/Downloads chmod 755 NVIDIA-Linux-x86_64-510.47.03.run sudo ./NVIDIA-Linux-x86_64-510.47.03.run
-
- CUDA Toolkit 安装
-
CUDA 是一套集合了驱动、工具库、软件开发套件以及应用编程接口于一体的统一的计算平台。使用 CUDA 可以使开发人员利用 NVIDIA GPU 进行高效的并行计算。要想使用 CUDA, 首先要加入 NVIDIA Developer Program,使用邮箱注册并登录即可。
-
安装前检查
- 你当然可以直接进入官网,下载并直接安装 CUDA,但这里还是推荐你执行一些检查再安装。
- 检查显卡是否支持 CUDA:
lspci | grep -i nvidia- 如果没有任何输出,则执行
update-pciids更新硬件库,并再次执行上述命令 - 如果显卡来源于 NVIDIA,且包含在 developer.nvidia.com/cuda-gpus 中,则显卡支持 CUDA。
- 检查系统是否支持 CUDA
uname -m && cat /etc/*release- CUDA Toolkit 需求的 Linux 系统: docs.nvidia.com/cuda/cuda-t…
- 是否安装 GCC
gcc --version
- 检查系统内核头文件
- CUDA 驱动要求运行时的内核版本与安装时的一致,否则将要重装 CUDA 驱动。
- 查看系统内核:
uname -r - 安装内核头文件:
sudo apt-get install linux-headers-$(uname -r)
- 检查显卡是否支持 CUDA:
- 你当然可以直接进入官网,下载并直接安装 CUDA,但这里还是推荐你执行一些检查再安装。
-
安装 CUDA Toolkit
CUDA Toolkit 中包含了 CUDA Driver 以及用于构建 CUDA 应用的 工具 和 库文件、头文件 等内容。支持两种安装方式,可以选择其中任何一种:
-
特定于发行版的安装包(RPM and Deb packages)
- 对接 Ubuntu 本地包管理系统
-
独立于发行版的安装包(runfile packages)
- 可支持很多 Linux 发行版,但无法利用特定发行版的本地包管理系统
-
Runfile 安装步骤:
- 下载 CUDA Toolkit 11.6 Update 1 并安装:
cd ~/Downloads wget https://developer.download.nvidia.com/compute/cuda/11.6.1/local_installers/cuda_11.6.1_510.47.03_linux.run sudo sh cuda_11.6.1_510.47.03_linux.run注意: 安装选项中要去掉 Driver,因为已经单独安装过了。
当看到如下提示,则安装成功:
-
Deb 安装步骤:
- 下载 CUDA Toolkit ,依次选择 Linux -> x86_64 -> 20.04 -> deb (local)
网页给出了下载和安装脚本(这里只下载)。本文安装的版本是 CUDA Toolkit 11.6 Update 1。
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/cuda-ubuntu2004.pin sudo mv cuda-ubuntu2004.pin /etc/apt/preferences.d/cuda-repository-pin-600- [可选] 验证 MD5,CUDA 11.6.1 的 MD5 在这里
md5sum cuda-repo-ubuntu2004-11-7-local_11.7.0-515.43.04-1_amd64.deb- 删除 /etc/X11/xorg.conf 或将 /etc/X11/xorg.conf.d/00-nvidia.conf 的内容添加到 xorg.conf。 CUDA Toolkit 依赖自动生成的 xorg.conf 文件,如果自定义创建文件存在,那么 CUDA 驱动无法正常工作。
- 删除旧的 CUDA Toolkit。若设备之前通过 runfile 安装了旧版 CUDA Toolkit,则需要必须手动删除, Deb 安装的则可以不删除:
# 删除 Toolkit runfile sudo /usr/local/cuda-<版本>/bin/cuda-uninstaller # 删除 Driver runfile sudo /usr/bin/nvidia-uninstall # 删除 Deb sudo apt-get --purge remove <package_name>- 安装 CUDA:
# 删除过期签名秘钥 sudo apt-key del 7fa2af80` # 安装本地仓库至文件系统 sudo dpkg -i cuda-repo-ubuntu2004-11-7-local_11.7.0-515.43.04-1_amd64.deb # 注册临时公共 GPG 密钥 sudo cp /var/cuda-repo-ubuntu2004-11-7-local/cuda-*-keyring.gpg /usr/share/keyrings/ # 更新仓库缓存,安装 CUDA 并重启 sudo apt-get update sudo apt-get install cuda sudo reboot
-
-
配置环境变量
安装完成之后,执行如下操作:
# 安装Vim sudo apt-get install vim-gtk # Vim美化 sudo vim /etc/vim/vimrc sudo vim /etc/profile.d/cuda-conf.sh # 按e键 ,进入编辑,把光标移到最后一行 # 增加如下内容 export PATH=/usr/local/cuda-11.6/bin${PATH:+:${PATH}} # runfile 安装还需要增加如下内容 # 64-bit 系统 export LD_LIBRARY_PATH=/usr/local/cuda-11.6/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}} # 32-bit 系统 export LD_LIBRARY_PATH=/usr/local/cuda-11.6/lib${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}} # 按下Esc键,再输入:wq,保存并退出,下次重启后就会生效了-
删除 CUDA 和 显卡驱动
要想完全删除 CUDA 和 驱动,可以执行如下命令。
# 删除 CUDA Toolkit: sudo apt-get --purge remove "*cuda*" "*cublas*" "*cufft*" "*cufile*" "*curand*" \ "*cusolver*" "*cusparse*" "*gds-tools*" "*npp*" "*nvjpeg*" "nsight*" # 删除显卡驱动 sudo apt-get --purge remove "*nvidia*" sudo apt-get autoremove -
8. CuDNN
安装前从链接查看最新 CuDNN 依赖的 CUDA 版本 和 GPU 架构。 与 CUDA Toolkit 类似,CuDNN 同样提供了多种方法安装。本文只给出 Tar 文件安装方法,该方法具有更好的灵活性,更多安装方式参考官方教程。
安装步骤:
-
确保安装了 CUDA Toolkit
-
安装 zlib:
sudo apt-get install zlib1g -
官网下载合适版本的 Linux x86_64 (Tar) 文件(需要登录),老版本的点这,本文使用了 CuDNN v8.7.0 (November 28th, 2022) for CUDA 11.x
-
执行脚本安装:
tar -xvf cudnn-linux-x86_64-8.7.0.84_cuda11-archive.tar.xz cudnn-linux-x86_64-8.x.x.x_cudaX.Y-archive.tar.xz sudo cp cudnn-*-archive/include/cudnn*.h /usr/local/cuda/include sudo cp -P cudnn-*-archive/lib/libcudnn* /usr/local/cuda/lib64 sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn* -
如果你的设备装备了多个版本的 CuDNN,要切换到版本:
sudo update-alternatives --config libcudnn
9. Pytorch
-
修改conda的下载源
添加清华源
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/ conda config --set show_channel_urls yes conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/msys2/ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/bioconda/ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/menpo/ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/ -
建一个anaconda环境
这是新建一个名为torch13的环境,python版本为3.8,可根据需要更改
conda create -n torch13 python=3.8
# 激活环境
conda activate torch13
# 如果想要退出这个环境,可以使用下面的命令
conda deactivate torch13
- 下载pytorch
pytorch的官网:pytorch.org/get-started…
conda install pytorch torchvision torchaudio pytorch-cuda=11.6 -c pytorch -c nvidia
-
验证是否安装成功
查看pytorch是否安装成功:
python import torch torch.rand(2,2) torch.__version__ #查看pytorch版本