安装GPU驱动

操作场景

当您使用自定义镜像创建GPU实例后，请在实例内部手动安装GPU驱动，确保可以调用GPU云服务器上搭载的物理GPU卡。

说明

Linux操作系统的驱动安装采用 Shell 脚本安装方式，适用于任何 Linux 发行版，包括 CentOS、Ubuntu 等。

远程连接GPU实例并登录，具体操作请参考登录Linux实例小节。
登录NVIDIA 驱动下载。
选择操作系统和CUDA工具包版本，并单击【SEARCH】搜寻驱动，选择要下载的驱动版本。以Tesla T4为例，如下图所示：

说明：操作系统（Operating System）选择 Linux 64-bit 即表示下载 shell 安装文件。如果选择具体的发行版，则下载的文件是对应的包安装文件。
选择特定的版本进入下载页面，单击【DOWNLOAD】。如下图所示：
如有填写个人信息的页面可选择直接跳过，当出现以下页面时，右键单击【AGREE&DOWNLOAD】并选择菜单中的【复制链接地址】。如下图所示：
登录GPU实例，使用wget命令，粘贴步骤5中已获取的链接地址，下载安装包（需要GPU实例能访问外网），例如wget https://us.download.nvidia.com/tesla/450.80.02/NVIDIA-Linux-x86_64-450.80.02.run。
执行以下命令，运行驱动安装程序，并按提示进行后续操作。
sh NVIDIA-Linux-x86_64-450.80.02.run
安装完成后，执行以下命令进行验证。
nvidia-smi
如返回信息类似下图中的 GPU 信息，则说明驱动安装成功。

CUDA（Compute Unified Device Architecture）是 NVIDIA 推出的运算平台，使 GPU 能够解决复杂的计算问题，它包含了 CUDA 指令集架构（ISA）以及 GPU 内部的并行计算引擎。

GPU 云服务器采用 NVIDIA 显卡，则需要安装 CUDA 开发运行环境。建议您安装最新版本的CUDA驱动，适用于任何 Linux和Windows 发行版，包括 CentOS、Ubuntu、Debian、Windows等。

当您使用未内置CUDA工具包的自定义镜像创建GPU实例后，请在实例内部手动安装CUDA工具包。本文以 CUDA 11.0 为例，您可参考以下步骤进行安装。

远程连接云服务器并登录，具体操作请参考登录Linux实例小节。
登录CUDA下载，选择与GPU实例匹配的操作系统和版本。

安装cuda有2种方式：runfile和deb方式。建议使用runfile安装，这种方式不需要处理依赖包，更简单快捷。
选择完成后，出现以下页面，参考提示在GPU后台执行命令。

执行第二条命令时，请参考以下说明依次完成操作：
1. 在安装界面输入“accept”，回车进入下一步。
2. 按键盘上下键选中【Install】，回车确认，开始安装。
  
  说明
  
  如果您的云服务器在创建时已默认安装GPU驱动，此处请按回车键取消勾选GPU驱动后再安装，如下图所示。
安装完成以后，执行/usr/local/cuda/bin/nvcc -V命令可以看到CUDA版本，说明CUDA已安装成功。