driver&CUDA安装

225 阅读4分钟

安装GPU驱动

操作场景

当您使用自定义镜像创建GPU实例后,请在实例内部手动安装GPU驱动,确保可以调用GPU云服务器上搭载的物理GPU卡。

说明

  • GPU实例的GPU卡目前均为Nvidia Tesla系列,以下步骤适用于安装此系列GPU驱动。
  • 请确认GPU驱动版本与CUDA工具包版本兼容,详情可查看NVIDIA CUDA Toolkit Release Notes

前提条件

  • 您已购买GPU实例,并为其绑定公网IP,使其具备访问公网的能力。

安装GPU驱动(Linux)

Linux操作系统的驱动安装采用 Shell 脚本安装方式,适用于任何 Linux 发行版,包括 CentOS、Ubuntu 等。

  1. 远程连接GPU实例并登录,具体操作请参考登录Linux实例小节。

  2. 登录NVIDIA 驱动下载 。

  3. 选择操作系统和CUDA工具包版本,并单击【SEARCH】搜寻驱动,选择要下载的驱动版本。以Tesla T4为例,如下图所示:
    image

    说明 :操作系统(Operating System)选择 Linux 64-bit 即表示下载 shell 安装文件。如果选择具体的发行版,则下载的文件是对应的包安装文件。

  4. 选择特定的版本进入下载页面,单击【DOWNLOAD】。如下图所示:
    image

  5. 如有填写个人信息的页面可选择直接跳过,当出现以下页面时,右键单击【AGREE&DOWNLOAD】并选择菜单中的【复制链接地址】。如下图所示:
    image
    image

  6. 登录GPU实例,使用wget命令,粘贴步骤5中已获取的链接地址,下载安装包(需要GPU实例能访问外网),例如wget https://us.download.nvidia.com/tesla/450.80.02/NVIDIA-Linux-x86_64-450.80.02.run

  7. 执行以下命令,运行驱动安装程序,并按提示进行后续操作。
    sh NVIDIA-Linux-x86_64-450.80.02.run

  8. 安装完成后,执行以下命令进行验证。
    nvidia-smi
    如返回信息类似下图中的 GPU 信息,则说明驱动安装成功。
    image

安装GPU驱动(Windows) #

  1. 远程连接GPU实例并登录,具体操作请参考登录Windows实例
  2. 在远程桌面中,通过浏览器访问NVIDIA 驱动下载
  3. 选择操作系统和CUDA工具包版本,并单击【SEARCH】搜寻驱动,选择要下载的驱动版本。以Tesla T4为例,如下图所示:
    image
  4. 选择特定的版本进入下载页面,单击【DOWNLOAD】。
  5. 如有填写个人信息的页面可选择直接跳过,当出现以下页面时,单击【AGREE&DOWNLOAD】下载驱动。
  6. 下载完成后,打开驱动所在文件夹,双击安装文件,按提示完成安装。
  7. 安装完成后,在桌面单击右键,可以看到“NVIDIA控制面板”程序,单击后选择控制面板左下角的“系统信息”按钮,可以查看驱动版本。
    image

安装CUDA工具包

CUDA工具包介绍 

CUDA(Compute Unified Device Architecture)是 NVIDIA 推出的运算平台,使 GPU 能够解决复杂的计算问题,它包含了 CUDA 指令集架构(ISA)以及 GPU 内部的并行计算引擎。

GPU 云服务器采用 NVIDIA 显卡,则需要安装 CUDA 开发运行环境。建议您安装最新版本的CUDA驱动,适用于任何 Linux和Windows 发行版,包括 CentOS、Ubuntu、Debian、Windows等。

当您使用未内置CUDA工具包的自定义镜像创建GPU实例后,请在实例内部手动安装CUDA工具包。本文以 CUDA 11.0 为例,您可参考以下步骤进行安装。

前提条件 

  • 您已购买GPU实例,并为其绑定公网IP,使其具备访问公网的能力。

安装CUDA工具包(Linux) #

  1. 远程连接云服务器并登录,具体操作请参考登录Linux实例小节。

  2. 登录CUDA下载,选择与GPU实例匹配的操作系统和版本。

    安装cuda有2种方式:runfile和deb方式。建议使用runfile安装,这种方式不需要处理依赖包,更简单快捷。

    image

  3. 选择完成后,出现以下页面,参考提示在GPU后台执行命令。
    image
    执行第二条命令时,请参考以下说明依次完成操作:

    1. 在安装界面输入“accept”,回车进入下一步。

    2. 按键盘上下键选中【Install】,回车确认,开始安装。

      说明

      如果您的云服务器在创建时已默认安装GPU驱动,此处请按回车键取消勾选GPU驱动后再安装,如下图所示。
      alt

  4. 安装完成以后,执行/usr/local/cuda/bin/nvcc -V命令可以看到CUDA版本,说明CUDA已安装成功。

    image

安装CUDA工具包(Windows)

  1. 远程连接云服务器并登录,具体操作请参考登录Windows实例
  2. 在远程桌面中,通过浏览器访问CUDA下载,选择与GPU实例匹配的操作系统和版本。
    image
  3. 选择完成后,出现以下页面,单击“Base Installer”右侧的“Download”按钮,下载CUDA。
    image
  4. 下载完成后,打开工具包所在文件夹,双击安装文件,按提示完成安装。
  5. 安装完成后,在桌面单击右键,可以看到“NVIDIA控制面板”程序,单击后选择控制面板左下角的“系统信息”按钮,选择“组件”页签,可以查看CUDA版本。
    image