NVIDIA-SMI系列命令详解(1)-概述

4,685 阅读2分钟

nvidia-smi简介

本文为NVIDIA-SMI系列命令详解第一篇-概述,简单介绍了NVIDIA发布的GPU管理工具nvidia-smi命令。

nvidia-smi(也称为 NVSMI,全称NVIDIA System Management Interface)为来自 Fermi 和更高架构系列的 NVIDIA Tesla、Quadro、GRID 和 GeForce 设备提供监控和管理功能。 GeForce Titan 系列设备的大多数功能都支持,但为Geforce 品牌的其余产品提供的信息非常有限。

NVSMI 是一个跨平台工具,支持所有标准 NVIDIA 驱动程序支持的 Linux 发行版,以及从 Windows Server 2008 R2 开始的 64 位 Windows 版本。

Windows下程序位置:C:\Program Files\NVIDIACorporation\NVSMI\nvidia-smi.exe。

Linux下程序位置:/usr/bin/nvidia-smi,由于所在位置已经加入PATH路径,可直接输入nvidia-smi运行。

nvidia-smi命令的结果可以由用户通过标准输出直接使用,也可以通过 CSV 和 XML 格式的文件提供用于脚本目的。

请注意,NVSMI 的大部分功能是由底层基于 NVML C 的库提供的。有关 NVML 的更多信息,请参阅下面的 NVIDIA 开发人员网站链接。基于 NVML 的 python 包也可用。

NVML SDK:developer.nvidia.com/nvidia-mana…

Python 包:pypi.python.org/pypi/nvidia…

NVSMI 的输出不保证向后兼容。在编写任何必须跨 NVIDIA 驱动程序版本维护的工具时,应该首选向后兼容的NVML 和 Python 包。

nvidia-smi命令格式

nvidia-smi [OPTION1 [ARG1]] [OPTION2 [ARG2]] ...

nvidia-smi命令后面可以输入多个选项,每个选项可以附带1个或者0个参数,当nvidia-smi命令后面不输入任何选项时,即:

nvidia-smi

输出结果会直接在控制台显示所有GPU卡信息和运行在GPU卡上的进程信息,如下图所示:

image

nvidia-smi通用选项

nvidia-smi -h 

打印使用信息并退出。如图:

image

nvidia-smi概要选项

nvidia-smi -L, --list

列出系统中的每个 NVIDIA GPU 及其 UUID。如图:

image

nvidia-smi -B, --list-excluded-gpus

列出所有排除在系统中之外的 NVIDIA GPU 及其 UUID。如图:

image