寒武纪显卡命令

418 阅读3分钟

主要信息查看方法

查看寒武纪MLU卡的信息,最直接的方法是使用寒武纪提供的cnmon命令。如果您已经安装了寒武纪的驱动和工具链(通常位于/usr/local/neuware),可以尝试运行:

bash

/usr/local/neuware/bin/cnmon

或者直接:

bash

cnmon

如果系统能找到这个命令,它会显示一个监控界面,包含MLU的利用率、显存(MLU内存)使用情况、温度、卡型号等关键信息,界面和 nvidia-smi 类似。


🔍 其他辅助查看手段

如果 cnmon 命令还不可用,或者您想从系统层面确认设备是否存在,可以尝试以下方法:

  1. 使用 lspci 命令查找设备
    在终端中输入以下命令,来搜索所有已连接的PCI设备,并筛选出寒武纪的设备:

    bash

    lspci | grep -i cabc    # 尝试用 'cabc' 过滤,这是寒武纪的PCI厂商标识之一:cite[1]
    

    或者更广泛地搜索:

    bash

    lspci | grep -i 'cambricon|mlu'
    

    如果成功识别,输出会包含寒武纪MLU卡的PCI设备信息。

  2. 检查驱动加载情况
    使用 lsmod 命令可以查看已加载的内核模块,通过 grep 过滤出寒武纪相关的模块:

    bash

    lsmod | grep -i 'cambricon|cn'
    

    如果有类似 cambricon 或 cn 前缀的模块(例如 cndrv)显示,通常意味着驱动模块已加载。

  3. 查看寒武纪设备文件
    检查 /dev 目录下是否存在寒武纪的设备文件,这是驱动安装成功的一个重要标志

    bash

    ls -l /dev/cambricon*
    

    常见的设备文件是 /dev/cambricon_dev0(第一张卡)等。


📊 寒武纪MLU信息查看方式汇总

为了让您更清晰地了解,我将查看寒武纪MLU卡信息的主要命令和用途整理如下:

查看目标主要命令/方法作用说明
实时状态(利用率、显存、温度)cnmon寒武纪官方监控工具,类似 nvidia-smi,最直接全面
PCI设备识别`lspcigrep -i 'cambriconmlucabc'`从系统PCI总线层面确认硬件是否被识别
内核驱动模块`lsmodgrep -i 'cambriconcn'`检查驱动模块(如 cndrv)是否已加载
设备文件节点ls -l /dev/cambricon*检查驱动是否正确创建了设备文件(如 /dev/cambricon_dev0

⚠️ 重要提醒

  • 驱动是关键:以上所有寒武纪专用命令(尤其是 cnmon)的可用性,都取决于是否已正确安装寒武纪的驱动程序(DKMS方式)和Neuware基础工具包。如果尚未安装,您需要先安装它们。
  • 安装资源:寒武纪的驱动和SDK通常需要从寒武纪官方或其提供的渠道获取.
  • 环境变量:安装完成后,记得设置环境变量(如 PATHLD_LIBRARY_PATH)并执行 source ~/.bashrc 使其生效,否则系统可能找不到 cnmon 等命令

💎 总结

查看寒武纪MLU卡的信息,首推使用官方的 cnmon 命令。如果该命令尚未可用,您可以依次通过:

  1. lspci 命令确认硬件是否被系统识别
  2. lsmod 和检查 /dev 目录设备文件来确认驱动状态