atlas 800 3000 安装驱动

1,231 阅读1分钟

NPU 安装驱动

  1. 安装arm版本系统

    • 安装驱动之前,要安装麒麟arm版本系统
    • 创建HwHiAiUser用户。
     切换到root用户下,执行如下命令创建HwHiAiUser用户。
    
     groupadd HwHiAiUser           //创建HwHiAiUser用户属组
     useradd -g HwHiAiUser -d /home/HwHiAiUser -m HwHiAiUser            //创建HwHiAiUser用户,其属组为HwHiAiUse
     passwd HwHiAiUser            //设置非root用户密码
    
  2. 安装驱动

NPU型号是altas 300 ( 型号3000)

这里下载A300-3000-NPU_Driver-20.0.0-ARM64-CentOS7.6_gcc4.8.5.run

chmod +x A300-3000-NPU_Driver-20.0.0-ARM64-CentOS7.6_gcc4.8.5.run
./A300-3000-NPU_Driver-20.0.0-ARM64-CentOS7.6_gcc4.8.5.run --full
reboot

常见问题

  • 常见问题:dkms environment check failed
  • 解决方式:
yum install -y  epel-release
yum install -y  dkms

  • 常见问题:
[ERROR]There has no /lib/modules/4.14.0-115.5.1.el7a.08.aarch64/updates/drv_pcie_host.ko, dkms install failed

  • 解决方式:

1. 运行 ./A300-3000-NPU_Driver-20.0.0-ARM64-CentOS7.6_gcc4.8.5.run --keep --noexec  在当前目录会解压生成run_package文件夹

2. 将 run_package/host_servers_setup.sh 的 第165行CentOS | EulerOS | BigCloud )改为CentOS | EulerOS | BigCloud | NeoKylin)

3.  将 run_package/driver/script/run_driver_dkms_install.sh 中的 dkms_output_check函数改为

dkms_output_check() {
    sys_dir=$(ko_output_absolute_path)
    if [ ! -d $sys_dir ]; then
        if [ ! -d $sys_dir ]; then
            log "[ERROR]dkms output is NONE, dkms failed"
            return 1
        fi
    fi

    sources=$targetdir/driver/kernel
    cat $sources/dkms.conf | grep BUILT_MODULE_NAME >ascend_dkms_output_tmp.log
    while read file
    do
        file=$(echo $file | awk -F '"' '{print $2}')
        #ls $sys_dir | grep $file.ko > /dev/null 2>&1
        ko_files=`find ${sys_dir}/../ -name "${file}.ko*"`
        if [ x${ko_files} == x"" ];then
            log "[ERROR]There has no $sys_dir/$file.ko, dkms install failed"
            return 1
        else
            for ko_file in ${ko_files}
            do
                log "[INFO]dkms output files : ${ko_file}"
                chmod 440 ${ko_file}
            done
            #chmod 440 $sys_dir/$file.ko*
        fi
    done < ascend_dkms_output_tmp.log
    rm -f ascend_dkms_output_tmp.log
    log "[INFO]dkms output files check success"
    return 0
}

4. 运行 bash --posix ./driver/script/install.sh --xx --xx --full

5. reboot

6. npu-smi info,正常会打印npu信息


  • 常见问题:

安装新版本驱动后,重启环境出现异常,dmesg信息报devdrv_device_driver到/home/bios路径下加载文件devdrv_device_driver, unable to open file: /home/bios/davinci_mini.fd

  • 解决方式:

1. dracut --force

2. reboot