最近在准备机器训练图集,手头机器是RTX 3070Ti+Tesla P40的配置。
前景摘要:
1、首次装的是grid驱动(驱动链接),顺序是先用DDU删干净3070Ti的驱动,再安装P40的grid,重启进系统再装studio驱动,驱动的版本号(537.58)也都尽可能接近。
2、安装grid驱动可以修改注册表将P40设置为WDDM模式,这样也可以作为正常独显来使用。
问题:
1、刚安装完的时候一切正常,但再使用了一天不到后,重启无法进系统,或者进系统驱动加载失败,马上就nvlddmkm.sys蓝屏。
2、改用data-center驱动,修改P40工作模式为WDDM模式,情况同问题1。
3、在TCC模式下,WSL2无法调用P40,会出现
nvidia-smi -pm 1
Unable to determine the device handle for GPU0000:02:00.0: Unknown Error
解决方案:
不使用GRID驱动,先安装data-center驱动,再安装版本近似studio驱动,完成双卡的驱动安装。
再桌面创建两个注册表修改项切换WDDM和TCC模式,最好是关机或者重启前切换到TCC模式,炼丹的时候切换在WDDM模式上。
这样在win环境或者wsl下都可以正常驱动P40。
ps:
1.data-center的驱动按照grid驱动的步骤来修改WDDM也能够正常使用,但就是面板里缺少了vGPU的选项。
2.有可能降低驱动版本就不会开机黑屏。