nvidia cuda10 驱动兼容问题

4,678 阅读1分钟

问题:

在1080TI ubuntu上,使用docker 运行GPU版本的tensorflow,报如下错误:

docker: Error response from daemon: OCI runtime create failed: container_linux.go:344: starting
container process caused "process_linux.go:424: container init caused \"process_linux.go:407: running
prestart hook 1 caused \\\"error running hook: exit status 1, stdout: , stderr: exec command: 
[/usr/bin/nvidia-container-cli --load-kmods configure --ldconfig=@/sbin/ldconfig.real --device=all --
compute --utility --require=cuda>=10.0 brand=tesla,driver>=384,driver<385 --pid=7142 
/var/lib/docker/overlay2/c2f4ac7d7d905051e77682447a97f563cbdf7ccf2fe43afccdb521350adab0f4/mer
ged]\\\\nnvidia-container-cli: requirement error: unsatisfied condition: brand = tesla\\\\n\\\"\"": unknown.

原因:

显卡驱动版本和cuda10不兼容(版本信息)
查看驱动版本命令:nvidia-smi

后继

更新驱动也出现相同问题 运行下面的命令

nvidia-container-cli  -d /dev/tty info

发现没有cuda文件,运行nvidia-smi也不显示cuda版本
运行
sudo apt-get install cuda-runtime-10-0
成功修复