在ubuntu18.04上安装了NVIDIA驱动。结果安装好之后部署完项目准备启动时却意外发现驱动挂掉了。报错:
nvidia-smi has failed because it couldn't communicate with the nvidia driver. make sure that the latest nvidia driver is installed and running

经过多次百度,谷歌各种方法发现都无法解决,什么内核版本不对啊之类的。然后我就纳闷了怎么安装驱动之后还好好的,我准备部署项目了就挂掉了呢。最后发现原因就出在我安装cuda10.0的步骤上出了问题。在安装cuda10.0时,**会再一次安装NVIDIA驱动!**就是这重复安装驱动导致了驱动挂掉了
如果你是使用deb安装的,可能是如下画面:这时候选择no

如果是使用run文件安装的,是如下画面。选择no(推荐使用 run 格式的cuda,这样可以看到详细的安装信息)

重新安装之后,果然驱动能够正常显示了:

当然,大家遇到了这个错误也不一定会是我这个问题,可能用网上那些办法也就解决了。提供一个参考,看到网络上并没有类似于我相同的错误原因,因此记录一下