当前位置: 首页 > news >正文

NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the lat

执行:nvidia-smi

Ubuntu16.04的系统,使用nvidia-smi就出来详细显卡信息了,但是过了段时间,再使用指令就出现这样的提示:NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

重启了之后还是这样!!!

 

经过查找资料和实践验证,最后确定是:

是内核版本太高的问题,然后修改默认开机启动的内核版本;或者进入 grub菜单 ,选择advance option for Ubuntu查看子菜单  选择要进入的内核版;

 

一、问题描述:

Ubuntu16.04下已经成功搭建好了caffe环境(包括cuda、NVIDIA驱动、cudnn、opencv等都已经安装成功了),并且测试程序已经通过。而且已经使用caffe环境有一段时间了。但是突然有一天跑程序出现如下错误:

Check failed: error == cudaSuccess (30 vs. 0)  unknown error
*** Check failure stack trace: ***

具体内容如下:

然后,我执行了nvidia-smi 命令,出错:

$ nvidia-smi


NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

 

(注:出现这种情况之前,系统有弹出窗口询问是否更新,具体更新什么忘记了,我直接关闭了该提示窗口。然后等下一次开机后就出现了该情况。)

 

二、解决问题过程:

https://blog.csdn.net/weixin_42084747/article/details/84371079

本人电脑win10+ubuntu16.04双系统

开机grub界面是:

默认是启动Ubuntu

 

1、开机进入grub界面,选择默认选项Ubuntu,进入系统。

执行:

uname -a

nvidia-smi

结果如下:

NVIDIA驱动出错:

NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

 

2、开机进入grub引导界面,选择Advanced options for Ubuntu:

 

Ubuntu
Advanced options for Ubuntu
Windows 10 (loader) (on /dev/sda1)
system setup


选择Advanced options for Ubuntu后,进入其子菜单,如下图所示:

选择 Linux 4.15.0-42-generic 的内核,进入系统。

执行如下命令:

uname -r

nvidia-smi

成功!如下图:

 

3、问题总结:

NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

问题分析:
NVIDIA驱动是在低版本的时候安装,由于系统更新,内核版本升级导致NVIDIA无法应用在高内核版本

所以,说明是内核版本的问题,选择低版本的内核即可。

本人亲测可行!!!

 

4、修改Ubuntu默认开机启动的内核版本

http://forum.ubuntu.org.cn/viewtopic.php?t=486436

终端执行:

sudo gedit /etc/default/grub

GRUB_DEFAULT=0

修改为:

GRUB_DEFAULT="1> 3"

(注:1 代表主菜单的第二项Advanced options for Ubuntu;3代表1项目下面对应的子菜单里面的第4项;)

修改后保存退出,执行:

sudo update-grub

重新启动,现在应该默认启动旧的内核版本。

查看内核版本

$ uname -r
4.15.0-42-generic

 

 

参考链接:

https://blog.csdn.net/weixin_42084747/article/details/84371079

http://forum.ubuntu.org.cn/viewtopic.php?t=486436 

http://s1nh.org/post/littlebug/

https://www.cnblogs.com/feifanrensheng/p/9974249.html

 

相关文章:

  • ~/caffe$ make all -j8 Makefile:606: recipe for target '.build_release/cuda/src/caffe/solvers/adam_s
  • File /usr/bin/pip, line 9, in module from pip import main ImportError: cannot import name m
  • python:pycharm 读取项目中的文件:相对路径和绝对路径
  • python数组复制(转载)
  • ubuntu16.04 caffe编译过程记录
  • pip安装提示:fatal error in launcher:unable to create process using。
  • python+VTK 安装教程
  • caffe 训练过程中输出log日志,并可视化loss和accuracy曲线
  • maven工程依赖的jar包,在本地仓库有,但是pom.xml文件却报错找不到jar包;IDEA运行项目类文件报错:java: 错误: 无效的源发行版:16
  • c++小细节/技巧
  • 范德蒙行列式
  • 代数余子式之和计算技巧
  • 伴随矩阵A*
  • 初等矩阵
  • 矩阵的秩
  • 【Leetcode】101. 对称二叉树
  • Asm.js的简单介绍
  • docker python 配置
  • ECMAScript入门(七)--Module语法
  • JavaScript 基础知识 - 入门篇(一)
  • Nodejs和JavaWeb协助开发
  • overflow: hidden IE7无效
  • Redux系列x:源码分析
  • Transformer-XL: Unleashing the Potential of Attention Models
  • vuex 学习笔记 01
  • Vue学习第二天
  • windows-nginx-https-本地配置
  • 工作中总结前端开发流程--vue项目
  • 名企6年Java程序员的工作总结,写给在迷茫中的你!
  • 用jquery写贪吃蛇
  • 不要一棍子打翻所有黑盒模型,其实可以让它们发挥作用 ...
  • 回归生活:清理微信公众号
  • ​MPV,汽车产品里一个特殊品类的进化过程
  • ​虚拟化系列介绍(十)
  • #NOIP 2014# day.1 T3 飞扬的小鸟 bird
  • #数学建模# 线性规划问题的Matlab求解
  • $ git push -u origin master 推送到远程库出错
  • (02)vite环境变量配置
  • (1)(1.8) MSP(MultiWii 串行协议)(4.1 版)
  • (1)Map集合 (2)异常机制 (3)File类 (4)I/O流
  • (173)FPGA约束:单周期时序分析或默认时序分析
  • (Mirage系列之二)VMware Horizon Mirage的经典用户用例及真实案例分析
  • (附源码)ssm教师工作量核算统计系统 毕业设计 162307
  • (牛客腾讯思维编程题)编码编码分组打印下标题目分析
  • (三)mysql_MYSQL(三)
  • (四)Android布局类型(线性布局LinearLayout)
  • (未解决)macOS matplotlib 中文是方框
  • (一)为什么要选择C++
  • (转)Unity3DUnity3D在android下调试
  • .htaccess 强制https 单独排除某个目录
  • .net core 控制台应用程序读取配置文件app.config
  • .NET Micro Framework初体验
  • .Net Web项目创建比较不错的参考文章
  • .NET 使用 ILMerge 合并多个程序集,避免引入额外的依赖
  • .NET/C# 的字符串暂存池