当前位置: 首页 > news >正文

nvidia-smi 随机掉卡,error,禁用GSP功能

问题

NVIDIA 驱动中默认开启加载GPU卡的GSP功能,会随机导致在执行nvidia-smi命令的时候读取GPU卡为ERR状态,或者导致smi命令卡死;
如下图,以A800为例,Centos系统;
在这里插入图片描述

涉及到的包含以下型号的GPU卡;
在这里插入图片描述

解决方案

禁用GPU卡GSP功能;下面以CentOS系统为例

1、添加参数到系统下的配置文件中;

echo 'options nvidia NVreg_EnableGpuFirmware=0' > /etc/modprobe.d/nvidia-gsp.conf

写入配置文件后,检查配置文件中的参数是否正确:

cat /etc/modprobe.d/nvidia-gsp.conf
# 正常显示:NVreg_EnableGpuFirmware=0

2、添加完参数之后,然后直接重启机器后生效;

3、检查GSP功能是否被禁用,显示状态为NA,即为禁用状态;如果不显示NA,显示数字则未禁用成功:

nvidia-smi -q | grep -i gsp
# 正常显示:  GSP Firmware Version                  : N/A

附:CentOS和Ubuntu系统禁用GSP的参数:

查看系统

lsb_release -a

CentOS 的配置方法

echo 'options nvidia NVreg_EnableGpuFirmware=0' > /etc/modprobe.d/nvidia-gsp.conf

添加参数后请重启机器;

Ubuntu 的配置方法

sudo su -c 'echo options nvidia NVreg_EnableGpuFirmware=0 > /etc/modprobe.d/nvidia-gsp.conf'
sudo update-initramfs  -u

添加完参数,更新完initramfs后请重启机器。

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • Day22_K8S
  • 被低估的SQL
  • 〖open-mmlab: MMDetection〗解析文件:configs/_base_/schedules
  • @Value读取properties中文乱码解决方案
  • CTK框架(三): 插件的安装
  • 记录|单例模式小记
  • Spring表达式语言(SPEL)(05)
  • 51单片机-串口通信(单片机和PC互发数据)
  • 软件部署-Docker容器化技术
  • 探索Python的数学魔法:Numpy库的神秘力量
  • 二维空间向量的p范数等密度轨迹
  • 负载均衡--资源申请说明(三)
  • 基于苹果Vision Pro的AI NeRF方案:MetalSplatter
  • SpringBoot3+Vue3开发商店上货管理系统
  • WordPress上可以内容替换的插件
  • gcc介绍及安装
  • java架构面试锦集:开源框架+并发+数据结构+大企必备面试题
  • Mybatis初体验
  • MyEclipse 8.0 GA 搭建 Struts2 + Spring2 + Hibernate3 (测试)
  • mysql 数据库四种事务隔离级别
  • SpringCloud(第 039 篇)链接Mysql数据库,通过JpaRepository编写数据库访问
  • vue的全局变量和全局拦截请求器
  • Webpack 4x 之路 ( 四 )
  • 回顾2016
  • 简单易用的leetcode开发测试工具(npm)
  • 与 ConTeXt MkIV 官方文档的接驳
  • 原创:新手布局福音!微信小程序使用flex的一些基础样式属性(一)
  • media数据库操作,可以进行增删改查,实现回收站,隐私照片功能 SharedPreferences存储地址:
  • 3月27日云栖精选夜读 | 从 “城市大脑”实践,瞭望未来城市源起 ...
  • 策略 : 一文教你成为人工智能(AI)领域专家
  • 正则表达式-基础知识Review
  • ​七周四次课(5月9日)iptables filter表案例、iptables nat表应用
  • #职场发展#其他
  • (function(){})()的分步解析
  • (Redis使用系列) SpringBoot 中对应2.0.x版本的Redis配置 一
  • (附源码)c#+winform实现远程开机(广域网可用)
  • (附源码)node.js知识分享网站 毕业设计 202038
  • (免费领源码)python#django#mysql校园校园宿舍管理系统84831-计算机毕业设计项目选题推荐
  • (数据结构)顺序表的定义
  • (五)activiti-modeler 编辑器初步优化
  • (转)es进行聚合操作时提示Fielddata is disabled on text fields by default
  • (转)程序员技术练级攻略
  • .cfg\.dat\.mak(持续补充)
  • .NET 6 Mysql Canal (CDC 增量同步,捕获变更数据) 案例版
  • .NET Core 中的路径问题
  • .NET/C# 使用 SpanT 为字符串处理提升性能
  • .net2005怎么读string形的xml,不是xml文件。
  • .NET8.0 AOT 经验分享 FreeSql/FreeRedis/FreeScheduler 均已通过测试
  • .NetCore实践篇:分布式监控Zipkin持久化之殇
  • @EnableWebSecurity 注解的用途及适用场景
  • @JsonSerialize注解的使用
  • [AAuto]给百宝箱增加娱乐功能
  • [AutoSar]状态管理(五)Dcm与BswM、EcuM的复位实现
  • [BUUCTF NewStarCTF 2023 公开赛道] week3 crypto/pwn
  • [C++]类和对象【下】