当前位置: 首页 > news >正文

ESXI 6.7 环境 centos7.6 虚拟机安装tesla k80 显卡驱动失败问题解决

ESXI 6.7 环境 16.04虚拟机安装tesla k80 一切正常,但虚拟机重装了centos7.6后,驱动一直安装失败,报错如下:

换了多个驱动版本,问题依然存在。安装时指定 --no-kernel-module-source选项,仍然找不到显卡,不能和显卡通信。

后来解决方法如下      :

按常规设置新建虚拟机,添加PCI设备,如下图

坑1:无法打开虚拟机 CentOS 7 K80 的电源。内存设置无效: 内存预留 (sched.mem.min) 应该等于内存大小 (16384)。 单击此处了解更多详细信息。

解决方法:打勾☑️ 预留所有客户机内存(全部锁定)即可

 
坑2:无法打开虚拟机 CentOS 7 K80 的电源。模块“DevicePowerOn”打开电源失败。 单击此处了解更多详细信息。

这个问题折腾了我一阵子,有几个地方要改:

    1、物理机 (Dell R710) BIOS 中启用大于4G的内存映射 (Memory Mapped IO >4GB),这里就不弄图了,搜一下吧!
    2、 编辑虚拟机 - 虚拟机选项 - 引导选项 - 固件 - EFI (默认为 BIOS),此处一定注意!!
    3、编辑虚拟机 - 虚拟机选项 - 高级 - 配置参数 - 编辑配置... -- 点2次左上角的 [添加参数],此时会在列表的尾部会出现 2 条显示为 “单击以编辑键” 条目,如图:

   4、 配置hypervisor.cpuid.v0健值为 FALSE
   5、 配置 pciPassthru.use64bitMMIO 健值为 TRUE
   6、配置 pciPassthru.64bitMMIOSizeGB 键值为 48 ,这里的数值需要用GPU内存进行计算,我大致理解为 直通GPU的内存乘以四,我的卡为 双路12G ,映射一路,12*4 = 48,所以这里我写了48,如果理解有误,请大家联系我更正。
   7、 以上配置参考来源于 https://octo.vmware.com/enable-compute-accelerators-vsphere-6-5-machine-learning-hpc-workloads/
   8、 配好后像这样

 

经过以上配置,成功配置Nvidia Tesla K80 的直通

下面开始安装 显卡驱动。

    安装依赖库

    yum -y install gcc
    yum -y install epel-release
    yum -y install --enablerepo=epel dkms

     
    安装kernel-devel

    yum install kernel-devel
    yum install kernel-headers

系统名

uname -r

对应版本

yum list | grep kernel-devel

    检查nouveau驱动

lsmod | grep nouveau

    禁用nouveau驱动

修改/usr/lib/modprobe.d/dist-blacklist.conf文件,加入一行并保存

    #nvidia driver
     
    blacklist nouveau
    options nouveau modeset=0

    备份\重建原来的镜像文件

    mv     /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
     
    dracut /boot/initramfs-$(uname -r).img $(uname -r)

    重启

    安装NVIDIA驱动

    ./NVIDIA-Linux-x86_64-440.82.run --no-opengl-files --kernel-source-path=/usr/src/kernels/3.10.0-1160.2.2.el7.x86_64
  • 检查驱动情况
nvidia-smi

 一切正常 !!!

 

安装cuda10.1
sudo ./cuda_10.1.105_418.39_linux.run
不要安装driver
打开主目录下的 .bashrc文件添加如下路径
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-10.1/lib64
export PATH=$PATH:/usr/local/cuda-10.1/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda-10.1
source ~/.bashrc

安装cudnn7.6.5
sudo cp cuda/include/cudnn.h /usr/local/cuda/include/ 
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/ 
sudo chmod a+r /usr/local/cuda/include/cudnn.h 
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*
sudo ln -sf /usr/local/cuda-10.1/lib64/libcudnn.so.7.6.5 /usr/local/cuda-10.1/lib64/libcudnn.so.7

 

相关文章:

  • OWC绘图控件研究(1)
  • 升级到 Kubernetes v1.16 须知API问题总结
  • OWC绘图控件研究(2)
  • K8S pod异常状态处理
  • UPS FedEx DHL TNT
  • k8s 安装helm2 和 helm3
  • Happy Feet
  • Cython的基本用法
  • 计算字段 VS 视图
  • k8s secret 详细理解和使用
  • k8s中的kubeflow1.02安装过程记录
  • 在struts中html:select 标签的disabled属性中使用java代码
  • k8s 开发流程
  • 用Linux搞定了Windows中无法使用也无法修复的MP3!
  • centos7 k8s安装部署nvidia-docker2 排坑记录
  • JavaScript-如何实现克隆(clone)函数
  • 实现windows 窗体的自己画,网上摘抄的,学习了
  • download使用浅析
  • Java方法详解
  • JS 面试题总结
  • Mithril.js 入门介绍
  • npx命令介绍
  • NSTimer学习笔记
  • Redis学习笔记 - pipline(流水线、管道)
  • Redis在Web项目中的应用与实践
  • session共享问题解决方案
  • 回流、重绘及其优化
  • 技术胖1-4季视频复习— (看视频笔记)
  • 前端之Sass/Scss实战笔记
  • 区块链将重新定义世界
  • 如何在GitHub上创建个人博客
  • 思否第一天
  • 为物联网而生:高性能时间序列数据库HiTSDB商业化首发!
  • 赢得Docker挑战最佳实践
  • 06-01 点餐小程序前台界面搭建
  • hi-nginx-1.3.4编译安装
  • 翻译 | The Principles of OOD 面向对象设计原则
  • 扩展资源服务器解决oauth2 性能瓶颈
  • ​软考-高级-信息系统项目管理师教程 第四版【第19章-配置与变更管理-思维导图】​
  • ​油烟净化器电源安全,保障健康餐饮生活
  • ### Error querying database. Cause: com.mysql.jdbc.exceptions.jdbc4.CommunicationsException
  • (Mac上)使用Python进行matplotlib 画图时,中文显示不出来
  • (办公)springboot配置aop处理请求.
  • (第一天)包装对象、作用域、创建对象
  • (二)七种元启发算法(DBO、LO、SWO、COA、LSO、KOA、GRO)求解无人机路径规划MATLAB
  • (附源码)计算机毕业设计SSM智慧停车系统
  • (论文阅读11/100)Fast R-CNN
  • (七)Java对象在Hibernate持久化层的状态
  • (十八)devops持续集成开发——使用docker安装部署jenkins流水线服务
  • (未解决)macOS matplotlib 中文是方框
  • (原創) 物件導向與老子思想 (OO)
  • (转)shell调试方法
  • ./和../以及/和~之间的区别
  • .net mvc actionresult 返回字符串_.NET架构师知识普及
  • .NET WebClient 类下载部分文件会错误?可能是解压缩的锅