当前位置: 首页 > news >正文

NVIDIA Drivers、CUDA、Pytorch安装

        NVIDIA Drivers、CUDA、Pytorch 这三者的版本有着十分紧密的关联,很容易因为版本不对而重复卸载、重装。

        这里写个记录,方便查阅。

一、NVIDIA Drivers、CUDA

NVIDIA Drivers、CUDA 的关系可以在这里看到:

CUDA Compatibilityicon-default.png?t=N7T8https://docs.nvidia.com/deploy/cuda-compatibility/

如下图所示:

上图解释:

  • C - 兼容
  • X - 不兼容
  • 分支 R525、R515、R510、R465、R460、R455、R450、R440、R418、R410、R396、R390 已终止使用,并且不是支持兼容性的目标。
  • 新功能分支(例如 495.xx)不是 CUDA 前向兼容性支持的目标。

CUDA 版本的 Release Note 在这里 

CUDA 12.5 Update 1 Release NotesThe Release Notes for the CUDA Toolkit.icon-default.png?t=N7T8https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html如下图所示:

有时候可以通过上面这个网站了解CUDA新版本的兼容情况。

NVIDIA Drivers、CUDA 的下载方法:

CUDA Toolkiticon-default.png?t=N7T8https://developer.nvidia.com/cuda-downloads如下,选择对就的操作系统、CPU架构、版本等信息

上面给出了对应的 ubuntu 20.04 系统的 runfile 下载方式和安装方式:

wget https://developer.download.nvidia.com/compute/cuda/12.5.1/local_installers/cuda_12.5.1_555.42.06_linux.run
sudo sh cuda_12.5.1_555.42.06_linux.run

解释:

  • 这里的 cuda_12.5.1_555.42.06_linux.run 文件有几个G,
  • 它包含了 NVIDIA Drivers -555.42.06 和 CUDA - 12.5.1

执行 sudo sh cuda_12.5.1_555.42.06_linux.run 后,根据提示来安装即可。

        验证 NVDIA Drivers 是否安装成功的方法:

        使用 nvidia-smi,这是 NVIDIA 提供的一个命令行工具,用于管理和监控 NVIDIA GPU。执行以下命令:

nvidia-smi

        如果 NVIDIA 驱动成功安装并正确加载,你会看到类似以下的输出,显示 GPU 的详细信息:

Thu Jul 15 13:45:27 2024
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 535.54.06    Driver Version: 535.54.06    CUDA Version: 12.2     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  GeForce GTX 1080    Off  | 00000000:01:00.0  On |                  N/A |
|  0%   33C    P8     7W / 180W |    205MiB /  8192MiB |      0%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------++-----------------------------------------------------------------------------+
| Processes:                                                                  |
|  GPU   GI   CI        PID   Type   Process name                  GPU Memory |
|        ID   ID                                                   Usage      |
|=============================================================================|
|    0   N/A  N/A      1774      G   /usr/lib/xorg/Xorg                160MiB |
|    0   N/A  N/A      2023      G   /usr/bin/gnome-shell               43MiB |
+-----------------------------------------------------------------------------+

        检查 CUDA 是否安装成功的方法是,使用 nvcc 命令来检查 CUDA 编译器的版本。

nvcc --version

        如果安装成功,你应该会看到类似以下的输出,显示 CUDA 的版本信息:

nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2024 NVIDIA Corporation
Built on Thu_Jul_24_19:09:09_PDT_2024
Cuda compilation tools, release 12.2, V12.2.91
Build cuda_12.2.r12.2/compiler.32484909_64.312

二、Pytorch

        

        Pytorch 的版本与 CUDA 版本有密切的关系。

        最新版本的 Pytorch 的安装文件,在这里下载:

Start Locally | PyTorch Start Locallyicon-default.png?t=N7T8https://pytorch.org/get-started/locally/

        如下图所示:

        安装方法,拷贝下面命令即可安装与 CUDA 12.4 兼容的最新版本 pytorch :

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu124

        注意,这里的 cu124 是指 CUDA 12.4。

        历史版本 pytorch 的安装文件和方法在这里

Previous PyTorch Versions | PyTorch Installing previous versions of PyTorchicon-default.png?t=N7T8https://pytorch.org/get-started/previous-versions/

        如下图所示:

        拷贝对应的版本来安装即可。

        查看 pythorch 安装成功与否的方法是:首先,打开一个 Python 解释器(如 python 或 ipython),然后尝试导入 PyTorch 并检查其版本:

import torch
print(torch.__version__)

        如果 PyTorch 安装成功,你会看到类似以下的输出,显示 PyTorch 的版本号:

2.2.0

        如果你安装的是支持 CUDA 的 PyTorch 版本,可以检查 CUDA 是否可用:

import torch
print(torch.cuda.is_available())

        如果 CUDA 可用,该命令会输出 True,否则输出 False。

三、总结

        这三个东西总是容易搞错乱,写下这篇文章,希望可以帮到人。

.

        

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • linux--mount--挂载
  • Spring踩坑:抽象类作为父类,使用子类@Autowired属性进行填充,属性值为null
  • 【CI/CD】docker + Nginx自动化构建部署
  • c++线程传参
  • KCache-go本地缓存,支持本地缓存过期、缓存过期自维护机制。
  • Chrome谷歌浏览器Console(控制台)显示文件名及行数
  • Open3D 计算点云的占地面积
  • HarmonyOS NEXT零基础入门到实战-第四部分
  • 速盾:cdn能防御ddos吗?
  • Codeforces Round 874 (Div. 3)(A~D题)
  • 掌握AJAX技术:从基础到实战
  • reduceByKey 函数详解
  • 1-如何挑选Android编译服务器
  • Git拉取国外远程嵌套代码
  • Kylin自定义函数全解:释放数据分析的无限潜能
  • “寒冬”下的金三银四跳槽季来了,帮你客观分析一下局面
  • 【108天】Java——《Head First Java》笔记(第1-4章)
  • axios请求、和返回数据拦截,统一请求报错提示_012
  • bearychat的java client
  • canvas 高仿 Apple Watch 表盘
  • CSS3 变换
  • Docker下部署自己的LNMP工作环境
  • Flex布局到底解决了什么问题
  • JavaScript类型识别
  • OSS Web直传 (文件图片)
  • Python socket服务器端、客户端传送信息
  • seaborn 安装成功 + ImportError: DLL load failed: 找不到指定的模块 问题解决
  • SQLServer插入数据
  • Vue全家桶实现一个Web App
  • WebSocket使用
  • 阿里云容器服务区块链解决方案全新升级 支持Hyperledger Fabric v1.1
  • 关于springcloud Gateway中的限流
  • 入门到放弃node系列之Hello Word篇
  • 入手阿里云新服务器的部署NODE
  • 小程序测试方案初探
  • 一个完整Java Web项目背后的密码
  • ​2021半年盘点,不想你错过的重磅新书
  • ​ssh-keyscan命令--Linux命令应用大词典729个命令解读
  • ​软考-高级-系统架构设计师教程(清华第2版)【第12章 信息系统架构设计理论与实践(P420~465)-思维导图】​
  • # 达梦数据库知识点
  • # 飞书APP集成平台-数字化落地
  • #我与Java虚拟机的故事#连载18:JAVA成长之路
  • (env: Windows,mp,1.06.2308310; lib: 3.2.4) uniapp微信小程序
  • (Matlab)使用竞争神经网络实现数据聚类
  • (二)hibernate配置管理
  • (二)PySpark3:SparkSQL编程
  • (附源码)springboot宠物管理系统 毕业设计 121654
  • (排序详解之 堆排序)
  • (入门自用)--C++--抽象类--多态原理--虚表--1020
  • (十) 初识 Docker file
  • (转)Android中使用ormlite实现持久化(一)--HelloOrmLite
  • (转)程序员技术练级攻略
  • .net core 客户端缓存、服务器端响应缓存、服务器内存缓存
  • .NET Core 控制台程序读 appsettings.json 、注依赖、配日志、设 IOptions
  • .Net Core缓存组件(MemoryCache)源码解析