当前位置: 首页 > news >正文

第一天 初识CUDA和显卡(含代码)

解释几个术语

  • 显卡GPU
  • 显卡驱动:驱动软件
  • GPU架构: 硬件的设计方式,例如是否有L1 or L2缓存
  • CUDA: 一种编程语言像C++, Python等,只不过它是专门用来操控GPU的
  • cudnn: 一个专门为深度学习计算设计的软件库,里面提供了很多专门的计算函数
  • CUDAToolkit:所谓的装cuda首先指的是它(后面会详解)
  • nvcc: CUDA的编译器,可以从CUDA Toolkit的/bin目录中获取,(类似于gcc就是c语言的编译器), cuda程序有两种代码,一种是运行在cpu上的host代码,一种是运行在gpu上的device代码,所以nvcc编译器要保证两部分代码能够编译成二进制文件在不同的机器上执行
  • LIBRARY_PATH:程序编译期间查找动态链接库时指定查找共享库的路径
  • LD_LIBRARY_PATH:程序加载运行期间查找动态链接库时指定除了系统默认路径之外的其他路径

GPU型号含义

  • GPU架构:Tesla(停止支持)、Fermi(停止支持)、Kepler、Maxwell、Pascal、Volte、Turning、Ample
  • 显卡系列:GeForce、Quadro、Tesla
  • GeForce显卡型号:G/GS、GT、GTS、GTX (G/GS<GT<GTS<GTX)

CUDAToolkit

  • Compiler: CUDA-C和CUDA-C++编译器NVCC位于bin/目录中。它建立在NVVM优化器之上,而NVVM优化器本身构建在LLVM编译器基础结构之上。因此开发人员可以使用nvm/目录下的Compiler SDK来直接针对NVVM进行开发
  • Tools: 提供一些像profiler,debuggers等工具,这些工具可以从bin/目录中获取
  • Libraries: 下面列出的部分科学库和实用程序库可以在lib/目录中使用,它们的接口在include/目录中可获取。
    • cudart: CUDA Runtime
    • cudadevrt: CUDA device runtime
    • cublas: BLAS (Basic Linear Algebra Subprograms,基础线性代数程序集)
    • cublas_device: BLAS kernel interface
  • CUDA Samples: 演示如何使用各种CUDA和library API的代码示例。如果要对它们进行修改,则必须将这些示例复制到另一个位置。
  • CUDA Driver: 运行CUDA应用程序需要系统至少有一个具有CUDA功能的GPU和与CUDA工具包兼容的驱动程序(向下兼容)

runtime和driver API

CUDA有两个主要的API:runtime(运行时) API和driver API, 这两个API都有对应的CUDA版本

用于支持driver API的必要文件(如libcuda.so)是由GPU driver installer安装的。nvidia-smi就属于这一类API

用于支持runtime API的必要文件(如libcudart.so以及nvcc)是由CUDA Toolkit installer安装的

注意:CUDA Toolkit Installer有时可能会集成了GPU driver Installer

nvcc是与CUDA Toolkit一起安装的CUDA compiler-driver tool,它只知道它自身构建时的CUDA runtime版本

注意:nvcc不知道安装了什么版本的GPU driver,甚至不知道是否安装了GPU driver

runtime和driver API在很多情况非常相似,也就是说用起来的效果是等价的

但不能混合使用这两个API,因为二者是互斥的

简单理解二者的区别就是

CUDA Driver与CUDA Runtime相比更偏底层,就意味着Driver API有着更灵活的控制,也伴随着更复杂的编程

CUDA driver需要做显式的初始化cuInit(0) 否则其他API都会返回CUDA_ERROR_NOT_INITIALIZED


代码示例

// CUDA驱动头文件cuda.h
#include <cuda.h>

#include <stdio.h> 
#include <string.h>
int main(){
    /* 
    	cuInit(int flags) flags目前必须给0;
        对于cuda的所有函数,必须先调用cuInit,否则其他API都会返回CUDA_ERROR_NOT_INITIALIZED
     */
    CUresult code=cuInit(0);  //CUresult:用于接收可能的错误代码
    if(code != CUresult::CUDA_SUCCESS){
        const char* err_message = nullptr;
        cuGetErrorString(code, &err_message);    // 获取错误代码的字符串描述
        // cuGetErrorName (code, &err_message);  // 也可以直接获取错误代码的字符串
        printf("Initialize failed. code = %d, message = %s\n", code, err_message);
        return -1;
    }
       
    int driver_version = 0;
    code = cuDriverGetVersion(&driver_version);  // 获取驱动版本
    printf("CUDA Driver version is %d\n", driver_version); // 若driver_version为11020指的是11.2

    // 测试获取当前设备信息
    char device_name[100]; // char 数组
    CUdevice device = 0;
    code = cuDeviceGetName(device_name, sizeof(device_name), device);  // 获取设备名称、型号, 数组名device_name当作指针
    printf("Device %d name is %s\n", device, device_name);
    return 0;
}

参考文献

  • https://zhuanlan.zhihu.com/p/91334380
  • https://developer.nvidia.com/cuda-toolkit-archive
  • https://docs.nvidia.com/cuda/archive/11.2.0/
  • https://docs.nvidia.com/cuda/archive/11.2.0/cuda-driver-api/group__CUDA__VERSION.html
  • https://docs.nvidia.com/cuda/archive/11.2.0/cuda-driver-api/group__CUDA__DEVICE.html

相关文章:

  • 钓鱼客服到拿下服务器全过程(重点在于钓鱼添加img src)
  • Java 面试常见项目问题回答
  • Linux【进程理解】
  • c---冒泡排序模拟qsort
  • 浏览器主页被hao123劫持的解决方案
  • C++单例模式实现
  • java八股系列——依赖注入的方式
  • 前端基础知识
  • MDK Keil5 创建Stm32工程-理论篇(这里以Stm32F103Zet6为例)
  • 电路模型和电路定律(2)——“电路分析”
  • C++中的利器——模板
  • Python绘图
  • 【Linux】-- 基本指令
  • 核心 Android 调节音量的过程
  • 微信小程序this指向问题
  • [原]深入对比数据科学工具箱:Python和R 非结构化数据的结构化
  • 10个确保微服务与容器安全的最佳实践
  • Django 博客开发教程 16 - 统计文章阅读量
  • javascript 总结(常用工具类的封装)
  • JS学习笔记——闭包
  • Linux gpio口使用方法
  • vue+element后台管理系统,从后端获取路由表,并正常渲染
  • 创建一种深思熟虑的文化
  • 工作踩坑系列——https访问遇到“已阻止载入混合活动内容”
  • 猫头鹰的深夜翻译:Java 2D Graphics, 简单的仿射变换
  • 使用 Node.js 的 nodemailer 模块发送邮件(支持 QQ、163 等、支持附件)
  • 使用putty远程连接linux
  • 温故知新之javascript面向对象
  • 我与Jetbrains的这些年
  • 一个SAP顾问在美国的这些年
  • AI又要和人类“对打”,Deepmind宣布《星战Ⅱ》即将开始 ...
  • 整理一些计算机基础知识!
  • ​ubuntu下安装kvm虚拟机
  • #git 撤消对文件的更改
  • #Linux(权限管理)
  • $.ajax,axios,fetch三种ajax请求的区别
  • (Demo分享)利用原生JavaScript-随机数-实现做一个烟花案例
  • (libusb) usb口自动刷新
  • (Matalb分类预测)GA-BP遗传算法优化BP神经网络的多维分类预测
  • (附源码)spring boot儿童教育管理系统 毕业设计 281442
  • (附源码)spring boot基于Java的电影院售票与管理系统毕业设计 011449
  • (求助)用傲游上csdn博客时标签栏和网址栏一直显示袁萌 的头像
  • (删)Java线程同步实现一:synchronzied和wait()/notify()
  • (四)【Jmeter】 JMeter的界面布局与组件概述
  • (万字长文)Spring的核心知识尽揽其中
  • (译)2019年前端性能优化清单 — 下篇
  • ***微信公众号支付+微信H5支付+微信扫码支付+小程序支付+APP微信支付解决方案总结...
  • .gitignore
  • .NET 6 Mysql Canal (CDC 增量同步,捕获变更数据) 案例版
  • .NET Compact Framework 多线程环境下的UI异步刷新
  • .NET Micro Framework初体验(二)
  • .NET 使用配置文件
  • .net(C#)中String.Format如何使用
  • .NET/C# 编译期能确定的字符串会在字符串暂存池中不会被 GC 垃圾回收掉
  • .NET6 命令行启动及发布单个Exe文件