当前位置: 首页 > news >正文

GPU参数指标

以英伟达的A800卡为例,简单聊聊GPU卡的核心参数指标,A800的核心指标主要有5个,为算力、显存大小、显存带宽、功耗情况和卡间互联速率。
在这里插入图片描述

  • 性能:则可以理解为货车对不同货物类型的马力大小,决定能“拉动”多少重量的货,不同数据类型好比不同的货物,木板(FP16)和钢卷(FP32)对于运输要求不同,木材能拉10顿,可能钢卷就拉5顿(钢卷的放置要求高,需要配套各种固定装置);
  • 显存:可以理解为货车的车厢,能够放下多大“尺寸”的物品,这个需要和算力匹配,避免吕布骑狗或者小马拉大车。
  • 显存带宽:这个可以理解为装卸货的速度,带宽越大装卸“一车”货物的时间越快。这个与GPU显存类型有关,比如A800 SXM 的为HBM2e,就高达2TB/s;就像货车中装了自动装卸货装置,卸货效率飞起,而普通显卡的GDDR6则相当于人工,效率就慢了很多。
  • 卡间互联:2个A800通过nvlink互联,主要是实现了显存容量共享,相当于把2个货车的车厢相加,可以放下更大的货物。现在的大模型可以比作一个家具,一张GPU的显存放不的下大模型,可以多卡互联扩大显存来实现,而一个货车的车厢装不下,可以把两个货车的车厢合成一个(这个比喻可能有点不恰当);
  • 功耗TDP:这个更好理解就像货车的油耗,拉相同重量的货物,油耗越低肯定越好。
    在这里插入图片描述
    在这里插入图片描述

在这里插入图片描述

  • 流处理器:也叫渲染管、着色器。画面都是由一个又一个像素点组成的,而流处理器就负责这些像素点的渲染工作;

  • RT核心:光追核心,用作于光线追踪效果;

  • CUDA 核心和Tensor 核心:CUDA Core和Tensor Core,为GPU提供计算能力的硬件单元。CUDA core也叫Streaming Processor(SP),是单精度,组成SM的重要部分。Core的数量越多,并行运算的线程越大,计算的峰值越高。

  • 显存容量:显存容量决定着显存临时存储数据的多少,大显存能减少读取数据的次数,降低延迟;

  • 显存带宽:显存带宽,指显示芯片与显存之间的数据传输速率,单位是字节/秒。显卡的显存是由一块块的显存芯片构成的,显存总位宽同样也是由显存颗粒的位宽组成,显存带宽=显存频率×显存位宽/8。显存带宽是决定显卡性能和速度最重要的因素之一。

  • 显存位宽:是显存在一个时钟周期内所能传送数据的位数,位数越大则瞬间所能传输的数据量越大,这是显存的重要参数之一;

  • 浮点性能:代表显卡的浮点计算能力,越高算力越强,深度学习、科学计算用途较多;

  • 核心代号:显卡核心代号就是指显卡的显示核心的开发代号。

  • 核心频率:指显示核心的工作频率,其工作频率在一定程度上可以反映出显示核心的性能;

  • 加速频率:指显示核心的工作频率最高可达频率。

  • Vulkan API:Vulkan API 是一种跨平台的图形接口,能提供更高的图形性能和更低的能耗。支持 Vulkan API 的显卡在运行 Vulkan 游戏或应用时性能更佳。这对于追求高帧率、低延迟的游戏玩家来说是一个重要的参数。

  • DirectX 支持:DirectX 是微软开发的一组多媒体编程接口,用于处理图形、音频和输入输出等多媒体任务。支持 DirectX 的显卡通常在运行 DirectX 游戏时性能更佳。因此,如果您是一个热衷于玩 DirectX 游戏的游戏玩家,那么这一参数对您来说尤为重要。

  • 热设计功耗(TDP):它指的是显卡运行时所产生的最大热量输出。TDP 越低,显卡的散热和电源需求就越低,相应的成本也越低。因此,在选择显卡时,应根据自己的需求和预算来平衡 TDP 与性能的关系。

参考:
https://xie.infoq.cn/article/fcd73ab3509b7eb4a5757a743

相关文章:

  • swiper.js实现跑马灯效果,无缝衔接,鼠标悬停
  • <<迷雾>> 第 3 章 怎样才能让机器做加法 示例电路
  • python程序操作Windows系统中的软件如word等(是否可以成功操作待验证)
  • 基于IAR平台的freertos移植
  • Mac电脑快速回复的神器-快捷短语
  • 华为交换机命名规则大详解,再也不愁选交换机了
  • 分层图 的尝试学习 1.0
  • 【C++】C++的Vector使用和实现
  • 软件架构设计师教程 第11章 11.4 边缘计算概述 笔记
  • neo4j小白入门
  • 询盘鸭独立站
  • OpenCV图像文件读写(4)解码图像数据函数imdecode()的使用
  • Rustrover2024.2 正式发布:个人非商用免费,泰裤辣
  • idea 创建多模块项目
  • 极狐GitLab 17.4 重点功能解读【三】
  • 【腾讯Bugly干货分享】从0到1打造直播 App
  • 11111111
  • canvas 五子棋游戏
  • classpath对获取配置文件的影响
  • css布局,左右固定中间自适应实现
  • ECMAScript入门(七)--Module语法
  • EOS是什么
  • gf框架之分页模块(五) - 自定义分页
  • happypack两次报错的问题
  • Java 内存分配及垃圾回收机制初探
  • JavaScript学习总结——原型
  • Node.js 新计划:使用 V8 snapshot 将启动速度提升 8 倍
  • ReactNative开发常用的三方模块
  • Spring框架之我见(三)——IOC、AOP
  • Vue UI框架库开发介绍
  • vue+element后台管理系统,从后端获取路由表,并正常渲染
  • 翻译--Thinking in React
  • 干货 | 以太坊Mist负责人教你建立无服务器应用
  • 回顾2016
  • -- 数据结构 顺序表 --Java
  • 我从编程教室毕业
  • 项目管理碎碎念系列之一:干系人管理
  • 小程序测试方案初探
  • 怎样选择前端框架
  • 中国人寿如何基于容器搭建金融PaaS云平台
  • 字符串匹配基础上
  • ​Base64转换成图片,android studio build乱码,找不到okio.ByteString接腾讯人脸识别
  • ​MPV,汽车产品里一个特殊品类的进化过程
  • ​虚拟化系列介绍(十)
  • #include<初见C语言之指针(5)>
  • #VERDI# 关于如何查看FSM状态机的方法
  • #我与Java虚拟机的故事#连载01:人在JVM,身不由己
  • (4)logging(日志模块)
  • (70min)字节暑假实习二面(已挂)
  • (附源码)ssm考生评分系统 毕业设计 071114
  • (附源码)计算机毕业设计SSM教师教学质量评价系统
  • (十八)Flink CEP 详解
  • (十六)一篇文章学会Java的常用API
  • (算法设计与分析)第一章算法概述-习题
  • (一)硬件制作--从零开始自制linux掌上电脑(F1C200S) <嵌入式项目>