当前位置: 首页 > news >正文

苹果最新的M3系列芯片对于大模型的使用来说未来价值如何?结果可能不太好!M3芯片与A100算力对比!

本文来自DataLearnerAI官方网站:苹果最新的M3系列芯片对于大模型的使用来说未来价值如何?结果可能不太好!M3芯片与A100算力对比! | 数据学习者官方网站(Datalearner)icon-default.png?t=N7T8https://www.datalearner.com/blog/1051698716733526

M3系列芯片是苹果最新发布的芯片。也是当前苹果性能最好的芯片。由于苹果的统一内存架构以及它的超大内存,此前很多人发现可以使用苹果的电脑来运行大语言模型。尽管它的运行速度不如英伟达最先进的显卡,但是由于超大的内存(显存),它可以载入非常大规模的模型。而此次的M3芯片效果如何,本文做一个简单的分析。

  • Intel+Nvidia的大模型硬件体系
  • 苹果M系列芯片的大模型硬件体系
  • M3系列芯片与A100、H100的大模型推理性能对比
  • 苹果系列芯片运行大模型的实际速度
  • 苹果M3系列芯片运行大模型的优缺点总结
Intel+Nvidia的大模型硬件体系

当前主流的大模型架构都是基于transformer的架构,属于一种深度学习架构的模型。使用GPU训练这样的模型速度很快。

苹果M系列芯片的大模型硬件体系

尽管苹果的芯片并不是为了大模型设计,但是苹果的一个所谓的统一内存架构和超高的内存带宽让支撑了较大规模的大模型运行。

早先发布的苹果M2 Ultra芯片的统一内存有192GB,按照75%作为显存使用,可以支持最大720亿参数的模型运行(192*0.75/2)。这对于消费级硬件来说非常具有吸引力。而今天发布的M3系列芯片,在性能方面的提升让我们可以看到一个更加具有诱惑力的苹果大模型硬件平台。

M3系列芯片与A100、H100的大模型推理性能对比

大模型推理的硬件指标有很多,这里我们列举部分指标作为对比结果供大家参考:

对于大模型的推理来说,M3系列芯片最大的优势是载入更大的模型,而使用更少的资源。而如果可以有256GB的统一内存,这意味着可以载入的模型大小达到了960亿参数!十分恐怖!不过,这个带宽就不要对推理速度有什么期待了。

苹果系列芯片运行大模型的实际速度

这里也有几个网友展示了用苹果的M系列芯片运行大模型的速度。供大家参考:苹果最新的M3系列芯片对于大模型的使用来说未来价值如何?结果可能不太好!M3芯片与A100算力对比! | 数据学习者官方网站(Datalearner) M3系列芯片是苹果最新发布的芯片。也是当前苹果性能最好的芯片。由于苹果的统一内存架构以及它的超大内存,此前很多人发现可以使用苹果的电脑来运行大语言模型。尽管它的运行速度不如英伟达最先进的显卡,但是由于超大的内存(显存),它可以载入非常大规模的模型。而此次的M3芯片效果如何,本文做一个简单的分析。icon-default.png?t=N7T8https://www.datalearner.com/blog/1051698716733526

此前,DataLeanerAI也对比过非英伟达生态的大模型硬件体系,大家可以参考:突破英特尔CPU+英伟达GPU的大模型训练硬件组合:苹果与AMD都有新进展!icon-default.png?t=N7T8https://www.datalearner.com/blog/1051688303603066

相关文章:

  • C#WPF嵌入字体实例
  • kali搭建docker
  • 【开题报告】基于SpringBoot的演唱会门票在线预定系统的设计与实现
  • DSP 开发例程(5): tcp_server
  • Angular-04:指令
  • Java使用OkHttp库采集电商视频简单代码示例
  • 深入理解强化学习——强化学习的历史:时序差分学习
  • FFmpeg 从视频流中抽取图片
  • H5 Vue跳转小程序
  • Nginx 的配置文件(负载均衡,反向代理)
  • linux中断下文工作队列之工作队列传参(中断七)
  • css文字竖向排列
  • 部署K8S
  • Vue 3.0 学习 新特性
  • Python-platform模块
  • [译] 怎样写一个基础的编译器
  • 4. 路由到控制器 - Laravel从零开始教程
  • 8年软件测试工程师感悟——写给还在迷茫中的朋友
  • Android Studio:GIT提交项目到远程仓库
  • Android开发 - 掌握ConstraintLayout(四)创建基本约束
  • Go 语言编译器的 //go: 详解
  • jquery cookie
  • maven工程打包jar以及java jar命令的classpath使用
  • Mysql5.6主从复制
  • Odoo domain写法及运用
  • PHP 的 SAPI 是个什么东西
  • Python代码面试必读 - Data Structures and Algorithms in Python
  • Spark in action on Kubernetes - Playground搭建与架构浅析
  • 阿里云Kubernetes容器服务上体验Knative
  • 从零搭建Koa2 Server
  • ------- 计算机网络基础
  • 聚类分析——Kmeans
  • 排序算法学习笔记
  • 如何打造100亿SDK累计覆盖量的大数据系统
  • 用mpvue开发微信小程序
  • 用Python写一份独特的元宵节祝福
  • 怎么把视频里的音乐提取出来
  • AI又要和人类“对打”,Deepmind宣布《星战Ⅱ》即将开始 ...
  • Java数据解析之JSON
  • UI设计初学者应该如何入门?
  • ​DB-Engines 12月数据库排名: PostgreSQL有望获得「2020年度数据库」荣誉?
  • ​RecSys 2022 | 面向人岗匹配的双向选择偏好建模
  • # 计算机视觉入门
  • #LLM入门|Prompt#2.3_对查询任务进行分类|意图分析_Classification
  • #绘制圆心_R语言——绘制一个诚意满满的圆 祝你2021圆圆满满
  • #我与Java虚拟机的故事#连载17:我的Java技术水平有了一个本质的提升
  • $Django python中使用redis, django中使用(封装了),redis开启事务(管道)
  • ( 用例图)定义了系统的功能需求,它是从系统的外部看系统功能,并不描述系统内部对功能的具体实现
  • (1/2)敏捷实践指南 Agile Practice Guide ([美] Project Management institute 著)
  • (pytorch进阶之路)扩散概率模型
  • (阿里云万网)-域名注册购买实名流程
  • (附源码)计算机毕业设计SSM教师教学质量评价系统
  • (免费领源码)Java#Springboot#mysql农产品销售管理系统47627-计算机毕业设计项目选题推荐
  • (未解决)macOS matplotlib 中文是方框
  • (一)插入排序