当前位置: 首页 > news >正文

马斯克宣布xAI将在8月份推出Grok-2大模型 预计年底推出Grok-3

在今年内,由特斯拉创始人马斯克创立的人工智能初创公司xAI将推出两款重要产品Grok-2和Grok-3。马斯克在社交平台上透露了这一消息,其中Grok-2预计在今年8月份面世,而Grok-3则计划于年底前亮相。

在这里插入图片描述
除此之外,马斯克还表示,他计划在年底推出的一款大型人工智能模型Grok-0将使用10万块英伟达的H100进行训练,并有可能超越现有人工智能水平并激发全球用户对AI技术的兴趣。

尽管成立时间不长,但xAI在人工智能领域已经取得了令人瞩目的进展。去年7月13日才宣布成立的该公司,在不到一年的时间里就完成了首个旗舰模型Grok-0的训练,参数量达到330亿。随后,他们又先后推出了Grok-1、Grok-1.5和Grok-1.5V等多款产品。

目前发布的这些多款Grok模型虽然间隔时间很短,但功能逐渐增强。其中,3月28日发布的Grok-1.5增加了长文本处理能力;4月12日发布的 Grok -1.5V 增加了视觉推理能力 , 可以根据自然语言和图像交错进行推理 。除了在产品上的卓越成就外,xAI在资本市场上也获得了认可。他们在5月26日在官网上宣布从B轮融资中筹集了60亿美元资金,投资者包括红杉资本、安德森·霍洛维茨基金、富达管理与研究公司以及沙特王国控股公司等。

在这里插入图片描述

这里所说的H100是英伟达开发的图形处理单元,也称为Hopper,是专门用于处理大语言模型(LLMs)数据的AI芯片。随着科技公司竞相开发更智能的AI产品,这些芯片成了硅谷的热门商品。

每块英伟达H100人工智能芯片的价格估计在3万美元左右,也有人估计价格高达4万美元,如果批量购买的话可能会有折扣。

通过简单计算,单单训练Grok 3就用了价值30亿至40亿美元的人工智能芯片,目前不确定这些芯片是否是马斯克公司直接购买的,此前报道称,马斯克旗下的xAI公司正在与甲骨文谈判,计划在未来几年内花费100亿美元租用云服务器。近年来,马斯克的公司已直接购买了大量的H100芯片。据报道,马斯克曾将原本供特斯拉使用的价值5亿美元的H100芯片转给了X公司。

相较于Grok 2,使用10万块H100训练Grok 3无疑是一个巨大的提升。今年4月,马斯克在接受挪威主权基金负责人尼科莱·坦根(Nicolai Tangen)的采访时表示,训练Grok 2需要大约2万块H100。

目前,xAI已发布了Grok-1和Grok-1.5版本,最新版本仅对X平台上的早期测试者和现有用户开放。马斯克在周一的帖子中透露,Grok 2计划于今年8月推出,并暗示Grok 3将于年底发布。

10万块H100芯片听起来很多,但其他科技巨头,如Meta,也在大量购买GPU芯片。Meta首席执行官马克·扎克伯格(Mark Zuckerberg)今年1月曾表示,到2024年底,Meta将购买约35万块英伟达H100芯片,并表示包括其他类型的GPU在内,Meta将拥有约60万块芯片。

如果是这样的话,Meta将为构建自家人工智能能力花掉大约180亿美元。

这些芯片的积累也导致了过去一年中顶尖AI人才的招聘竞争变得异常激烈。AI初创公司Perplexity的创始人兼首席执行官阿拉文德·斯里尼瓦斯(Aravind Srinivas)谈到了他试图从Meta挖角一位资深研究人员的经历,但对方因扎克伯格拥有大量AI芯片而拒绝了他的邀请。

“我试图聘请一位非常资深的Meta研究员,他们的回答是:‘等你有了1万块H100 GPU再来找我。’”斯里尼瓦斯说。

相关文章:

  • Spring Boot 创建定时任务
  • 带安全启动—Ubuntu系统—手动安装Nvidia驱动
  • 三菱PLC 6行程序实现8电机顺序启动逆序停止
  • 亚信安全:《2024云安全技术发展白皮书》
  • 【Axure高保真原型】中继器表格——移入显示详情卡片案例
  • yolo-seg模型后处理
  • 常用的Linux系统命令
  • Java中的编码规范与代码审查实践
  • 大数据面试题之Spark(5)
  • CEPH 系统盘挂了,如何使用数据盘恢复
  • Vue 详情实战涉及从项目初始化到功能实现、测试及部署的整个过程
  • 2024年07月03日 Redis部署方式和持久化
  • 【LeetCode】 740. 删除并获得点数
  • 万字长文|关于 OpenAI 接口开发你应该知道的一切
  • 视频号矩阵管理系统:短视频内容营销的智能助手
  • 自己简单写的 事件订阅机制
  • 【css3】浏览器内核及其兼容性
  • 【node学习】协程
  • angular2 简述
  • angular学习第一篇-----环境搭建
  • bootstrap创建登录注册页面
  • chrome扩展demo1-小时钟
  • java多线程
  • MyEclipse 8.0 GA 搭建 Struts2 + Spring2 + Hibernate3 (测试)
  • Netty+SpringBoot+FastDFS+Html5实现聊天App(六)
  • Python连接Oracle
  • Spring Boot快速入门(一):Hello Spring Boot
  • 初识MongoDB分片
  • 基于HAProxy的高性能缓存服务器nuster
  • 使用Tinker来调试Laravel应用程序的数据以及使用Tinker一些总结
  • 正则与JS中的正则
  • 小白应该如何快速入门阿里云服务器,新手使用ECS的方法 ...
  • 整理一些计算机基础知识!
  • ​你们这样子,耽误我的工作进度怎么办?
  • # Swust 12th acm 邀请赛# [ E ] 01 String [题解]
  • # 飞书APP集成平台-数字化落地
  • #我与Java虚拟机的故事#连载05:Java虚拟机的修炼之道
  • (安卓)跳转应用市场APP详情页的方式
  • (八)Docker网络跨主机通讯vxlan和vlan
  • (转)利用PHP的debug_backtrace函数,实现PHP文件权限管理、动态加载 【反射】...
  • .locked1、locked勒索病毒解密方法|勒索病毒解决|勒索病毒恢复|数据库修复
  • .NET Core Web APi类库如何内嵌运行?
  • .NET Core WebAPI中使用swagger版本控制,添加注释
  • .net core控制台应用程序初识
  • .Net Web项目创建比较不错的参考文章
  • /usr/local/nginx/logs/nginx.pid failed (2: No such file or directory)
  • ::前边啥也没有
  • [1181]linux两台服务器之间传输文件和文件夹
  • [20171106]配置客户端连接注意.txt
  • [AI]文心一言爆火的同时,ChatGPT带来了这么多的开源项目你了解吗
  • [codevs 1296] 营业额统计
  • [Django 0-1] Core.Email 模块
  • [ESP32] 编码旋钮驱动
  • [GXYCTF2019]BabyUpload1 -- 题目分析与详解
  • [HackMyVM]靶场 Wild