当前位置: 首页 > news >正文

扎克伯格说Meta训练Llama 4所需的计算能力是Llama 3的10倍

Meta 公司开发了最大的基础开源大型语言模型之一 Llama,该公司认为未来将需要更强的计算能力来训练模型。马克-扎克伯格(Mark Zuckerberg)在本周二的 Meta 第二季度财报电话会议上表示,为了训练 Llama 4,公司需要比训练 Llama 3 多 10 倍的计算能力。但他仍然希望 Meta 能够提高训练模型的能力,而不是落后于竞争对手。

在这里插入图片描述
扎克伯格说:“训练 Llama 4 所需的计算量很可能是我们训练 Llama 3 所需的计算量的近 10 倍,而且未来的模型还将继续增长。很难预测未来几代人的发展趋势。但在这一点上,考虑到启动新推理项目的筹备时间较长,我宁愿冒险在需要之前建设能力,而不是为时已晚。”

Meta于今年 4 月发布了拥有 800 亿个参数的 Llama 3。该公司上周发布了该模型的升级版,名为Llama 3.1 405B,拥有 4 050 亿个参数,成为 Meta 最大的开源模型。

Meta 公司首席财务官苏珊-李(Susan Li)也表示,公司正在考虑不同的数据中心项目,并建设能力来训练未来的人工智能模型。她说,Meta 预计这项投资将在 2025 年增加资本支出。

训练大型语言模型是一项成本高昂的工作。在服务器、数据中心和网络基础设施投资的推动下,Meta 的资本支出从去年同期的 64 亿美元增至 2024 年第二季度的 85 亿美元,增长了近 33%。

根据The Information 的报道,OpenAI 在训练模型上花费了 30 亿美元,另外还以折扣价从微软租用了 40 亿美元的服务器。

"随着我们扩大生成式人工智能的训练能力,以推进我们的基础模型,我们将继续以灵活的方式建设我们的基础设施。这将使我们能够将训练能力用于基因人工智能推理或我们的核心排名和推荐工作,当我们预计这样做会更有价值时,我们就会这样做,"李开复在电话会议上说。

在电话会议上,Meta 还谈到了面向消费者的Meta AI 的使用情况,并表示印度是其聊天机器人的最大市场。但李开复指出,公司并不指望 Gen AI 产品能对收入做出重大贡献。

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 【Mind+】掌控板入门教程01 “秀”出我创意
  • slf4j 日志框架的使用方法
  • 理想发周榜,不是新能源市场的原罪
  • Blackcat V2.2付费会员制WordPress资源站主题
  • Python应用—利用opencv实现图像匹配
  • 【杂谈】在大学如何学得计算机知识,浅谈大一经验总结
  • VMware Workstation 17 图文安装教程
  • 【Qt】QDateTimeEdit
  • 一刷代码随想录(贪心5)
  • ChatGPT:GPT,GPT2,GPT3,Prompt
  • 请转告HPC计算AI计算单位,选对存储事半功倍
  • 元气森林|每天拆解一个品牌营销方案
  • 根据《广东省政务服务数字化条例》规定,政务服务数字化,是指将___广泛应用于政务服务,推动政务服务更加智能、便捷、高效的活动。()
  • JavaScript (十)——JavaScript 比较 和 逻辑运算符
  • 河南萌新联赛2024第(三)场:河南大学
  • 9月CHINA-PUB-OPENDAY技术沙龙——IPHONE
  • 《网管员必读——网络组建》(第2版)电子课件下载
  • 【React系列】如何构建React应用程序
  • 03Go 类型总结
  • CSS中外联样式表代表的含义
  • JavaScript函数式编程(一)
  • Java深入 - 深入理解Java集合
  • Redis 懒删除(lazy free)简史
  • TiDB 源码阅读系列文章(十)Chunk 和执行框架简介
  • 给自己的博客网站加上酷炫的初音未来音乐游戏?
  • 关于for循环的简单归纳
  • 基于webpack 的 vue 多页架构
  • 聊聊springcloud的EurekaClientAutoConfiguration
  • 猫头鹰的深夜翻译:JDK9 NotNullOrElse方法
  • 入门到放弃node系列之Hello Word篇
  • 微信小程序:实现悬浮返回和分享按钮
  • 我建了一个叫Hello World的项目
  • 用Python写一份独特的元宵节祝福
  • 优化 Vue 项目编译文件大小
  • 这几个编码小技巧将令你 PHP 代码更加简洁
  • 《码出高效》学习笔记与书中错误记录
  • 400多位云计算专家和开发者,加入了同一个组织 ...
  • 哈罗单车融资几十亿元,蚂蚁金服与春华资本加持 ...
  • 新海诚画集[秒速5センチメートル:樱花抄·春]
  • #Linux(权限管理)
  • #QT(智能家居界面-界面切换)
  • (11)工业界推荐系统-小红书推荐场景及内部实践【粗排三塔模型】
  • (bean配置类的注解开发)学习Spring的第十三天
  • (分布式缓存)Redis哨兵
  • (附源码)spring boot建达集团公司平台 毕业设计 141538
  • (几何:六边形面积)编写程序,提示用户输入六边形的边长,然后显示它的面积。
  • (三) prometheus + grafana + alertmanager 配置Redis监控
  • (十三)Maven插件解析运行机制
  • (未解决)macOS matplotlib 中文是方框
  • (转)IIS6 ASP 0251超过响应缓冲区限制错误的解决方法
  • (转)VC++中ondraw在什么时候调用的
  • (转载)VS2010/MFC编程入门之三十四(菜单:VS2010菜单资源详解)
  • (轉貼) UML中文FAQ (OO) (UML)
  • .bat批处理(三):变量声明、设置、拼接、截取
  • .net core Redis 使用有序集合实现延迟队列