当前位置: 首页 > news >正文

Meta震撼发布Llama3.2大规模模型

        在2024.9.26的年Meta Connect大会上,Meta正式推出了Llama3.2模型,旨在提升边缘AI和视觉任务的能力。Llama3.2系列包括11亿和90亿参数的中型视觉模型,以及为移动设备优化的1亿和3亿参数的小型模型,并针对高通和联发科的硬件平台进行了特别设计。

        Meta首席执行官马克·扎克伯格表示,这些模型将使开发者无需依赖大量计算资源,也能推动创新,尤其是在移动设备上的应用。他说道:“Llama3.2为开发者带来了先进的技术支持,即使在资源有限的情况下,也可以在边缘和移动设备上实现前沿创新与突破。”目前, llama.com 和 Hugging Face 上提供 Llama 3.2 模型下载,

         让人兴奋的是,这次发布了更加轻量化的llama3.2 1B和3B模型,普通玩家也可以玩得起的模型。该模型支持128K个令牌的上下文长度,在设备端的应用中,诸如摘要生成、指令执行和本地边缘重写任务等场景中,具备行业领先优势。这些模型在发布之初便可在Qualcomm和MediaTek硬件上运行,并已为移动端ARM架构处理器进行了性能优化。

        Llama 3.2 系列中的两个最大模型,11B 和 90B,支持图像推理任务,能够处理例如文档级别的理解,包括图表和图形的解析,图像描述,以及视觉锚定等任务。例如,用户可以询问某小企业在去年哪个月的销售表现最佳,Llama 3.2 可以从相关图表中推断出结果并提供快速回应。在另一个应用场景中,模型可以与地图进行交互,解答诸如徒步何时会变得更陡峭,或者某条标记小径的具体距离等问题。11B 和 90B 模型还能通过提取图像中的细节并理解场景,生成简短的描述性文本,帮助在视觉与语言之间架起桥梁,适用于图像描述或讲故事场景。

        而较轻量级的 1B 和 3B 模型具备多语言文本生成与工具调用功能,开发人员可基于此开发高度隐私保护的、在本地设备上运行的个性化主动应用。这类应用可以确保用户数据不离开设备,从而提升隐私保护。例如,这些应用可以总结用户最近接收到的消息,提取其中的行动项,或通过工具直接发送后续会议的日程邀请。

        本地运行这些模型有两大优势。首先,由于处理完全在设备端进行,响应非常迅速,几乎没有延迟。其次,本地处理确保了隐私保护,不会将敏感数据如消息或日历信息上传至云端,增强了应用的私密性。此外,应用还可以灵活决定哪些查询适合本地处理,哪些需要由更大规模的云端模型处理,从而优化性能和隐私之间的平衡。

        评估结果显示,Llama 3.2 视觉模型在图像识别和各种视觉理解任务上的表现与领先的基础模型 Claude 3 Haiku 和 GPT4o-mini 不相上下。3B 模型在执行任务如指令处理、摘要生成、提示重写和工具调用等方面,超越了 Gemma 2 2.6B 和 Phi 3.5-mini 模型,而 1B 模型的表现则与 Gemma 相近。

       对模型在超过150个基准数据集上进行了评估,这些数据集涵盖了多种语言。对于视觉大语言模型(LLM),重点评估了其在图像理解和视觉推理任务中的表现。

相关文章:

  • Python使用最广泛的数据验证库Pydantic
  • 序列化与反序列化的原理及实践
  • js逆向——webpack扣取代码
  • 第J2周:ResNet50V2算法实战与解析
  • 微服务的优点及在云原生时代的合理落地方式
  • 设计模式之门面(Facade)模式
  • 【Java异常】(简简单单拿捏)
  • 剑指 offer 刷题集
  • java 生成.h文件,java调用c语言dll动态链接库流程
  • uni-app App版本更新
  • C语言习题~day33
  • react通过下拉框选择多个,并展示在下方的方式
  • 【工具分享】Darkside勒索病毒解密工具
  • 每天五分钟深度学习框架pytorch:激活函数在神经网络中的应用
  • 数据结构—(java)反射,枚举,lambda表达式
  • 【跃迁之路】【477天】刻意练习系列236(2018.05.28)
  • avalon2.2的VM生成过程
  • Essential Studio for ASP.NET Web Forms 2017 v2,新增自定义树形网格工具栏
  • FineReport中如何实现自动滚屏效果
  • input实现文字超出省略号功能
  • iOS | NSProxy
  • mysql 数据库四种事务隔离级别
  • Spring Cloud(3) - 服务治理: Spring Cloud Eureka
  • vue-loader 源码解析系列之 selector
  • webpack项目中使用grunt监听文件变动自动打包编译
  • WebSocket使用
  • 包装类对象
  • 诡异!React stopPropagation失灵
  • 聚类分析——Kmeans
  • 如何使用Mybatis第三方插件--PageHelper实现分页操作
  • 算法---两个栈实现一个队列
  • 网络应用优化——时延与带宽
  • 文本多行溢出显示...之最后一行不到行尾的解决
  • 学习笔记DL002:AI、机器学习、表示学习、深度学习,第一次大衰退
  • 验证码识别技术——15分钟带你突破各种复杂不定长验证码
  • Nginx实现动静分离
  • ​flutter 代码混淆
  • ​HTTP与HTTPS:网络通信的安全卫士
  • # windows 安装 mysql 显示 no packages found 解决方法
  • # windows 运行框输入mrt提示错误:Windows 找不到文件‘mrt‘。请确定文件名是否正确后,再试一次
  • # 数仓建模:如何构建主题宽表模型?
  • # 透过事物看本质的能力怎么培养?
  • # 消息中间件 RocketMQ 高级功能和源码分析(七)
  • #!/usr/bin/python与#!/usr/bin/env python的区别
  • #、%和$符号在OGNL表达式中经常出现
  • #我与Java虚拟机的故事#连载11: JVM学习之路
  • #周末课堂# 【Linux + JVM + Mysql高级性能优化班】(火热报名中~~~)
  • (1)Jupyter Notebook 下载及安装
  • (10)STL算法之搜索(二) 二分查找
  • (14)Hive调优——合并小文件
  • (JSP)EL——优化登录界面,获取对象,获取数据
  • (LeetCode C++)盛最多水的容器
  • (不用互三)AI绘画:科技赋能艺术的崭新时代
  • (翻译)Entity Framework技巧系列之七 - Tip 26 – 28
  • (附源码)springboot车辆管理系统 毕业设计 031034