当前位置: 首页 > news >正文

Llama 3.1要来啦?!测试性能战胜GPT-4o

哎呀,Meta声称将于今晚发布的Llama 3.1,数小时前就在Hugging Face上泄露出来了?泄露的人很有可能是Meta员工?

图片

还是先来看泄露出来的llama3.1吧。新的Llama 3.1模型包括8B、70B、405B三个版本。

而经过网友测试,该base版模型在AI的基准测试中有显著进步,其性能可以超越当前大模型天花板GPT-4o。而模型的instruct版本通常会更强,也许值得期待一手。

图片

这一模型的问世,可能会成为AI历史性的节点。它意味着开源模型首次在性能上,战胜当下最顶尖的闭源AI大模型(GPT-4o)。

不过GPT-4o好像也发布了很久了,我们一直没能等来GPT5,甚至等来的只是个更便宜的缩水版GPT-4o mini。那就是OpenAI不够努力咯。

图片

128k上下文,15T+tokens训练最强开源模型

Llama 3.1系列不仅是405b模型成绩显著,70b的模型也在一定程度上超越了GPT-4o。不过在human eval和social sciences方面略逊一筹。

而8B和70B模型在基准测试中有了非常显著的进步,下图为Meta根据内部的评估库评估后的结果。

基础预训练模型:

图片

指令微调模型:

图片

图片

而看到llama 3.1 70b和8b的数据后,我们不妨猜测这两个模型就是405b的蒸馏。

图片

同时,作为纯文本模型,Llama 3.1专门针对多语言对话场景优化了文本指令。 包括英语,法语、德语、印地语、意大利语、葡萄牙语、西班牙语和泰语等等。

Llama 3.1使用了15T+个tokens的公开数据源来进行预训练,还使用了超过2500万个人工合成的示例进行微调。预训练数据的时间截止到2023年的12月。这三个版本的模型的上下文长度都达到了128K。相比于原本Llama的8k上下文,这可以说是一次质的飞跃了。

图片

不过嘛,泄露的文章中并没有透露使用了哪些私人的数据源,也许要等到Meta正式发布后才能知晓。

原文件地址已删除,疑似员工泄露

一经泄露,Llama 3.1在reddit上迅速引发热议,不过很快这个页面就变成404了。

图片

还是有好心人给出了下载链接。不过Meta官方声明,正式公布时间也就在今晚,大家先按捺一下好奇心,不用急于这一时

也有网友对泄露的原文进行了补档,对Llama3.1具体数据有兴趣的小伙伴可以去看一看:

https://web.archive.org/web/20240722214257/https://huggingface.co/huggingface-test1/test-model-1

而另一边,根据网友猜测,泄露这个模型的人的身份可能是Meta员工。

图片

以下是上传文件的作者的主页:https://huggingface.co/samuelselvan

图片

虽然这种偷跑的行为令人不齿,但看完Llama的表现后,个人认为开源模型能取得如此成绩,是对闭源模型的一种鞭策。长久以来,闭源模型在人力和钞能力的支持下,始终压开源模型一头。而“蚂蚁虽小可溃千里长堤”,开源模型的资源交汇织成的蛛网,终究会产生无比强大的力量。

现在我只想对OpenAI说一句:OpenAI你说句话呀!开源的模型都打赢你了,快把GPT5端上来!

图片

图片

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • Docker+consul容器服务的更新与发现
  • Ubuntu 22.04安装Visual Studio Code(VS Code)配置C++,Python
  • 【故障排除】Unity在编辑器模式下Play时闪退
  • C++STL详解(一)——string类的接口详解(下)
  • 北醒单点激光雷达更改id和波特率以及Ubuntu20.04下CAN驱动
  • SQL中的函数
  • [k8s源码]7.indexer
  • 设计模式13-单件模式
  • OS Copilot初体验的感受与心得
  • Boost搜索引擎:如何建立 用户搜索内容 与 网页文件内容 之间的关系
  • 某某物联rabbitmqhttp二轮充电桩协议充电协议对接
  • 【.NET】asp.net core 程序重启容器后redis无法连接,连接超时
  • mariadb安装centos再次踩坑
  • 数学建模学习(1)遗传算法
  • 数据库结构之b树
  • 230. Kth Smallest Element in a BST
  • canvas 五子棋游戏
  • java第三方包学习之lombok
  • JS基础之数据类型、对象、原型、原型链、继承
  • js中forEach回调同异步问题
  • MySQL的数据类型
  • Octave 入门
  • python学习笔记 - ThreadLocal
  • Web Storage相关
  • Windows Containers 大冒险: 容器网络
  • 基于HAProxy的高性能缓存服务器nuster
  • 使用API自动生成工具优化前端工作流
  • 原生Ajax
  • 2017年360最后一道编程题
  • Prometheus VS InfluxDB
  • ###51单片机学习(1)-----单片机烧录软件的使用,以及如何建立一个工程项目
  • #【QT 5 调试软件后,发布相关:软件生成exe文件 + 文件打包】
  • (19)夹钳(用于送货)
  • (33)STM32——485实验笔记
  • (bean配置类的注解开发)学习Spring的第十三天
  • (C语言)输入自定义个数的整数,打印出最大值和最小值
  • (done) ROC曲线 和 AUC值 分别是什么?
  • (Forward) Music Player: From UI Proposal to Code
  • (Ruby)Ubuntu12.04安装Rails环境
  • (二)基于wpr_simulation 的Ros机器人运动控制,gazebo仿真
  • (附源码)spring boot校园拼车微信小程序 毕业设计 091617
  • (六) ES6 新特性 —— 迭代器(iterator)
  • (论文阅读26/100)Weakly-supervised learning with convolutional neural networks
  • .babyk勒索病毒解析:恶意更新如何威胁您的数据安全
  • .MyFile@waifu.club.wis.mkp勒索病毒数据怎么处理|数据解密恢复
  • .net core 依赖注入的基本用发
  • .NET CORE使用Redis分布式锁续命(续期)问题
  • .NET Framework .NET Core与 .NET 的区别
  • .NET/C# 获取一个正在运行的进程的命令行参数
  • .NET/C# 推荐一个我设计的缓存类型(适合缓存反射等耗性能的操作,附用法)
  • .NET+WPF 桌面快速启动工具 GeekDesk
  • .NET下的多线程编程—1-线程机制概述
  • .net用HTML开发怎么调试,如何使用ASP.NET MVC在调试中查看控制器生成的html?
  • /usr/bin/perl:bad interpreter:No such file or directory 的解决办法
  • @antv/g6 业务场景:流程图