当前位置: 首页 > news >正文

免费!OpenAI发布最新模型GPT-4o mini,取代GPT-3.5,GPT-3.5退出历史舞台?

有个小伙伴问我,GPT-4O mini是什么,当时我还一脸懵逼,便做了一波猜测:

我猜测哈,这个可能是ChatGPT4o的前提下,只支持文本功能的版本,速度更快

结果,大错特错。

让我们一起看看OpenAI官博是怎么说的。

GPT-4o mini比GPT-3.5 Turbo更智能、更便宜。

GPT-4o mini is more than 60% cheaper than GPT-3.5 Turbo

可以这么说, ChatGPT 正式迈入了“4.0”时代。

GPT-4o mini 性价比高!3.5可以光荣退役了。。。

GPT4o mimi升级了哪些内容?

接下来将从GPT3.5 turbo、GPT4o、GPT4o mini三个模型上下对比看下

1、上下文长度
上下文长度输出长度
GPT3.5 turbo16K4K
GPT4o mini128K16K
GPT4o128K4K

GPT4o mini居然在输出长度方面,超过了20美元/月的GPT4o。

2、多模态支持

GPT4o mini相较于GPT3.5 turbo只支持文本输入的基础上,又增加了图片输入,也就意味着使用GPT4o可以进行读图了

官方透露,后续会加上视频等输入方式。

3、模型质量

从返回质量上来看,GPT4o mini还是远远甩开GPT3.5 turbo几条街的。

看下官方公布的评估基准水平

4、知识截止时间

GPT4o mini模型的训练知识截止时间几乎做到了和GPT4o同样的时间

模型知识截止时间
GPT3.5 & GPT3.5 turbo2021年9月
GPT4.0 & GPT 4o2023年12月
GPT4o mini2023年10月

但,知识截止时间影响不大,因为GPT4o早已具备联网查询功能。

5、响应速度

之前速度最快的模型一直是GPT3.5,随着后来的GPT4o推出成为了最快

但是目前第三方测试来看,GPT4o相应速度是目前最快的,也许和模型较小有关系。

接下来 GPT-4 全系列包括:

  • GPT-4o:更适合复杂任务
  • GPT-4o mini:更快完成日常任务
  • GPT-4:传统模式

👉 GPT功能:

  1. GPT-4o知识问答:支持1000+token上下文记忆功能
  2. 最强代码大模型Code Copilot:代码自动补全、代码优化建议、代码重构等
  3. DALL-E AI绘画:AI绘画 + 剪辑 = 自媒体新时代
  4. 私信哪吒,直接使用GPT-4o

7月18日,OpenAI宣布推出GPT-4o mini,一个极具成本效益的小型模型。

OpenAI把GPT-4o mini描述为,一个具有卓越文本智能和多模态推理能力的小模型。

据OpenAI介绍,GPT-4o mini在MMLU上的得分为82%,目前在LMSYS排行榜上的聊天偏好方面优于GPT-4。

GPT-4o mini在文本智能和多模态推理方面的学术基准测试中超越了GPT-3.5 Turbo和其他小型模型,并且支持的语言范围与GPT-4o相同。

GPT-4o mini在函数调用方面也表现出色,可以使开发人员构建获取数据或使用外部系统采取行动的应用程序。

此外,与GPT-3.5 Turbo相比,GPT-4o mini的长上下文性能有所提高。GPT-4o mini已经在几个关键基准上进行了评估。

推理任务:GPT-4o mini在涉及文本和视觉的推理任务上优于其他小型模型,在文本智能和推理基准MMLU上的得分为82.0%,而Gemini Flash为77.9%,Claude Haiku为73.8%。

数学和编码能力:GPT-4o mini在数学推理和编码任务中的表现优于市场上之前的小型模型。在测量数学推理的MGSM上,GPT-4o mini得分为 87.0%,而Gemini Flash得分为75.5%,Claude Haiku得分为71.7%。在测量编码性能的HumanEval上,GPT-4o mini得分为87.2%,而Gemini Flash得分为71.5%,Claude Haiku得分为75.9%。

多模态推理:GPT-4o mini在多模态推理评估MMMU中也表现出色,得分为59.4%,而Gemini Flash为56.1%,Claude Haiku为50.2%。

而且,不管你是 OpenAI 的 Plus、企业号还是 Team 账号,包括免费号,都能使用这个最新的模型!

👉 GPT功能:

  1. GPT-4o知识问答:支持1000+token上下文记忆功能
  2. 最强代码大模型Code Copilot:代码自动补全、代码优化建议、代码重构等
  3. DALL-E AI绘画:AI绘画 + 剪辑 = 自媒体新时代
  4. 私信哪吒,直接使用GPT-4o

在这里插入图片描述

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 【Linux】常见指令的使用
  • IT服务运营中的过程要素管理(至简)
  • ChatGPT小狐狸AI付费创作系统v3.0.3+前端
  • QT--聊天室
  • 【Nacos安装】
  • MySQL,GROUP BY子句的作用是什么?having和where的区别在哪里说一下jdbc的流程
  • NSS [SWPUCTF 2022 新生赛]funny_php
  • 增量学习中Task incremental、Domain incremental、Class incremental 三种学习模式的概念及代表性数据集?
  • AgentBench: Evaluating LLMs As Agents
  • C语言 | Leetcode C语言题解之第283题移动零
  • <新>植物大战僵尸杂交版v2.3丨附PC+手机+Mac安装教程,IOS安装新教程!​
  • 【C++】选择结构- 嵌套if语句
  • apache.commons.pool2 使用指南
  • 【研发日记】Matlab/Simulink技能解锁(十一)——Stateflow中的en、du、ex应用对比
  • Navidrome音乐服务器 + 音流APP = 释放你的手机空间
  • [微信小程序] 使用ES6特性Class后出现编译异常
  • 「前端早读君006」移动开发必备:那些玩转H5的小技巧
  • 0x05 Python数据分析,Anaconda八斩刀
  • Android Volley源码解析
  • Flex布局到底解决了什么问题
  • JAVA 学习IO流
  • java取消线程实例
  • JS函数式编程 数组部分风格 ES6版
  • nodejs调试方法
  • Vue2.x学习三:事件处理生命周期钩子
  • 前端每日实战:70# 视频演示如何用纯 CSS 创作一只徘徊的果冻怪兽
  • 设计模式走一遍---观察者模式
  • 使用putty远程连接linux
  • 事件委托的小应用
  • 吐槽Javascript系列二:数组中的splice和slice方法
  • 掌握面试——弹出框的实现(一道题中包含布局/js设计模式)
  • Spark2.4.0源码分析之WorldCount 默认shuffling并行度为200(九) ...
  • 资深实践篇 | 基于Kubernetes 1.61的Kubernetes Scheduler 调度详解 ...
  • #07【面试问题整理】嵌入式软件工程师
  • #565. 查找之大编号
  • #gStore-weekly | gStore最新版本1.0之三角形计数函数的使用
  • #Lua:Lua调用C++生成的DLL库
  • #WEB前端(HTML属性)
  • #我与Java虚拟机的故事#连载01:人在JVM,身不由己
  • (16)Reactor的测试——响应式Spring的道法术器
  • (C++)八皇后问题
  • (cljs/run-at (JSVM. :browser) 搭建刚好可用的开发环境!)
  • (javaweb)Http协议
  • (pytorch进阶之路)扩散概率模型
  • (八)Flink Join 连接
  • (太强大了) - Linux 性能监控、测试、优化工具
  • (原創) 如何將struct塞進vector? (C/C++) (STL)
  • (转)可以带来幸福的一本书
  • ***检测工具之RKHunter AIDE
  • **PHP分步表单提交思路(分页表单提交)
  • 、写入Shellcode到注册表上线
  • .NET CORE 2.0发布后没有 VIEWS视图页面文件
  • .NET Core中的去虚
  • .NET Framework、.NET Core 、 .NET 5、.NET 6和.NET 7 和.NET8 简介及区别
  • .net 打包工具_pyinstaller打包的exe太大?你需要站在巨人的肩膀上-VC++才是王道