当前位置：首页 > news >正文

免费！OpenAI发布最新模型GPT-4o mini，取代GPT-3.5，GPT-3.5退出历史舞台？

news 来源：原创 2024/9/18 10:23:52

有个小伙伴问我，GPT-4O mini是什么，当时我还一脸懵逼，便做了一波猜测：

我猜测哈，这个可能是ChatGPT4o的前提下，只支持文本功能的版本，速度更快

结果，大错特错。

让我们一起看看OpenAI官博是怎么说的。

GPT-4o mini比GPT-3.5 Turbo更智能、更便宜。

GPT-4o mini is more than 60% cheaper than GPT-3.5 Turbo

可以这么说， ChatGPT 正式迈入了“4.0”时代。

GPT-4o mini 性价比高！3.5可以光荣退役了。。。

GPT4o mimi升级了哪些内容？

接下来将从GPT3.5 turbo、GPT4o、GPT4o mini三个模型上下对比看下

1、上下文长度

	上下文长度	输出长度
GPT3.5 turbo	16K	4K
GPT4o mini	128K	16K
GPT4o	128K	4K

GPT4o mini居然在输出长度方面，超过了20美元/月的GPT4o。

2、多模态支持

GPT4o mini相较于GPT3.5 turbo只支持文本输入的基础上，又增加了图片输入，也就意味着使用GPT4o可以进行读图了

官方透露，后续会加上视频等输入方式。

3、模型质量

从返回质量上来看，GPT4o mini还是远远甩开GPT3.5 turbo几条街的。

看下官方公布的评估基准水平

4、知识截止时间

GPT4o mini模型的训练知识截止时间几乎做到了和GPT4o同样的时间

模型	知识截止时间
GPT3.5 & GPT3.5 turbo	2021年9月
GPT4.0 & GPT 4o	2023年12月
GPT4o mini	2023年10月

但，知识截止时间影响不大，因为GPT4o早已具备联网查询功能。

5、响应速度

之前速度最快的模型一直是GPT3.5，随着后来的GPT4o推出成为了最快

但是目前第三方测试来看，GPT4o相应速度是目前最快的，也许和模型较小有关系。

接下来 GPT-4 全系列包括：

GPT-4o：更适合复杂任务
GPT-4o mini：更快完成日常任务
GPT-4：传统模式

👉 GPT功能：

GPT-4o知识问答：支持1000+token上下文记忆功能
最强代码大模型Code Copilot：代码自动补全、代码优化建议、代码重构等
DALL-E AI绘画：AI绘画 + 剪辑 = 自媒体新时代
私信哪吒，直接使用GPT-4o

7月18日，OpenAI宣布推出GPT-4o mini，一个极具成本效益的小型模型。

OpenAI把GPT-4o mini描述为，一个具有卓越文本智能和多模态推理能力的小模型。

据OpenAI介绍，GPT-4o mini在MMLU上的得分为82%，目前在LMSYS排行榜上的聊天偏好方面优于GPT-4。

GPT-4o mini在文本智能和多模态推理方面的学术基准测试中超越了GPT-3.5 Turbo和其他小型模型，并且支持的语言范围与GPT-4o相同。

GPT-4o mini在函数调用方面也表现出色，可以使开发人员构建获取数据或使用外部系统采取行动的应用程序。

此外，与GPT-3.5 Turbo相比，GPT-4o mini的长上下文性能有所提高。GPT-4o mini已经在几个关键基准上进行了评估。

推理任务：GPT-4o mini在涉及文本和视觉的推理任务上优于其他小型模型，在文本智能和推理基准MMLU上的得分为82.0%，而Gemini Flash为77.9%，Claude Haiku为73.8%。

数学和编码能力：GPT-4o mini在数学推理和编码任务中的表现优于市场上之前的小型模型。在测量数学推理的MGSM上，GPT-4o mini得分为 87.0%，而Gemini Flash得分为75.5%，Claude Haiku得分为71.7%。在测量编码性能的HumanEval上，GPT-4o mini得分为87.2%，而Gemini Flash得分为71.5%，Claude Haiku得分为75.9%。

多模态推理：GPT-4o mini在多模态推理评估MMMU中也表现出色，得分为59.4%，而Gemini Flash为56.1%，Claude Haiku为50.2%。