当前位置：首页 > news >正文

GPT-4o mini小型模型具备卓越的文本智能和多模态推理能力

news 来源：原创 2024/9/20 11:00:04

GPT-4o mini 是首个应用OpenAI 指令层次结构方法的模型，这有助于增强模型抵抗越狱、提示注入和系统提示提取的能力。这使得模型的响应更加可靠，并有助于在大规模应用中更安全地使用。

GPT-4o mini 在学术基准测试中，无论是在文本智能还是多模态推理方面，都超越了 GPT-3.5 Turbo 和其他小型模型，并支持与 GPT-4o 相同的语言范围。它在函数调用方面也表现出色，这使开发者能够构建应用程序来从外部系统获取数据或采取行动，并且相比 GPT-3.5 Turbo 在处理长上下文时表现更佳。

小型模型具备卓越的文本智能和多模态推理能力

GPT-4o mini 在几个关键基准上进行了评估：

推理任务：GPT-4o mini 在涉及文本和视觉的推理任务中表现更佳，在 MMLU（文本智能和推理基准测试）中得分 82.0%，相比之下 Gemini Flash 得分为 77.9%，Claude Haiku 得分为 73.8%。

数学和编程能力：GPT-4o mini 在数学推理和编程任务方面表现出色，在市场上超越了之前的小型模型。在 MGSM（衡量数学推理能力）中，GPT-4o mini 得分为 87.0%，相比之下 Gemini Flash 得分为 75.5%，Claude Haiku 得分为 71.7%。在 HumanEval（衡量编程性能）中，GPT-4o mini 得分为 87.2%，相比之下 Gemini Flash 得分为 71.5%，Claude Haiku 得分为 75.9%。

多模态推理：GPT-4o mini 在 MMMU（多模态推理评估）中的表现也很强，得分为 59.4%，相比之下 Gemini Flash 得分为 56.1%，Claude Haiku 得分为 50.2%。

作为OpenAI的模型开发过程的一部分，少数合作方发现 GPT-4o mini 在诸如从收据文件中提取结构化数据或在提供线程历史的情况下生成高质量电子邮件响应等任务中，明显优于 GPT-3.5 Turbo。

为了有效地调用API并优化请求参数以提高性能，您可以采取以下几个步骤和策略：

1. 选择合适的API端点

确保您使用的API端点是最新的，并且针对您的特定需求进行了优化。不同的API版本可能会有不同的性能表现。

2. 仔细设计请求

明确指令：确保您的请求非常清晰且具体。例如，在使用文本生成API时，明确地告诉模型您想要什么类型的文本，以及任何特定的细节。
使用上下文：如果适用的话，使用之前的对话历史作为上下文的一部分，这样可以减少每次请求时需要提供的信息量。
避免冗余：避免发送不必要的信息或重复相同的请求，因为这会增加服务器负载并减慢响应速度。

3. 优化请求参数

温度（Temperature）：这是控制生成文本随机性的参数。较低的温度会使得输出更加确定和可预测，而较高的温度则会产生更多的变化。根据您的需求调整温度值。
最大长度（Max Tokens）：限制输出的最大长度可以降低计算成本。合理设置此参数以满足您的内容长度要求，同时避免过度消耗资源。
采样策略（Sampling Strategy）：一些API允许您指定采样策略，例如“top-k”或“top-p”，这可以帮助您获得更高质量的输出。