当前位置: 首页 > news >正文

价格战再起:OpenAI 发布更便宜、更智能的 GPT-4o Mini 模型|TodayAI

价格战再起:OpenAI 发布更便宜、更智能的 GPT-4o Mini 模型|TodayAI

OpenAI 今日推出了一款名为 GPT-4o Mini 的新模型,这款模型较轻便且成本更低,旨在为开发者提供一个经济实惠的选择。与完整版模型相比,GPT-4o mini 在成本效益方面表现卓越,价格仅为每百万输入 tokens 15 美分和每百万输出 tokens 60 美分,比之前的前沿模型便宜一个数量级,比 GPT-3.5 Turbo 便宜超过 60%。这种经济实惠的定价使得更多的应用程序能够负担得起 AI 技术,预计将大大扩展 AI 应用的范围。

使用 OpenAI 的模型构建应用程序可能会产生巨额费用,许多开发者因此望而却步,转而选择谷歌的 Gemini 1.5 Flash 或 Anthropic 的 Claude 3 Haiku 等更便宜的模型。为此,OpenAI 进入了轻量级模型市场。OpenAI 的 API 平台产品负责人 Olivier Godement 在接受媒体采访时表示:“我认为 GPT-4o Mini 真正体现了 OpenAI 使 AI 更广泛可及的使命。如果我们希望 AI 能惠及世界的每一个角落、每一个行业、每一个应用,我们就必须让 AI 更加实惠。”

从今天开始,ChatGPT 免费版、Plus 版和团队计划的用户可以使用 GPT-4o Mini 代替 GPT-3.5 Turbo,企业用户将在下周获得访问权限。这意味着 ChatGPT 用户将不再能使用 GPT-3.5,但开发者仍可以通过 API 使用它,如果他们不想切换到 GPT-4o Mini。Godement 表示,GPT-3.5 将在某个时间点从 API 中退役,具体时间尚未确定。

价格战再起:OpenAI 发布更便宜、更智能的 GPT-4o Mini 模型|TodayAI

具有卓越文本智能和多模态推理的小型模型

新模型不仅支持文本,还支持 API 中的视觉功能,未来还将处理视频和音频等多模态输入和输出。凭借这些能力,GPT-4o Mini 可以用于理解旅行行程并提供建议等更复杂的虚拟助手功能。然而,该模型主要用于简单任务,因此没有人会真正用它来廉价地构建类似 Siri 的助手。

GPT-4o mini 在学术基准测试中超越了 GPT-3.5 Turbo 和其他小型模型,无论在文本智能还是多模态推理方面都表现出色,并支持与 GPT-4o 相同的语言范围。它在函数调用方面表现优异,能让开发者构建从外部系统获取数据或采取行动的应用程序,并且相比 GPT-3.5 Turbo,长上下文性能有所提升。

在测量大规模多任务语言理解(MMLU)测试中,GPT-4o Mini 取得了 82% 的得分。这项基准考试包括 57 个学科的约 16000 道选择题。相比之下,GPT-3.5 的得分为 70%,GPT-4o 为 88.7%,而谷歌声称其 Gemini Ultra 创下了 90% 的最高得分。竞争模型 Claude 3 Haiku 和 Gemini 1.5 Flash 分别得分 75.2% 和 78.9%。然而,研究人员对这些基准测试持谨慎态度,因为各家公司进行测试的方式略有不同,分数难以直接比较。此外,AI 可能会在其数据集中包含这些答案,从而让它“作弊”。

对于渴望以低成本构建 AI 应用的开发者来说,GPT-4o Mini 的推出为他们提供了另一种工具。OpenAI 让金融科技初创公司 Ramp 测试了该模型,使用它构建了一个提取收据费用数据的工具,用户可以上传收据的照片,模型会自动整理信息。电子邮件客户端 Superhuman 也测试了 GPT-4o Mini,并用它创建了电子邮件回复的自动建议功能。

这款新模型的目标是为开发者提供一种轻量级且廉价的工具,帮助他们创建无法负担更大、更昂贵模型的应用和工具。许多开发者会选择 Claude 3 Haiku 或 Gemini 1.5 Flash,而不是支付运行最强大模型之一所需的高昂计算成本。

至于为什么 OpenAI 花了这么久的时间才推出这个模型,Godement 表示,这是“纯粹的优先级问题”,因为公司专注于创建更大更好的模型,如 GPT-4,这需要大量的人力和计算资源。随着时间的推移,OpenAI 发现开发者渴望使用更小的模型,因此公司决定现在是投资资源构建 GPT-4o Mini 的时机。

内置安全措施

GPT-4o mini 继承了 GPT-4o 的安全措施,确保在开发过程中的每一步都强化安全性。从预训练阶段开始,OpenAI 就过滤掉仇恨言论、成人内容和垃圾信息等不希望模型学习或输出的内容。在后训练阶段,通过人类反馈强化学习(RLHF)等技术,使模型的行为与政策保持一致,提高模型响应的准确性和可靠性。

GPT-4o mini 具有与 GPT-4o 相同的安全缓解措施,这些措施通过自动和人工评估进行了仔细评估。来自社会心理学和虚假信息等领域的 70 多位外部专家测试了 GPT-4o,以识别潜在风险,OpenAI 已经解决了这些问题,并计划在即将发布的 GPT-4o 系统卡和准备得分卡中分享详细信息。这些专家评估的见解有助于提高 GPT-4o 和 GPT-4o mini 的安全性。

此外,GPT-4o mini 还首次在 API 中应用了指令层级方法,增强了模型抵御越狱、提示注入和系统提示提取的能力,确保模型响应的可靠性和安全性。

可用性和未来展望

GPT-4o mini 现已在 Assistants API、Chat Completions API 和 Batch API 中上线。开发者可以通过支付每百万输入 tokens 15 美分和每百万输出 tokens 60 美分的费用,使用这一新型模型。在 ChatGPT 平台上,Free、Plus 和 Team 用户今天起可以使用 GPT-4o mini,取代 GPT-3.5,企业用户也将在下周开始访问。

OpenAI 承诺在未来继续推动 AI 技术的普及和成本降低。自 2022 年推出能力较低的 text-davinci-003 模型以来,GPT-4o mini 的每个 token 成本已下降了 99%。OpenAI 设想未来模型将无缝集成到每个应用程序和网站中,推动 AI 应用更高效、更经济地发展。​​​​​​​

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 前端设计模式面试题汇总
  • c++ primer plus 第16章string 类和标准模板库, 泛型编程----为何使用迭代器
  • 面试题 33. 二叉搜索树的后序遍历序列
  • GD32 MCU上电跌落导致启动异常如何解决
  • 《简历宝典》18 - 简历中“技术能力”,如何丰满且有层次,Java篇
  • MySQL简介以及对数据库的操作
  • 力扣 102题 二叉树的层次遍历 记录
  • CSS 中border-radius 属性
  • 学习并测试SqlSugar的单库事务功能
  • k8s二次开发-kubebuiler一键式生成deployment,svc,ingress
  • Lamp 小白菜鸟从入门到精通
  • Git 用法
  • blender和3dmax和maya和c4d比较
  • 各类专业技术的pdf电子书
  • SmartX 超融合 vs vSAN 8:数据库场景下的性能对比
  • @jsonView过滤属性
  • 2018以太坊智能合约编程语言solidity的最佳IDEs
  • Angular 响应式表单之下拉框
  • canvas 高仿 Apple Watch 表盘
  • iOS小技巧之UIImagePickerController实现头像选择
  • Java,console输出实时的转向GUI textbox
  • JS专题之继承
  • puppeteer stop redirect 的正确姿势及 net::ERR_FAILED 的解决
  • Python学习之路13-记分
  • 给github项目添加CI badge
  • 类orAPI - 收藏集 - 掘金
  • 实现菜单下拉伸展折叠效果demo
  • 使用putty远程连接linux
  • 学习JavaScript数据结构与算法 — 树
  • gunicorn工作原理
  • 支付宝花15年解决的这个问题,顶得上做出十个支付宝 ...
  • ​Spring Boot 分片上传文件
  • # Redis 入门到精通(七)-- redis 删除策略
  • (2024,Vision-LSTM,ViL,xLSTM,ViT,ViM,双向扫描)xLSTM 作为通用视觉骨干
  • (2024最新)CentOS 7上在线安装MySQL 5.7|喂饭级教程
  • (Matlab)基于蝙蝠算法实现电力系统经济调度
  • (八)Flask之app.route装饰器函数的参数
  • (附源码)springboot炼糖厂地磅全自动控制系统 毕业设计 341357
  • (每日一问)计算机网络:浏览器输入一个地址到跳出网页这个过程中发生了哪些事情?(废话少说版)
  • (三) prometheus + grafana + alertmanager 配置Redis监控
  • (三分钟了解debug)SLAM研究方向-Debug总结
  • (四)TensorRT | 基于 GPU 端的 Python 推理
  • (转)Unity3DUnity3D在android下调试
  • (转)用.Net的File控件上传文件的解决方案
  • .ai域名是什么后缀?
  • .apk 成为历史!
  • .net core 实现redis分片_基于 Redis 的分布式任务调度框架 earth-frost
  • .NET MAUI学习笔记——2.构建第一个程序_初级篇
  • .Net Winform开发笔记(一)
  • .Net 垃圾回收机制原理(二)
  • .Net+SQL Server企业应用性能优化笔记4——精确查找瓶颈
  • .NET开发者必备的11款免费工具
  • .net连接oracle数据库
  • /bin、/sbin、/usr/bin、/usr/sbin
  • @TableLogic注解说明,以及对增删改查的影响