当前位置: 首页 > news >正文

【AI资讯】7.19日凌晨OpenAI发布迷你AI模型GPT-4o mini

性价比最高的小模型

北京时间7月19日凌晨,美国OpenAI公司推出一款新的 AI 模型“GPT-4o mini”,即GPT-4o的更小参数量、简化版本。OpenAI表示,GPT-4o mini是目前功能最强大、性价比最高的小参数模型,性能逼近原版GPT-4,成本相比GPT-3.5 Turbo便宜60%以上,支持50种不同语言,替代GPT-3.5版本的ChatGPT。
在这里插入图片描述
GPT-4o mini 以其低成本和低延迟实现了广泛的任务,例如链式或并行化多个模型的调用(例如,调用多个 API)、将大量上下文传递给模型(例如,完整的代码库或对话历史记录)的应用程序,或通过快速、实时的文本响应与客户互动(例如,客户支持聊天机器人)。

目前,GPT-4o mini 在 API 中支持文本和视觉,未来还将支持文本、图像、视频和音频的输入和输出。该模型具有 128K 个 token 的上下文窗口,每个请求最多支持 16K 个输出 token,并且拥有截至 2023 年 10 月的知识。得益于与 GPT-4o 共享的改进的 tokenizer,处理非英语文本现在更具成本效益。

本文翻译自官网文章:https://openai.com/index/gpt-4o-mini-advancing-cost-efficient-intelligence/

具有卓越文本智能和多模态推理能力的小模型

GPT-4o mini 在文本智能和多模态推理方面的学术基准测试中超越了 GPT-3.5 Turbo 和其他小型模型,并且支持的语言范围与 GPT-4o 相同。它还在函数调用方面表现出色,这可以使开发人员构建获取数据或使用外部系统采取行动的应用程序,并且与 GPT-3.5 Turbo 相比,它的长上下文性能有所提高。

GPT-4o mini 已经在几个关键基准上进行了评估。

推理任务: GPT-4o mini 在涉及文本和视觉的推理任务上优于其他小型模型,在文本智能和推理基准 MMLU 上的得分为 82.0%,而 Gemini Flash 为 77.9%,Claude Haiku 为 73.8%。

数学和编码能力: GPT-4o mini 在数学推理和编码任务中表现出色,优于市场上之前的小型模型。在测量数学推理的 MGSM 上,GPT-4o mini 得分为 87.0%,而 Gemini Flash 得分为 75.5%,Claude Haiku 得分为 71.7%。在测量编码性能的 HumanEval 上,GPT-4o mini 得分为 87.2%,而 Gemini Flash 得分为 71.5%,Claude Haiku 得分为 75.9%。

多模态推理: GPT-4o mini 在多模态推理评估 MMMU 上也表现出色,得分为 59.4%,而 Gemini Flash 为 56.1%,Claude Haiku 为 50.2%。
在这里插入图片描述

内置安全措施

安全性从一开始就融入到我们的模型中,并在开发过程的每一步中得到强化。在预训练中,我们会过滤掉我们不希望模型学习或输出的信息,例如仇恨言论、成人内容、主要汇总个人信息的网站和垃圾邮件。在训练后,我们使用强化学习和人工反馈 (RLHF)等技术将模型的行为与我们的策略保持一致,以提高模型响应的准确性和可靠性。

GPT-4o mini 内置了与GPT-4o相同的安全缓解措施,我们根据我们的准备框架并按照我们的自愿承诺,使用自动和人工评估对其进行了仔细评估。超过 70 位来自社会心理学和错误信息等领域的外部专家对 GPT-4o 进行了测试,以识别潜在风险,我们已经解决了这些风险,并计划在即将发布的 GPT-4o 系统卡和准备记分卡中分享详细信息。这些专家评估的见解有助于提高 GPT-4o 和 GPT-4o mini 的安全性。

基于这些经验,我们的团队还致力于利用我们研究得出的新技术来提高 GPT-4o mini 的安全性。API 中的 GPT-4o mini 是第一个应用我们的指令层次结构的模型(在新窗口中打开)方法,有助于提高模型抵抗越狱、即时注入和系统即时提取的能力。这使得模型的响应更加可靠,并有助于使其在大规模应用中更安全地使用。

我们将继续监控 GPT-4o mini 的使用情况,并在发现新的风险时提高模型的安全性。

可用性和价格

GPT-4o mini 现已作为文本和视觉模型在 Assistants API、Chat Completions API 和 Batch API 中提供。开发人员每 100 万个输入token支付 15 美分,每 100 万个输出token支付 60 美分(大约相当于标准书籍的 2500 页)。我们计划在未来几天推出 GPT-4o mini 的微调。

在 ChatGPT 中,免费版、Plus 版和团队版用户从今天开始将能够使用 GPT-4o mini,以替代 GPT-3.5。企业用户也将从下周开始使用,这符合我们让所有人都能享受 AI 好处的使命。

下一步是什么

过去几年,我们见证了人工智能的显著进步和成本的大幅降低。例如,自 2022 年推出功能较弱的模型 text-davinci-003 以来,GPT-4o mini 的每代币成本已下降 99%。我们致力于继续沿着这条降低成本、同时增强模型能力的轨迹前进。

我们设想的未来是模型可以无缝集成到每个应用程序和每个网站上。GPT-4o mini 为开发人员铺平了道路,使他们能够更高效、更经济地构建和扩展强大的 AI 应用程序。AI 的未来将变得更加易于访问、可靠,并嵌入到我们的日常数字体验中,我们很高兴能够继续引领潮流。

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 前端Vue组件技术实践:构建自定义动态宫格菜单按钮组件
  • SpringBoot连接PostgreSQL+MybatisPlus入门案例
  • 昇思25天学习打卡营第18天|Pix2Pix实现图像转换
  • 前端组件化探索与实践:Vue自定义暂无数据组件的开发与应用
  • CV12_ONNX转RKNN模型(谛听盒子)
  • 深度学习每周学习总结N4:中文文本分类-Pytorch实现(基本分类(熟悉流程)、textCNN分类(通用模型)、Bert分类(模型进阶))
  • tcp协议下的socket函数
  • DICOM CT\MR片子免费在线查看工具;python pydicom包加载查看;mayavi 3d查看
  • vxe-弹窗初始化激活选中Vxe-Table表格中第一行input输入框
  • debian 更新源
  • Spring Boot集成SFTP快速入门Demo
  • 独立站外链如何影响搜索引擎排名?
  • AI算法17-贝叶斯岭回归算法Bayesian Ridge Regression | BRR
  • C/C++ json库
  • 如何在电脑上演示手机上APP,远程排查移动端app问题
  • Android开源项目规范总结
  • CSS盒模型深入
  • js
  • PermissionScope Swift4 兼容问题
  • Spark学习笔记之相关记录
  • Web设计流程优化:网页效果图设计新思路
  • Xmanager 远程桌面 CentOS 7
  • zookeeper系列(七)实战分布式命名服务
  • 案例分享〡三拾众筹持续交付开发流程支撑创新业务
  • 区块链将重新定义世界
  • 如何将自己的网站分享到QQ空间,微信,微博等等
  • 微服务框架lagom
  • 温故知新之javascript面向对象
  • 一起参Ember.js讨论、问答社区。
  • ​ 轻量应用服务器:亚马逊云科技打造全球领先的云计算解决方案
  • ​Base64转换成图片,android studio build乱码,找不到okio.ByteString接腾讯人脸识别
  • #[Composer学习笔记]Part1:安装composer并通过composer创建一个项目
  • #pragma once
  • #多叉树深度遍历_结合深度学习的视频编码方法--帧内预测
  • (1)SpringCloud 整合Python
  • (20050108)又读《平凡的世界》
  • (4)logging(日志模块)
  • (C#)Windows Shell 外壳编程系列9 - QueryInfo 扩展提示
  • (附源码)计算机毕业设计ssm基于Internet快递柜管理系统
  • (求助)用傲游上csdn博客时标签栏和网址栏一直显示袁萌 的头像
  • (实战)静默dbca安装创建数据库 --参数说明+举例
  • (五)activiti-modeler 编辑器初步优化
  • (原创)Stanford Machine Learning (by Andrew NG) --- (week 9) Anomaly DetectionRecommender Systems...
  • (转)shell调试方法
  • (转)关于如何学好游戏3D引擎编程的一些经验
  • .Family_物联网
  • .mp4格式的视频为何不能通过video标签在chrome浏览器中播放?
  • .NET 4.0中使用内存映射文件实现进程通讯
  • .NET Core 通过 Ef Core 操作 Mysql
  • .NET CORE使用Redis分布式锁续命(续期)问题
  • .NET Windows:删除文件夹后立即判断,有可能依然存在
  • .NET 实现 NTFS 文件系统的硬链接 mklink /J(Junction)
  • .NET/C# 解压 Zip 文件时出现异常:System.IO.InvalidDataException: 找不到中央目录结尾记录。
  • .net开发引用程序集提示没有强名称的解决办法
  • .NET企业级应用架构设计系列之开场白