当前位置: 首页 > news >正文

OpenAI 承认 ChatGPT 最近确实变懒,承诺修复问题

文章目录

  • 一. ChatGPT 指令遵循能力下降引发用户投诉
    • 1.1 用户抱怨回应速度慢、敷衍回答、拒绝回答和中断会话
  • 二. OpenAI 官方确认 ChatGPT 存在问题,展开调查
  • 三. OpenAI 解释模型行为差异,回应用户质疑
  • 四. GPT-4 模型变更受人事动荡和延期影响

一. ChatGPT 指令遵循能力下降引发用户投诉

1.1 用户抱怨回应速度慢、敷衍回答、拒绝回答和中断会话

不知道大家有没有发现,自 11 月 6 日 OpenAI 的开发者大会以来,ChatGPT 似乎变得越来越懒了?具体而言,这一个月来,陆续有网友发现,ChatGPT 在其指令遵循能力上下滑严重,经常避开一些繁琐的重复性的任务,只给出一个启发性的“框架”,里面留下大量空白让用户自己去填空。

image-20231213094716574

OpenAI 在上周遭到部分用户投诉,许多用户声称,他们在使用 ChatGPT 或 GPT-4 API 时,会遇到回应速度慢、敷衍回答、拒绝回答、中断会话等一系列问题,OpenAI 承认了这一事实,并在声称将彻底、妥当地修复相关问题。

OpenAI 此前解释称,GPT-4 变懒惰的原因是,OpenAI 从 11 月 11 日起就未再更新模型,而 GPT 模型也正因此变得不可预测,当前该公司正在着手修复问题

据悉,用户抱怨 GPT-4 模型变“懒惰”是指,用户请求 GPT-4 撰写表格,但该模型仅仅输出三行;输入一段代码,模型只输出一些信息,随后再指示用户填写剩下的其他部分。有时候,GPT-4 甚至会告诉人们“你们完全可以自己完成这些工作”。

image-20231213094831858

二. OpenAI 官方确认 ChatGPT 存在问题,展开调查

伴随着大家质疑的声浪,昨天 OpenAI 官方下场,回应了关于 ChatGPT 变懒的传闻,与“律师函警告”不同,OpenAI 官方承认了确实存在这个问题,但是强调了他们从 11 月 11 日起并没有更新模型,目前出现这种问题的原因未知,正在组织人手进一步调查。

除了放出消息,OpenAI 还积极回复了网友们关心的问题,比如有网友质疑:所谓模型不就是那个权重参数的文件?如果这个文件没有改变,为什么一个固定的文件会变懒?

image-20231213095232360

而 OpenAI 回复,“模型行为的差异很微妙”,一些 Prompt 会出现这个问题,而另一些又不会,用户与开发者可能很久之后才会注意到这些问题(意思是说不是模型突然变懒,而是之前就懒但是大家没注意到……)

image-20231213095309613

三. OpenAI 解释模型行为差异,回应用户质疑

在承认 ChatGPT 变懒之后,官方也发布了一系列的帖子了强调模型的训练过程,比如训练一个 Chat 模型并不是像传统的软件工程,哪怕使用相同的数据集在不同的训练方式下也会在个性、写作风格 、拒绝行为、表现评估等等方面产生完全不同的模型。更新模型的过程也不像是在一个网站里上线一个新功能那样纯粹的加法模式,而是需要多人手工进行规划、创建与评估才能将模型的一个新的行为模式上线:

image-20231213095408168

OpenAI 后续解释称,由于模型长期未更新,这导致 GPT 模型行为出现了细微的变化,但只有少部分提示词效果变差,GPT-4 模型在整体层面依然能够保证妥善运行。

OpenAI 声称,他们将在彻底的离线评估和线上 A / B 测试后尽快更新 GPT-4 模型,同时也鼓励用户积极对模型表现进行回馈

四. GPT-4 模型变更受人事动荡和延期影响

有些人开始猜测是因为 OpenAI 合并模型、同时运行 GPT-4 和 GPT-4 Turbo 导致服务器持续过载、公司试图通过限制结果来节省资金等造成的。

众所周知,OpenAI 的运营成本极其昂贵,今年 4 月,研究人员表示,每天需要花费 70 万美元,即每次查询花费 36 美分,才能维持 ChatGPT 的运行。根据行业分析师当时的说法,OpenAI 必须将其 GPU 群扩大至 30000 台,才能在今年剩余时间内保持其商业性能。除了为其所有合作伙伴提供计算之外,OpenAI 还需要支持 ChatGPT 其他流程。

GPT-4 模型停更与该公司的人事动荡密不可分,OpenAI 的 CEO Sam Altman 离职风波及欧美假期共同导致了 OpenAI 日常事务呈现混乱局面,除了 GPT-4 例行更新遭到延期外,原定于今年 12 月初上线供开发人员分享模型的 GPT Store,也被延期到 2024 年初上线。

image-20231213100553716

相关文章:

  • 基于Maven构建OSGI应用(Maven和OSGI结合)
  • 为什么现在是学习 Rust 的最佳时机
  • js根据数组对象中的某个值去重
  • Android audio设置投屏和喇叭双输出
  • 【数据结构和算法】--队列
  • Kubernetes(k8s)集群部署----->超详细
  • Spring Boot学习随笔- 集成JSP模板(配置视图解析器)、整合Mybatis(@MapperScan注解的使用)
  • 企业选CRM系统,这3个关键点你一定不能错过
  • 【摸鱼向】利用Arduino实现自动化切屏
  • python自动化测试实战 —— 自动化测试框架的实例
  • MySQL 报错 You can‘t specify target table for update in FROM clause解决办法
  • Flink 读写 HBase 总结
  • JeecgBoot jmreport/queryFieldBySql RCE漏洞复现
  • ArcGIS pro与SuperMap根据属性自动填充颜色步骤
  • 【JVM入门到实战】(三) 查看字节码文件的工具
  • 【162天】黑马程序员27天视频学习笔记【Day02-上】
  • 【React系列】如何构建React应用程序
  • 【跃迁之路】【444天】程序员高效学习方法论探索系列(实验阶段201-2018.04.25)...
  • 0x05 Python数据分析,Anaconda八斩刀
  • Computed property XXX was assigned to but it has no setter
  • gitlab-ci配置详解(一)
  • iOS | NSProxy
  • Java 内存分配及垃圾回收机制初探
  • JavaScript 奇技淫巧
  • Java小白进阶笔记(3)-初级面向对象
  • JWT究竟是什么呢?
  • mysql 5.6 原生Online DDL解析
  • Sequelize 中文文档 v4 - Getting started - 入门
  • 翻译 | 老司机带你秒懂内存管理 - 第一部(共三部)
  • 基于Android乐音识别(2)
  • 聊聊springcloud的EurekaClientAutoConfiguration
  • 每天一个设计模式之命令模式
  • 免费小说阅读小程序
  • 深度学习之轻量级神经网络在TWS蓝牙音频处理器上的部署
  • media数据库操作,可以进行增删改查,实现回收站,隐私照片功能 SharedPreferences存储地址:
  • ​软考-高级-系统架构设计师教程(清华第2版)【第9章 软件可靠性基础知识(P320~344)-思维导图】​
  • #stm32整理(一)flash读写
  • (22)C#传智:复习,多态虚方法抽象类接口,静态类,String与StringBuilder,集合泛型List与Dictionary,文件类,结构与类的区别
  • (3)选择元素——(14)接触DOM元素(Accessing DOM elements)
  • (4)Elastix图像配准:3D图像
  • (6)添加vue-cookie
  • (笔记)Kotlin——Android封装ViewBinding之二 优化
  • (初研) Sentence-embedding fine-tune notebook
  • (每日持续更新)jdk api之FileFilter基础、应用、实战
  • (四) Graphivz 颜色选择
  • (太强大了) - Linux 性能监控、测试、优化工具
  • (五)c52学习之旅-静态数码管
  • .net Stream篇(六)
  • .Net 代码性能 - (1)
  • .NET/C# 在 64 位进程中读取 32 位进程重定向后的注册表
  • .net打印*三角形
  • .NET国产化改造探索(三)、银河麒麟安装.NET 8环境
  • .net和php怎么连接,php和apache之间如何连接
  • .skip() 和 .only() 的使用
  • /usr/bin/perl:bad interpreter:No such file or directory 的解决办法