当前位置: 首页 > news >正文

AI Agent

目录

一、什么是Agent

二、什么是MetaGPT【多智能体框架介绍】

三、MetaGPT的背景


一、什么是Agent

智能体 = LLM+观察+思考+行动+记忆

 Agent(智能体) = 一个设置了一些目标或任务,可以迭代运行的大型语言模型。这与大型语言模型(LLM)在像ChatGPT这样的工具中“通常”的使用方式不同。在ChatGPT中,你提出一个问题并获得一个答案作为回应。而Agent拥有复杂的工作流程,模型本质上可以自我对话,而无需人类驱动每一部分的交互。 

我的理解:Agent是赋予大语言模型使用工具的能力,让其不再是简单的QA问答,而是通过用户的提问,大语言模型可以自己本身去使用工具把用户的指令拆分从而更好的挖掘出大语言模型的能力;例如:

Agent爬虫:

①通过bing.search.q + query的方式,构造bing的搜索页面的url

(例如:https://www.bing.com/search?q=)

②通过requests.get获取到搜索页面的结果,使用beautifulsoup解析

③提取里面的文本然后将文本传入大语言模型,进行整理和分析。

上述就是一个智能体的实例,这分别提到Agent的工具调用能力和规划能力,在 LLM 支持的自主Agent系统中,LLM 充当Agents的大脑,并辅以几个关键组成部分:

  • 规划

    • 子目标和分解:Agents将大型任务分解为更小的、可管理的子目标,从而能够有效处理复杂的任务。

    • 反思和完善:Agents可以对过去的行为进行自我批评和自我反思,从错误中吸取教训,并针对未来的步骤进行完善,从而提高最终结果的质量。

  • 记忆

    • 短期记忆:我认为所有的上下文学习(参见提示工程)都是利用模型的短期记忆来学习。

    • 长期记忆:这为Agents提供了长时间保留和回忆(无限)信息的能力,通常是通过利用外部向量存储和快速检索来实现。

  • 工具使用

    • Agents学习调用外部 API 来获取模型权重中缺失的额外信息(通常在预训练后很难更改),包括当前信息、代码执行能力、对专有信息源的访问等。

二、什么是MetaGPT【多智能体框架介绍】

MetaGPT是一个多智能体协作框架,将标准化操作(SOP) 程序编码为提示确保解决问题时采用结构化方法。要求智能体以专家形式参与协作,并按要求生成结构化的输出,例如高质量的需求文档、架构设计图和流程图等。结构化的输出对于单个智能体即是更高层次的思维链(Chain-of-Thought),对于下游角色则是语义清晰、目标明确的上下文(Context)。通过明确定义的角色分工,复杂的工作得以分解为更小、更具体的任务。从而提升了LLMs的输出质量。

①什么是SOP:

SOP是 Standard Operating Procedure三个单词中首字母的大写 ,即标准作业程序,指将某一事件的标准操作步骤和要求以统一的格式描述出来,用于指导和规范日常的工作。SOP的精髓是将细节进行量化,通俗来讲,SOP就是对某一程序中的关键控制点进行细化和量化。SOP不是一个单点任务,而是一个完整的营销、运营、服务体系构成;

②为什么要做SOP?

标准作业流程可缩短大模型对不熟练且复杂的事务所花费的学习时间。只要按照步骤指示就能避免失误与疏忽;

主要特点:

  • 稳定的解决方案:借助SOP,与其他 Agents 相比,MetaGPT 已被证明可以生成更一致和正确的解决方案。

  • 多样化的角色分配:为LLM分配不同角色的能力确保了解决问题的全面性。

在MetaGPT中多智能体 = 智能体+环境+SOP+评审+路由+订阅+经济

  • 智能体:在单个智能体的基础上,扩展了多智能体定义。在多智能体系统中,可以由多个单智能体协同工作,每个智能体都具备独特有的LLM、观察、思考、行动和记忆。

  • 环境:环境是智能体生存和互动的公共场所。智能体从环境中观察到重要信息,并发布行动的输出结果以供其他智能体使用。

  • 标准流程(SOP):这些是管理智能体行动和交互的既定程序,确保系统内部的有序和高效运作。

  • 评审:评审是为了解决幻觉问题。人类的幻觉实际高于大语言模型,但人类已经习惯了幻觉与错误,日常中会通过大量评审来保障复杂工作每一步的可靠性。严谨有效的评审过程能将复杂工作整体的错误率降低90%

  • 路由:通信是智能体之间信息交流的过程。它对于系统内的协作、谈判和竞争至关重要。

  • 订阅:需求说了一个制度改革或市场变化,所有人都应该关注/判断影响/修改计划

  • 经济:这指的是多智能体环境中的价值交换系统,决定资源分配和任务优先级。

三、MetaGPT的背景

在探索大规模语言模型(LLMs)的应用上,自主智能体展现了巨大的潜力,能够增强和模拟人类工作流程。目前研究主要集中在以角色扮演形式驱动LLMs,通过多轮对话解决问题。然而,在面对更为复杂的任务时,简单地连接多个LLM可能导致解决问题的不可控性,难以满足实际需求。人类通过长期实践积累了各种领域的标准操作流程(SOPs),这些SOPs在任务分解和角色协作中发挥着关键作用。

受此启发,DeepWisdom团队在2023年6月开源了MetaGPT框架,火爆全网,并联合KAUST AI中心厦门大学CUHK(SZ)南京大学UPenn以及UCB等众多高校机构的学者进行了广泛深入的研究,为多智能体协作锚定了有效范式。MetaGPT创新性地将SOPs编码为智能体的设计规范和协议,进而实现了人类领域知识的自动嵌入。这一工作为更好地理解和模拟人类工作流程提供了新的途径,为自主智能体在各种任务中的表现和适应性带来了新的可能性。

相关文章:

  • 【Web】get请求和post请求的区别
  • fork创建子进程及僵尸进程的产生及规避
  • 百度交出2023年业绩答卷:全力提速AI布局,注入业绩增长新动能
  • React withRouter的使用及源码实现
  • AVL 树
  • Rocketmq java hello world 入门案例
  • LaMa Image Inpainting 图像修复 Onnx Demo
  • 贪心算法(算法竞赛、蓝桥杯)--修理牛棚
  • jmeter接口测试
  • Docker 第十九章 : 阿里云个人镜像仓使用
  • FPGA之带有进位逻辑的加法运算
  • docker单机启动mysql、redis容器命令
  • 2023中国PostgreSQL数据库生态大会:洞察前沿趋势,探索无限可能(附核心PPT资料下载)
  • 【SpringBoot3】统一参数校验
  • MySQL数据库基础知识总结(适合小白入门使用)一
  • [PHP内核探索]PHP中的哈希表
  • 分享一款快速APP功能测试工具
  • 「前端」从UglifyJSPlugin强制开启css压缩探究webpack插件运行机制
  • 2017-09-12 前端日报
  • CEF与代理
  • CSS相对定位
  • happypack两次报错的问题
  • javascript 总结(常用工具类的封装)
  • PaddlePaddle-GitHub的正确打开姿势
  • ReactNative开发常用的三方模块
  • use Google search engine
  • 大主子表关联的性能优化方法
  • 后端_ThinkPHP5
  • 思否第一天
  • 用 vue 组件自定义 v-model, 实现一个 Tab 组件。
  • 正则表达式小结
  • 走向全栈之MongoDB的使用
  • ​七周四次课(5月9日)iptables filter表案例、iptables nat表应用
  • ​软考-高级-系统架构设计师教程(清华第2版)【第20章 系统架构设计师论文写作要点(P717~728)-思维导图】​
  • ​香农与信息论三大定律
  • !! 2.对十份论文和报告中的关于OpenCV和Android NDK开发的总结
  • #{} 和 ${}区别
  • #FPGA(基础知识)
  • #laravel 通过手动安装依赖PHPExcel#
  • (01)ORB-SLAM2源码无死角解析-(66) BA优化(g2o)→闭环线程:Optimizer::GlobalBundleAdjustemnt→全局优化
  • (14)目标检测_SSD训练代码基于pytorch搭建代码
  • (MATLAB)第五章-矩阵运算
  • (待修改)PyG安装步骤
  • (附源码)ssm航空客运订票系统 毕业设计 141612
  • (附源码)基于SpringBoot和Vue的厨到家服务平台的设计与实现 毕业设计 063133
  • (一)VirtualBox安装增强功能
  • (转)Oracle存储过程编写经验和优化措施
  • .net core 微服务_.NET Core 3.0中用 Code-First 方式创建 gRPC 服务与客户端
  • .NET Core6.0 MVC+layui+SqlSugar 简单增删改查
  • .NET CORE使用Redis分布式锁续命(续期)问题
  • .NET项目中存在多个web.config文件时的加载顺序
  • /usr/bin/perl:bad interpreter:No such file or directory 的解决办法
  • [ 数据结构 - C++]红黑树RBTree
  • [20171102]视图v$session中process字段含义
  • [4.9福建四校联考]