当前位置: 首页 > news >正文

【AI开发】CRAG、Self-RAG、Adaptive-RAG

在这里插入图片描述
先放一张基础RAG的流程图
https://blog.langchain.dev/agentic-rag-with-langgraph/
再放一个CRAG和self-RAG的LangChain官方博客

Corrective RAG(CRAG)

在这里插入图片描述
首先需要知道的是CRAG的特色发生在retrieval阶段的最后开始,即当我们获得到了近似的document(或者说relevant snippets)之后。
然后我们会进入一个额外的环节,叫Knowledge Correction。在这里呢我们会先对retrieval得到的每一个相关切片snippets进行evaluate,评估一下我们获取到的snippet是不是对问的问题有效?(此处重点:evaluator也是一个LLM
然后会有三种情况:

  • Correct:那就直接进行RAG的正常流程。(不过图中是加了进一步的优化)
  • Incorrect:那就直接丢弃掉原来的document,直接去web里搜索相关信息
  • Ambiguous:对于模糊不清的,就两种方式都要

那么在最后的generation部分,也是根据三种不同的情况分别做处理。

  • 之前是correct,那现在就直接拼接问题和相关文档
  • 之前是incorrect,那现在就直接拼接问题和web获取的信息
  • 之前是ambiguous,那现在就拼接三个加起来

以上是CRAG的原始大概逻辑,但在langchain中对此进行了简化:
在这里插入图片描述
在Langchain中只存在两种情况,即当incorrect的时候,直接就去web上search了(先经过一个transform_query对问题进行重写,变成更适合web搜索的形式)

Self-RAG

和CRAG的核心都是self-reflective,即当我发现结果不是那么有效时,我要通过环回溯到之前的步骤去优化。

在这里插入图片描述

和CRAG不一样的是,selfRAG的流程是从最开始进行的,大概流程:

  1. 先判断问题是不是需要retrieval,如上图右下角,此处的问题是写一篇essay,那其实根本没必要去retrieval,直接放入LLM就行
  2. 当问题需要检索的时候,我们会将得到的每个document snippet分别判断
    ①是否有关relevant:
    如果无关,那就不进行第②步。
    如果有关:
    ②如果有关,那是否支持support,或者部分支持partial support,或者不支持
  3. 当我们对所有snippets都判断后,按照相关性进行排序,然后依次送到LLM中去进行最后的步骤。
  4. 在最后生成后还有一次评估,总共三次。

在这里插入图片描述
这是用LangChain(LangGraph)做self-RAG的流程图,如果能自己动手画出来这个图,知道什么时候是哪个节点,什么时候是哪种边,就说明真正学会了。

推荐个b站up:沧海九粟
我的很多文章都是看他的视频做的

Adaptive RAG

这个我就不写了,有篇博客写的很好
https://blog.csdn.net/qq_45668004/article/details/138199143
总结一下就是:self-RAG里面的令牌大多都是关于判断得到的某个东西合不合要求,从而进行不一样的action。而Adaptive里面的令牌相当于一个分类器,把问题分类成几种类型,每种类型对应不同复杂程度的RAG模型

相关文章:

  • 服务器----阿里云服务器重启或关机,远程连接进不去,个人博客无法打开
  • Unity API学习之资源的动态加载
  • 作者推荐 | 探索分析从起源到现今的巅峰之旅(MySQL存储模型)
  • java如何分割字符串
  • 04 远程访问及控制
  • 如何定义和衡量一个产品的成功?
  • 复旦发布开源版本的EMO,只需输入一段音频和一张照片就可以让人物开始说话。
  • 50etf期权交易规则杠杆怎么计算?
  • 16.RedHat认证-Ansible自动化运维(中)
  • 苹果Mac电脑遭恶意软件攻击 Mac第三方恶意软件删除不了
  • rtthread stm32h743的使用(九)RT_WEAK报错
  • 手写操作系统
  • pycharm git配置
  • 表单中的常用元素
  • 《跟我一起学“网络安全”》——等保风评加固应急响应
  • 【node学习】协程
  • 230. Kth Smallest Element in a BST
  • CSS魔法堂:Absolute Positioning就这个样
  • leetcode378. Kth Smallest Element in a Sorted Matrix
  • Median of Two Sorted Arrays
  • SAP云平台里Global Account和Sub Account的关系
  • SpringBoot 实战 (三) | 配置文件详解
  • storm drpc实例
  • Yeoman_Bower_Grunt
  • 等保2.0 | 几维安全发布等保检测、等保加固专版 加速企业等保合规
  • 关于 Linux 进程的 UID、EUID、GID 和 EGID
  • 关于springcloud Gateway中的限流
  • 名企6年Java程序员的工作总结,写给在迷茫中的你!
  • 排序(1):冒泡排序
  • 前言-如何学习区块链
  • 实现菜单下拉伸展折叠效果demo
  • 小程序开发之路(一)
  • 延迟脚本的方式
  • 在 Chrome DevTools 中调试 JavaScript 入门
  • # 服务治理中间件详解:Spring Cloud与Dubbo
  • #NOIP 2014#day.2 T1 无限网络发射器选址
  • (C语言)fread与fwrite详解
  • (DenseNet)Densely Connected Convolutional Networks--Gao Huang
  • (env: Windows,mp,1.06.2308310; lib: 3.2.4) uniapp微信小程序
  • (八)光盘的挂载与解挂、挂载CentOS镜像、rpm安装软件详细学习笔记
  • (第8天)保姆级 PL/SQL Developer 安装与配置
  • (二十五)admin-boot项目之集成消息队列Rabbitmq
  • (论文阅读22/100)Learning a Deep Compact Image Representation for Visual Tracking
  • (三)Kafka 监控之 Streams 监控(Streams Monitoring)和其他
  • (一)项目实践-利用Appdesigner制作目标跟踪仿真软件
  • (已更新)关于Visual Studio 2019安装时VS installer无法下载文件,进度条为0,显示网络有问题的解决办法
  • (转载)VS2010/MFC编程入门之三十四(菜单:VS2010菜单资源详解)
  • (转载)虚幻引擎3--【UnrealScript教程】章节一:20.location和rotation
  • .net Stream篇(六)
  • .net反混淆脱壳工具de4dot的使用
  • .net后端程序发布到nignx上,通过nginx访问
  • .net利用SQLBulkCopy进行数据库之间的大批量数据传递
  • .net连接oracle数据库
  • .NET运行机制
  • /proc/vmstat 详解