当前位置: 首页 > news >正文

论文总结:A Survey on Evaluation of Large Language Models-鲁棒性相关内容

A Survey on Evaluation of Large Language Models

只取了鲁棒性相关的内容
在这里插入图片描述
LLMs:《A Survey on Evaluation of Large Language Models大型语言模型评估综述》理解智能本质(具备推理能力)、AI评估的重要性(识别当前算法的局限性+设

在这里插入图片描述
在这里插入图片描述
3.2.1 Robustness鲁棒性:两方面考察(分布外泛化OOD+对抗鲁棒性)、评估ChatGPT(AdvGLUE+ANLI+DDXPlus+AdvGLUE++,PromptBench基准)、两方面脆弱(语言输入的对抗性提示+视觉输入)
评估系统面对意外输入的稳定性是鲁棒性研究的核心,主要从对抗鲁棒性和出分布泛化两方面考察大语言模型,发现当前模型对对抗性提示和视觉输入显著脆弱,提示模型在部署中面临安全隐患,需要继续提高模型的鲁棒性。

鲁棒性研究系统在面对意外输入时的稳定性。

具体来说,分布外(out- distribution, OOD) (Wang et al., 2022)和对抗性鲁棒性是鲁棒性的两个热门研究课题。Wang等人(2023c)是一项早期工作,使用AdvGLUE (Wang等人,2021)、ANLI (Nie等人,2019)和DDXPlus (Fansi Tchango等人,2022)数据集等现有基准,从对抗性和OOD角度评估了ChatGPT和其他LLMs。卓等人(2023b)评估了语义解析的鲁棒性。Yang等人(2022)通过扩展GLUE (Wang等人,2018)数据集来评估OOD的鲁棒性。本研究的结果强调了当操纵视觉输入时对整个系统安全的潜在风险。

对于视觉语言模型,Zhao等人(2023b)对视觉输入上的LLMs进行了评估,并将其转移到其他视觉语言模型上,揭示了视觉输入的脆弱性。

Li等人(2023b)概述了语言模型的OOD评估:对抗性鲁棒性、领域泛化和数据集偏差。作者对三个研究线进行了比较和统一,总结了每个研究线的数据生成过程和评估方案,并强调了未来工作的挑战和机遇。

对于对抗鲁棒性,朱等人(2023)通过提出一个名为PromptBench的统一基准,评估了LLM对提示的鲁棒性。他们全面评估了多个级别(字符、单词、句子和语义)的对抗性文本攻击。结果表明,当面对对抗性输入时,现代LLM容易受到对抗性提示的攻击,强调了模型的鲁棒性的重要性。至于新的对抗性数据集,王等人(2023a)引入了AdvGLUE++基准数据集来评估对抗鲁棒性,并实施了一个新的评估协议,通过越狱系统提示来审查机器道德。

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 爬虫基本原理入门
  • Preact:轻量级替代React的选择
  • 【2024最新华为OD-C/D卷试题汇总】[支持在线评测] 亲子游戏(200分) - 三语言AC题解(Python/Java/Cpp)
  • STM32H7的LPUART基础和唤醒示例
  • Kylin Cube资源使用限制:优化大数据查询性能的策略
  • 人工智能:大语言模型提示注入攻击安全风险分析报告下载
  • 【多线程】单例模式
  • leetcode-114. 二叉树展开为链表
  • javaEE-02-servlet
  • 科普文:Linux系统安全加固指南
  • js 数组常用函数总结
  • [M模拟] lc2844. 生成特殊数字的最少操作(简单易错+分类讨论+代码优化技巧)
  • QtCMake工程提升类后找不到头文件
  • docker拉取错误解决
  • 【网络】socket和udp协议
  • [LeetCode] Wiggle Sort
  • 【Under-the-hood-ReactJS-Part0】React源码解读
  • 002-读书笔记-JavaScript高级程序设计 在HTML中使用JavaScript
  • Android 架构优化~MVP 架构改造
  • C++入门教程(10):for 语句
  • CentOS7简单部署NFS
  • idea + plantuml 画流程图
  • MySQL QA
  • Mysql优化
  • Python 基础起步 (十) 什么叫函数?
  • Python代码面试必读 - Data Structures and Algorithms in Python
  • Redis在Web项目中的应用与实践
  • XForms - 更强大的Form
  • 大主子表关联的性能优化方法
  • 分布式任务队列Celery
  • 使用权重正则化较少模型过拟合
  • 网页视频流m3u8/ts视频下载
  • 消息队列系列二(IOT中消息队列的应用)
  • 【运维趟坑回忆录】vpc迁移 - 吃螃蟹之路
  • 带你开发类似Pokemon Go的AR游戏
  • 树莓派用上kodexplorer也能玩成私有网盘
  • ​软考-高级-系统架构设计师教程(清华第2版)【第9章 软件可靠性基础知识(P320~344)-思维导图】​
  • #### go map 底层结构 ####
  • #如何使用 Qt 5.6 在 Android 上启用 NFC
  • #我与Java虚拟机的故事#连载16:打开Java世界大门的钥匙
  • (01)ORB-SLAM2源码无死角解析-(66) BA优化(g2o)→闭环线程:Optimizer::GlobalBundleAdjustemnt→全局优化
  • (1)(1.13) SiK无线电高级配置(五)
  • (51单片机)第五章-A/D和D/A工作原理-A/D
  • (C语言)输入自定义个数的整数,打印出最大值和最小值
  • (PADS学习)第二章:原理图绘制 第一部分
  • (二) Windows 下 Sublime Text 3 安装离线插件 Anaconda
  • (回溯) LeetCode 78. 子集
  • (数据结构)顺序表的定义
  • (一)基于IDEA的JAVA基础12
  • (原創) X61用戶,小心你的上蓋!! (NB) (ThinkPad) (X61)
  • (转)编辑寄语:因为爱心,所以美丽
  • (转)总结使用Unity 3D优化游戏运行性能的经验
  • (自用)交互协议设计——protobuf序列化
  • .ai域名是什么后缀?
  • .mat 文件的加载与创建 矩阵变图像? ∈ Matlab 使用笔记