当前位置: 首页 > news >正文

[论文笔记]GTE

引言

今天带来今年的一篇文本嵌入论文GTE, 中文题目是 多阶段对比学习的通用文本嵌入。

作者提出了GTE,一个使用对阶段对比学习的通用文本嵌入。使用对比学习在多个来源的混合数据集上训练了一个统一的文本嵌入模型,通过在无监督预训练阶段和有监督微调阶段显著增加训练数据量,可以在现有的嵌入模型上取得显著的性能提升。

总体介绍

最近大语言模型(LLM)的兴起引发了对基于文本嵌入模型的检索增强系统的广泛关注。这些模型集成了LLM的推理和理解能力。

开发一个统一的模型来处理多种下游任务的追求一直存在,预训练语言模型的出现进一步为训练这样一个通用模型打开了可能性。然而,在文本表示研究领域中,先前的文本嵌入模型主要集中在特定任务上,它们的训练策略或模型对单一的任务进行了定制,可能在其他情境中表现不佳。例如,SimCSE文本表示模型训练在对称文本对上,对于文本检索任务显示出了局限性。类似地,某些专为稠密检索任务涉及的文本表示模型在句子相似性任务中没有表现出稳健的性能。

近期,研究重点转向于通过无监督对比预训练利用大量无标签网页数据来开发更全面的文本表示模型,结合特定任务的数据、提示或指令来在微调过程中减轻任务冲突。此外,引入了注入大规模文本嵌入基准MTEB,为评估文本表示模型的普适性奠定了坚实基础。

image-20231024152730662

本篇工作作者提出了一个直接的途径来构造一个通用文本嵌入模型,仅在开放数据上使用对比学习,如图所示。<

相关文章:

  • 2023年中国道路扫雪车分类、市场规模及发展前景分析[图]
  • 蓝桥杯第 2 场算法双周赛 第2题 铺地板【算法赛】c++ 数学思维
  • k8s之Flannel网络插件安装提示forbidden无权限
  • Ensemble Methods集成学习大比拼:性能、应用场景和可视化对比总结
  • Linux常用命令——chpasswd命令
  • 图像数据噪音种类以及Python生成对应噪音
  • Python 算法高级篇:归并排序的优化与外部排序
  • Stable Diffusion 图生图+ControlNet list index out of range
  • 安卓逆向之雷电模拟器中控
  • 面试算法40:矩阵中的最大矩形
  • Unable to find GatewayFilterFactory with name TokenRelay
  • QQ云端机器人登录系统php源码开心版
  • 代码随想录打卡第五十三天|309.最佳买卖股票时机含冷冻期 ● 714.买卖股票的最佳时机含手续费
  • 『力扣刷题本』:合并两个有序链表(递归解法)
  • ubuntu18.04设置开机自动启动脚本(以自动启动odoo命令行为例讲解)
  • ES6指北【2】—— 箭头函数
  • ComponentOne 2017 V2版本正式发布
  • Docker: 容器互访的三种方式
  • If…else
  • LintCode 31. partitionArray 数组划分
  • python3 使用 asyncio 代替线程
  • webpack4 一点通
  • 区块链技术特点之去中心化特性
  • 使用 5W1H 写出高可读的 Git Commit Message
  • 使用权重正则化较少模型过拟合
  • 想使用 MongoDB ,你应该了解这8个方面!
  • 以太坊客户端Geth命令参数详解
  • # Panda3d 碰撞检测系统介绍
  • $.ajax中的eval及dataType
  • $forceUpdate()函数
  • (13)[Xamarin.Android] 不同分辨率下的图片使用概论
  • (175)FPGA门控时钟技术
  • (3)llvm ir转换过程
  • (70min)字节暑假实习二面(已挂)
  • (C语言)字符分类函数
  • (ibm)Java 语言的 XPath API
  • (ISPRS,2023)深度语义-视觉对齐用于zero-shot遥感图像场景分类
  • (Python) SOAP Web Service (HTTP POST)
  • (Redis使用系列) Springboot 使用Redis+Session实现Session共享 ,简单的单点登录 五
  • (zt)最盛行的警世狂言(爆笑)
  • (第一天)包装对象、作用域、创建对象
  • (二开)Flink 修改源码拓展 SQL 语法
  • (附源码)ssm教师工作量核算统计系统 毕业设计 162307
  • (力扣)1314.矩阵区域和
  • (每日持续更新)jdk api之FileFilter基础、应用、实战
  • (五)IO流之ByteArrayInput/OutputStream
  • (小白学Java)Java简介和基本配置
  • (转) Face-Resources
  • (转)Linux整合apache和tomcat构建Web服务器
  • (转)从零实现3D图像引擎:(8)参数化直线与3D平面函数库
  • .net/c# memcached 获取所有缓存键(keys)
  • .NET/C# 使用反射注册事件
  • .NET6使用MiniExcel根据数据源横向导出头部标题及数据
  • .Net各种迷惑命名解释
  • .net项目IIS、VS 附加进程调试