当前位置: 首页 > news >正文

[论文笔记]Rethink Training of BERT Rerankers in Multi-Stage Retrieval Pipeline

引言

今天带来远古时代一篇关于Reranker模型的论文笔记——Rethink Training of BERT Rerankers in Multi-Stage Retrieval Pipeline

为了简单,下文中以翻译的口吻记录,比如替换"作者"为"我们"。

经过深度LM微调的重排序器(Reranker)基于丰富的上下文匹配信号估计候选项的相关性。同时,深度LM也可以用于改进搜索索引,构建具有更好召回率的检索器。人们期望将两者直接结合在一个流程中能有累积的性能提升。然而,在本文中,我们发现这种流行的重新排序器无法充分利用改进的检索结果。因此,我们提出了一种局部对比估计(Localized Contrastive Estimation)方法用于训练重排序器。

代码开源在: https://github.com/luyug/Reranker

1. 总体介绍

启发式检索器(例如 BM25)能够高效地生成初步候选结果集合,随后由一个或多个复杂的重排序器对最有前景的候选项进行重新排序。像 BERT 这样的神经语言模型对这一架构产生了重大影响,它们为启发式检索器提供了更有效的索引术语和术语权重,并为重新排序器提供了丰富的上下文匹配信号。直观地说

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 自动生成对话视频!如何使用Captions的AI视频生成与编辑API工具?
  • LeetCode90 子集 II
  • C++ 设计模式——备忘录模式
  • LeetCode93 复原 IP 地址
  • C程序设计——指针杂谈0
  • 短剧APP遭遇DDoS攻击的解决方法
  • sqlite3的db.parallelize方法:并行执行SQL语句,提升数据库操作效率
  • 网络编程 0903作业
  • Java 入门指南:Java 并发编程 —— 并发容器 ConcurrentSkipListMap
  • 航电系统,无人机的核心!!!
  • Https配置免费SSL证书
  • C++11中的constexpr
  • Linux编程--文件IO(2)、目录
  • vllm源码解析(一):整体架构与推理代码
  • Datawhale X 李宏毅苹果书 AI夏令营 入门 Task3-机器学习框架
  • #Java异常处理
  • ABAP的include关键字,Java的import, C的include和C4C ABSL 的import比较
  • CAP理论的例子讲解
  • create-react-app做的留言板
  • ECMAScript6(0):ES6简明参考手册
  • Elasticsearch 参考指南(升级前重新索引)
  • GDB 调试 Mysql 实战(三)优先队列排序算法中的行记录长度统计是怎么来的(上)...
  • Java基本数据类型之Number
  • Magento 1.x 中文订单打印乱码
  • Twitter赢在开放,三年创造奇迹
  • Vue实战(四)登录/注册页的实现
  • 分布式任务队列Celery
  • 力扣(LeetCode)22
  • 每个JavaScript开发人员应阅读的书【1】 - JavaScript: The Good Parts
  • 前端每日实战:70# 视频演示如何用纯 CSS 创作一只徘徊的果冻怪兽
  • 追踪解析 FutureTask 源码
  • Python 之网络式编程
  • ​​​【收录 Hello 算法】10.4 哈希优化策略
  • ​LeetCode解法汇总2583. 二叉树中的第 K 大层和
  • ​力扣解法汇总946-验证栈序列
  • ###51单片机学习(2)-----如何通过C语言运用延时函数设计LED流水灯
  • $NOIp2018$劝退记
  • (Redis使用系列) SpirngBoot中关于Redis的值的各种方式的存储与取出 三
  • (八十八)VFL语言初步 - 实现布局
  • (附源码)计算机毕业设计SSM基于java的云顶博客系统
  • (附源码)计算机毕业设计SSM智能化管理的仓库管理
  • (每日一问)基础知识:堆与栈的区别
  • (区间dp) (经典例题) 石子合并
  • (转)菜鸟学数据库(三)——存储过程
  • ..回顾17,展望18
  • ./configure,make,make install的作用
  • .dat文件写入byte类型数组_用Python从Abaqus导出txt、dat数据
  • .net 程序发生了一个不可捕获的异常
  • .NET/C# 在代码中测量代码执行耗时的建议(比较系统性能计数器和系统时间)
  • .net6使用Sejil可视化日志
  • .NetCore实践篇:分布式监控Zipkin持久化之殇
  • .Net多线程总结
  • .NET与java的MVC模式(2):struts2核心工作流程与原理
  • .NET中的Event与Delegates,从Publisher到Subscriber的衔接!
  • @Valid和@NotNull字段校验使用