当前位置: 首页 > news >正文

神经语言程式(NLP)项目的15 个开源训练数据集

一个聊天机器人需要大量的训练数据,以便在无需人工干预的情况下快速解决用户的询问。然而,聊天机器人开发的主要瓶颈是获取现实的、面向任务的对话数据来训练这些基于机器学习的系统。

我们整理了训练聊天机器人所需的对话数据集,包括问答数据客户支持数据对话数据多语言数据

用于聊天机器人训练的问答数据集

问题-答案数据集:该语料库包括维基百科文章、从中手动生成的事实问题以及这些问题的手动生成的答案,用于学术研究。

WikiQA 语料库:一组公开可用的问题和句子对,为开放域问答研究而收集和注释。为了反映一般用户的真实信息需求,他们使用Bing查询日志作为问题来源。每个问题都链接到可能有答案的维基百科页面。

雅虎语言数据:此页面包含来自雅虎雅虎问答的手动策划的 QA 数据集。

TREC QA Collection:TREC 自 1999 年以来就有了问答轨道。在每个轨道中,任务都被定义为系统要检索包含开放域、封闭类问题答案的小文本片段。

相关文章:

  • 平台工程是 FinOps 的“黄金路径”
  • Linux命令-bind命令(显示或设置键盘按键与其相关的功能)
  • 笔记——asp.net core 中的 REST
  • JMM(Java内存模型)
  • 数据库管理-第146期 最强Oracle监控EMCC深入使用-03(20240206)
  • HTML5和CSS3强化知识总结
  • Hadoop:认识MapReduce
  • vscode配置微信小程序编辑环境 2024/2/10更新
  • 《21天精通IPv4 to IPv6》第16天:IPv6网络的故障排除——如何排除IPv6网络故障? ️
  • unity学习案例总结
  • 23种设计模式概述
  • 【Flink入门修炼】1-1 为什么要学习 Flink?
  • OpenCV/C++:点线面相关计算(二)
  • lua:有关表访问的metamethod
  • 工业制造:分布式控制系统(DCS),一文掌握。
  • 【划重点】MySQL技术内幕:InnoDB存储引擎
  • 【面试系列】之二:关于js原型
  • Angularjs之国际化
  • create-react-app项目添加less配置
  • golang 发送GET和POST示例
  • JS实现简单的MVC模式开发小游戏
  • JS数组方法汇总
  • RedisSerializer之JdkSerializationRedisSerializer分析
  • Redis在Web项目中的应用与实践
  • Web Storage相关
  • Web设计流程优化:网页效果图设计新思路
  • 对话 CTO〡听神策数据 CTO 曹犟描绘数据分析行业的无限可能
  • 分享一个自己写的基于canvas的原生js图片爆炸插件
  • 关于springcloud Gateway中的限流
  • 实现菜单下拉伸展折叠效果demo
  • 首页查询功能的一次实现过程
  • 在GitHub多个账号上使用不同的SSH的配置方法
  • TPG领衔财团投资轻奢珠宝品牌APM Monaco
  • ​LeetCode解法汇总518. 零钱兑换 II
  • #Linux(make工具和makefile文件以及makefile语法)
  • #宝哥教你#查看jquery绑定的事件函数
  • #我与Java虚拟机的故事#连载16:打开Java世界大门的钥匙
  • (42)STM32——LCD显示屏实验笔记
  • (5)STL算法之复制
  • (arch)linux 转换文件编码格式
  • (Redis使用系列) SpirngBoot中关于Redis的值的各种方式的存储与取出 三
  • (阿里巴巴 dubbo,有数据库,可执行 )dubbo zookeeper spring demo
  • (附源码)ssm考生评分系统 毕业设计 071114
  • (附源码)计算机毕业设计SSM保险客户管理系统
  • (三)Hyperledger Fabric 1.1安装部署-chaincode测试
  • (三分钟了解debug)SLAM研究方向-Debug总结
  • (详细版)Vary: Scaling up the Vision Vocabulary for Large Vision-Language Models
  • (转)shell调试方法
  • **PHP二维数组遍历时同时赋值
  • .bat批处理(八):各种形式的变量%0、%i、%%i、var、%var%、!var!的含义和区别
  • .NET 2.0中新增的一些TryGet,TryParse等方法
  • .NET 反射 Reflect
  • .Net调用Java编写的WebServices返回值为Null的解决方法(SoapUI工具测试有返回值)
  • .net开发引用程序集提示没有强名称的解决办法
  • .NET连接MongoDB数据库实例教程