当前位置: 首页 > news >正文

大语言模型微调数据集(2)

CLUE 数据集
CLUE 是一个中文语言理解测评基准,包括分类、命名实体识别和机器阅读理解任务。CLUE中的数据集为JSON格式。对于分类和命名实体识别数据集,我们将JSON格式转换为TSV格式,以便TencentPretrain可以直接加载它们;对于机器阅读理解数据集,我们保留原始格式,并将数据集预处理相关代码放在项目中。

分类:

数据集 链接
TNEWS--------------- https://share.weiyun.com/maExfIeO
CSL--------------- https://share.weiyun.com/LftIGlIT
CMNLI--------------- https://share.weiyun.com/hn3kTeKm
OCNLI --------------- https://share.weiyun.com/wkltwNwg
AFQMC--------------- https://share.weiyun.com/CdlEKMON
IFLYTEK--------------- https://share.weiyun.com/ldiLjnZJ
CLUEWSC2020--------------- https://share.weiyun.com/RLL1ShBi
机器阅读理解:

数据集 链接
CMRC2018--------------- https://share.weiyun.com/KwAbnX60
C3--------------- https://share.weiyun.com/JDpgczdp
ChID--------------- https://share.weiyun.com/8KJE3NOz
命名实体识别:

数据集 链接
CLUENER2020--------------- https://share.weiyun.com/smSMtLkn
百度 ERNIE

相关文章:

  • 水题中的稀奇古怪trick合集
  • 【VTKExamples::PolyData】第二十三期 InterpolateMeshOnGrid
  • SQL 注入 - http头注入之UA头注入探测
  • 海量数据处理商用短链接生成器平台 - 2
  • orin nx 安装paddlespeech记录
  • 2024年-视觉AI检测的面试题目总结
  • Java学习day30:Stream流入门、集合获取流对象、流对象的方法(知识点详解)
  • Vue3编写简单的App组件(二)
  • WebGPU Inter-stage 变量
  • Netty的序列化之MessagePack
  • sql求解连续两个以上的空座位
  • 堪称灾难级攻击的 UDP FLOOD洪水攻击,应该如何防护?
  • 【软件设计师】普及软件知识产权中的商标法与专利法
  • jsp商场会员卡管理系统Myeclipse开发mysql数据库web结构java编程计算机网页项目
  • Redis面试题40
  • [ JavaScript ] 数据结构与算法 —— 链表
  • cookie和session
  • Java IO学习笔记一
  • JavaScript 基础知识 - 入门篇(一)
  • mysql中InnoDB引擎中页的概念
  • node学习系列之简单文件上传
  • 安装python包到指定虚拟环境
  • 将 Measurements 和 Units 应用到物理学
  • 看完九篇字体系列的文章,你还觉得我是在说字体?
  • 力扣(LeetCode)56
  • 如何胜任知名企业的商业数据分析师?
  • 如何邀请好友注册您的网站(模拟百度网盘)
  • 山寨一个 Promise
  • 用Visual Studio开发以太坊智能合约
  • 关于Kubernetes Dashboard漏洞CVE-2018-18264的修复公告
  • ​ ​Redis(五)主从复制:主从模式介绍、配置、拓扑(一主一从结构、一主多从结构、树形主从结构)、原理(复制过程、​​​​​​​数据同步psync)、总结
  • ​LeetCode解法汇总2182. 构造限制重复的字符串
  • #NOIP 2014# day.1 T2 联合权值
  • (1)(1.19) TeraRanger One/EVO测距仪
  • (12)Hive调优——count distinct去重优化
  • (env: Windows,mp,1.06.2308310; lib: 3.2.4) uniapp微信小程序
  • (javascript)再说document.body.scrollTop的使用问题
  • (react踩过的坑)antd 如何同时获取一个select 的value和 label值
  • (附源码)springboot 基于HTML5的个人网页的网站设计与实现 毕业设计 031623
  • (附源码)计算机毕业设计SSM在线影视购票系统
  • (规划)24届春招和25届暑假实习路线准备规划
  • (一)Neo4j下载安装以及初次使用
  • (转)scrum常见工具列表
  • (转)关于pipe()的详细解析
  • ****** 二 ******、软设笔记【数据结构】-KMP算法、树、二叉树
  • .bat批处理(六):替换字符串中匹配的子串
  • .bat批处理(四):路径相关%cd%和%~dp0的区别
  • .NET : 在VS2008中计算代码度量值
  • .net 程序 换成 java,NET程序员如何转行为J2EE之java基础上(9)
  • .NET 程序如何获取图片的宽高(框架自带多种方法的不同性能)
  • .NET/C# 将一个命令行参数字符串转换为命令行参数数组 args
  • .netcore 如何获取系统中所有session_如何把百度推广中获取的线索(基木鱼,电话,百度商桥等)同步到企业微信或者企业CRM等企业营销系统中...
  • .NET微信公众号开发-2.0创建自定义菜单
  • []常用AT命令解释()
  • [145] 二叉树的后序遍历 js