当前位置: 首页 > news >正文

景联文科技打造高质量图文推理问答数据集,赋能大语言模型提升推理能力

大语言模型在处理推理任务时,不同于人类能够反思错误并修正思维路径,当它遇到自身知识盲区时,缺乏自我校正机制,往往导致输出结果不仅无法改善,反而可能变得更不准确。

需要依赖外部的知识库和推理能力来克服其在理解和生成信息时可能出现的幻觉问题,从而提供更为准确和连贯的输出。

景联文科技是一家专业的大语言模型数据服务商,打造图文推理问答数据集,致力于为不同训练阶段的算法精准匹配高质量数据资源。

1000万条图文问答推理描述数据

数据详情:数据集包含1000万张高清带版权图片和对应的1000万条相应的2轮简单的问答推理(一问一答为一轮)。

图片规格:1080P及以上

数据分类:人物、动物、风景、食物、物品、城市、艺术、植物

数据格式:图片数据格式为jpg,标注文件格式为json

数据规模:

  1. 1000万1080p及以上高清图片,1000万条相应的2轮简单的问答推理(一问一答为一轮)。
  2. 所有图片类目及其对应在json文档中的类目,每张图片对应一个json,分布统计如下所示(单位:张)

人物 150万

动物 150万

风景 150万

食物 150万

物品 140万

城市 120万

艺术 70万

植物 70万

图像格式:jpg

标注文档格式:json

标注内容

  1. 图片分类
    对图片进行分类标注,一级类别、二级类别
    2)图片标签
    对图片中存在的元素进行词组描述
    3)图片描述
    对图片的内容呈现进行细化描述

样例

图片:

Json:

{

"分类":"自然景观",

"标签":"山脉,公路,阳光,蓝天,云朵,山谷",

"图片描述":"一条蜿蜒的公路如同一条银色的丝带,在郁郁葱葱的山谷间穿行。两旁的山峦巍峨,

顶部覆盖着稀疏的积雪,山脚下的植被在春日阳光的照耀下渐渐苏醒。天空是一片澄清的蔚蓝,

几朵洁白的云朵悠然地漂浮。阳光透过云层的缝隙,洒在蜿蜒的道路上,仿佛是大自然的指引,邀请旅者进入这个秘境探索。”

}

在数据安全与合规方面,景联文科技已通过ISO9001质量、ISO27001信息安全、ISO27701国际隐私安全管理认证,积极参与8项国家数据交换格式和数据安全标准制定,牢固构筑数据保护的基石。

获取样例请登录景联文科技官网咨询客服。https://www.jinglianwen.com/ai/

或直接发送需求至邮箱:lx@jinglianwen.com

景联文科技|数据采集|数据标注|大语言模型数据集

助力人工智能技术,赋能传统产业智能化转型升级

文章图文著作权归景联文科技所有,商业转载请联系景联文科技获得授权,非商业转载请注明出处。

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • Java内存划分详解:从基础到进阶
  • C++命名空间详细介绍
  • iOS多target时怎么对InfoPlist进行国际化
  • 流程图编辑框架LogicFlow-vue-ts和js
  • spark基于Spark的对招聘信息的分析与设计-计算机毕业设计源码50716
  • 好玩的珠玑妙算-加作弊带概率空间+日志存储240705mindMaster
  • C# IOC容器、依赖注入和控制反转
  • 统信UOS桌面操作系统上删除系统升级后GRUB中的回滚条目与备份
  • kotlin flow collect collectLatest 区别
  • gitee代码初次上传步骤
  • JavaScript(7)——数组
  • 界面控件DevExpress JS ASP.NET Core v24.1 - 全新的分割器组件
  • 网页版五子棋双人小游戏测试报告
  • 【Mac】Charles for Mac(HTTP协议抓包工具)及同类型软件介绍
  • 一、Python 日志系统设计之不同级别的系统日志
  • php的引用
  • 【162天】黑马程序员27天视频学习笔记【Day02-上】
  • Git学习与使用心得(1)—— 初始化
  • IndexedDB
  • JavaScript HTML DOM
  • JavaScript异步流程控制的前世今生
  • MaxCompute访问TableStore(OTS) 数据
  • pdf文件如何在线转换为jpg图片
  • PHP的类修饰符与访问修饰符
  • python docx文档转html页面
  • React组件设计模式(一)
  • Spring声明式事务管理之一:五大属性分析
  • Spring思维导图,让Spring不再难懂(mvc篇)
  • Vue 2.3、2.4 知识点小结
  • Vue.js源码(2):初探List Rendering
  • windows-nginx-https-本地配置
  • 阿里云应用高可用服务公测发布
  • 第三十一到第三十三天:我是精明的小卖家(一)
  • 高程读书笔记 第六章 面向对象程序设计
  • 个人博客开发系列:评论功能之GitHub账号OAuth授权
  • 入门级的git使用指北
  • 手写双向链表LinkedList的几个常用功能
  • 首页查询功能的一次实现过程
  • 一个完整Java Web项目背后的密码
  • RDS-Mysql 物理备份恢复到本地数据库上
  • ​卜东波研究员:高观点下的少儿计算思维
  • # Kafka_深入探秘者(2):kafka 生产者
  • # linux 中使用 visudo 命令,怎么保存退出?
  • #前后端分离# 头条发布系统
  • (done) ROC曲线 和 AUC值 分别是什么?
  • (floyd+补集) poj 3275
  • (pojstep1.1.2)2654(直叙式模拟)
  • (ZT)薛涌:谈贫说富
  • (安全基本功)磁盘MBR,分区表,活动分区,引导扇区。。。详解与区别
  • (附源码)计算机毕业设计SSM在线影视购票系统
  • (含笔试题)深度解析数据在内存中的存储
  • (离散数学)逻辑连接词
  • (篇九)MySQL常用内置函数
  • (一)Docker基本介绍
  • (转) SpringBoot:使用spring-boot-devtools进行热部署以及不生效的问题解决